[发明专利]用于音视频会议的实时语音活动检测方法及系统在审
申请号: | 202111482058.0 | 申请日: | 2021-12-06 |
公开(公告)号: | CN114049887A | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 卓越;辛鑫 | 申请(专利权)人: | 苏州蛙声科技有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/02;G10L15/06;H04L65/403;H04N7/15;G06F17/14;G06N3/04;G06N3/08 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 李柏柏 |
地址: | 215000 江苏省苏州市工业*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种用于音视频会议的实时语音活动检测方法,包括获取实时会议场景中的待检测的语音样本,其中语音样本包括纯净数据以及噪音数据;对待检测的语音样本进行特征提取,获得语音样本的LogFbank特征;将LogFbank特征输入至神经网络模型进行训练,获得语音检测模型,其中神经网络模型为组合模型;利用语音检测模型对从实时会议中采集到的待检测语音进行语音检测,获得待检测语音的类别。本发明提取语音的LogFbank特征用于神经网络模型训练以及检测,其计算量更小,并且LogFbank特征带有的信息量更大,其训练效果以及检测效果均较好,更加适用于实时会议场景。 | ||
搜索关键词: | 用于 视频会议 实时 语音 活动 检测 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州蛙声科技有限公司,未经苏州蛙声科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111482058.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种金属管件户外焊接用辅助支架
- 下一篇:一种引导空气流向的消毒装置