[发明专利]一种自适应语音活动检测方法有效
申请号: | 201710694057.X | 申请日: | 2017-08-15 |
公开(公告)号: | CN107331393B | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 何云鹏;张来;高君效;许兵 | 申请(专利权)人: | 成都启英泰伦科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L25/45;G10L25/78 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及语音信号处理领域,特别是涉及到一种基于时域和频域特征提取的混合三门限的自适应语音活动检测方法,本发明通过对语音系统里的语音是否在活动进行检测,来控制设备的工作状态,当语音不活动的时候,设备可以处于低功耗或者挂起状态,从而能够降低设备运算要求和功耗同时对于语音通信设备来讲,降低通信带宽。 | ||
搜索关键词: | 一种 自适应 语音 活动 检测 方法 | ||
【主权项】:
一种自适应语音活动检测方法,其包括以下步骤:步骤一 进行时域信号分割,根据设定的帧长时间和帧移时间,将一长段所述时域信号分割成一帧一帧的单帧时域信号;步骤二 使用汉明窗对所述单帧时域信号进行加窗处理,在单帧频域范围内对所述单帧时域信号进行快速傅立叶变换,得到所述单帧时域信号的单帧频域信息;步骤三 使用迭代更新噪音估计计算,再对比所述单帧频域信息的频带和噪音估计的频带得到信噪比,同时计算增长函数特征;步骤四 计算所述单帧频域信息的所有的频带与上一帧对应频带的差值的平方和得到谱通量;步骤五 根据快速傅立叶变换之前的所述时域数据,进行能量的操作符特征的提取;步骤六 对所述增长函数特性、谱通量及能量的操作符特征进行编号,分别用 QUOTE、 QUOTE、 QUOTE表示;步骤七 对比所述增长函数特性与门槛一得到对比结果一,对比所述谱通量与门槛二得到对比结果二,对比能量的操纵符特征与门槛三得到对比结果三,将所述对比结果一、对比结果二和对比结果三进行综合,得到所述单帧频域信息的语音活动信息;步骤八 根据所述语音活动信息更新所述门槛一、门槛二和门槛三;步骤九 延展所述对比结果一、对比结果二和对比结果三,获得新的对比结果一、对比结果二和对比结果三。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都启英泰伦科技有限公司,未经成都启英泰伦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710694057.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种骚扰电话的识别与拦截方法
- 下一篇:输出数字的方法及装置