[发明专利]一种红外触发的远场双麦远场语音识别方法有效
申请号: | 201910289037.3 | 申请日: | 2019-04-11 |
公开(公告)号: | CN110012331B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 杨洋;姚嘉;高永泽;任金平 | 申请(专利权)人: | 杭州微纳科技股份有限公司 |
主分类号: | H04N21/422 | 分类号: | H04N21/422;G10L25/45;G10L21/0216;G10L21/0208;G10L15/26;G10L15/22 |
代理公司: | 北京云科知识产权代理事务所(特殊普通合伙) 11483 | 代理人: | 张飙 |
地址: | 310013 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种红外触发的远场双麦远场语音识别方法,通过前置后置双麦克的方式,从硬件上限制两路麦克的拾音方向,前置麦克拾取的语音强度大,背景噪声相对小,而后置麦克拾取的语音相对小,背景噪声相对大,而且不会包含喷麦噪声。同时,软件算法利用硬件麦克拾音的差异在背景噪声的抑制上采用了频域相关性函数计算频域增益的方式,在喷麦噪声上采用了前置麦克检测加后置麦克补偿的方式,很好的解决单颗麦克风上无法规避的问题。 | ||
搜索关键词: | 一种 红外 触发 远场双麦远场 语音 识别 方法 | ||
【主权项】:
1.一种红外触发的远场双麦远场语音识别方法,其特征在于:该方法的具体为:1)在电视端设置两颗麦克风拾音装置,通过两颗麦克风拾音装置实时采集语音数据;2)使用电视遥控器的红外语音按键,控制电视端启动两颗麦克风拾音装置,然后进入语音识别状态,此时两颗麦克风拾音装置同时采集语音数据,分别获取时域语音数据T1和T2;3)对T1和T2进行延迟相加和延迟相减,获得主信号增强T_ADD和参考噪声T_SUB的时域语音数据;4)对主信号增强T_ADD和参考噪声T_SUB的时域语音数据采用递归拼接方法进行噪声估计,获得主信号和参考噪声能量的比值OMAGA;5)当主信号和参考噪声能量比小于OMEGAlow时,干扰噪声强,语音不存在;当主信号参考噪声能量比大于OMEGAhigh时,主信号强,语音存在;6)当检测到语音存在,采用增益函数对前置麦克风的频域语音数据进行增益调整,获得降噪后的主信号麦克风的频域语音数据;并最终输出降噪后的时域语音数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州微纳科技股份有限公司,未经杭州微纳科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910289037.3/,转载请声明来源钻瓜专利网。