[发明专利]一种红外触发的远场双麦远场语音识别方法有效

申请号：	201910289037.3	申请日：	2019-04-11
公开（公告）号：	CN110012331B	公开（公告）日：	2021-05-25
发明（设计）人：	杨洋;姚嘉;高永泽;任金平	申请（专利权）人：	杭州微纳科技股份有限公司
主分类号：	H04N21/422	分类号：	H04N21/422;G10L25/45;G10L21/0216;G10L21/0208;G10L15/26;G10L15/22
代理公司：	北京云科知识产权代理事务所(特殊普通合伙) 11483	代理人：	张飙
地址：	310013 浙江省杭州***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种红外触发的远场双麦远场语音识别方法，通过前置后置双麦克的方式，从硬件上限制两路麦克的拾音方向，前置麦克拾取的语音强度大，背景噪声相对小，而后置麦克拾取的语音相对小，背景噪声相对大，而且不会包含喷麦噪声。同时，软件算法利用硬件麦克拾音的差异在背景噪声的抑制上采用了频域相关性函数计算频域增益的方式，在喷麦噪声上采用了前置麦克检测加后置麦克补偿的方式，很好的解决单颗麦克风上无法规避的问题。
搜索关键词：	一种红外触发远场双麦远场语音识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种红外触发的远场双麦远场语音识别方法，其特征在于：该方法的具体为：1)在电视端设置两颗麦克风拾音装置，通过两颗麦克风拾音装置实时采集语音数据；2)使用电视遥控器的红外语音按键，控制电视端启动两颗麦克风拾音装置，然后进入语音识别状态，此时两颗麦克风拾音装置同时采集语音数据，分别获取时域语音数据T1和T2；3)对T1和T2进行延迟相加和延迟相减，获得主信号增强T_ADD和参考噪声T_SUB的时域语音数据；4)对主信号增强T_ADD和参考噪声T_SUB的时域语音数据采用递归拼接方法进行噪声估计，获得主信号和参考噪声能量的比值OMAGA；5)当主信号和参考噪声能量比小于OMEGA_low时，干扰噪声强，语音不存在；当主信号参考噪声能量比大于OMEGA_high时，主信号强，语音存在；6)当检测到语音存在，采用增益函数对前置麦克风的频域语音数据进行增益调整，获得降噪后的主信号麦克风的频域语音数据；并最终输出降噪后的时域语音数据。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州微纳科技股份有限公司，未经杭州微纳科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910289037.3/，转载请声明来源钻瓜专利网。

上一篇：一种人机交互技术方法和装置及其制造方法
下一篇：一种基于宽色域高动态范围HDR技术的物理10Bit信息采集播放系统

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N21-00 可选的内容分发，例如交互式电视，VOD〔视频点播〕
H04N21-20 .专门适用于内容分发的专用服务器，例如：VOD服务器；其操作
H04N21-40 .专门适用于接收内容或者与内容交互的客户端设备，如STB[机顶盒]；相关操作
H04N21-60 .用于在服务器和客户端之间或者在远程客户端之间的视频分配的网络结构或者处理
H04N21-80 .通过内容产生器独立于分配过程实现的内容或附加数据的生成或处理；内容本身
H04N21-81 ..其单媒体部件

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种红外触发的远场双麦远场语音识别方法有效

专利文献下载