[实用新型]自校准的远场语音交互设备有效
申请号: | 201621197888.3 | 申请日: | 2016-11-04 |
公开(公告)号: | CN206489876U | 公开(公告)日: | 2017-09-12 |
发明(设计)人: | 陈日林;冯大航;陈孝良;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0316 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 任岩 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 校准 语音 交互 设备 | ||
技术领域
本实用新型总体上涉及语音处理技术领域,尤其涉及自校准的远场语音交互设备。
背景技术
麦克风阵列技术近几十年来受到了研究者的广泛关注,特别是最近几年来,
受到人工智能繁荣发展的驱动,远场语音识别技术得到更大的关注,对作为远场语音识别前端的麦克风阵列技术提出了更大的要求。目前针对远场语音识别的主要方法包括MVDR(Minimum Variance DistortionlessResponse,最小方差无畸变响应)和多通道维纳滤波方法,不管哪一种方法都是进行了远场假设,通常认为通道到达每个麦克风的幅度一致,只是声波到达时间不同,但实际中通常不同通道麦克风增益不同,同时由于距离衰减等因素造成幅度差异,因此需要对麦克风增益及信号幅度衰减进行补偿,才能保证算法性能。同时上述算法都需要明确麦克风的准确位置,大量方法与研究也是基于麦克风准确位置设计的,并且所有麦克风都能正常工作,极端情况下,一旦麦克风无法正常录音工作,将导致算法性能急剧下降,在实际产品应用中,麦克风位置通常是已知的,但在使用过程中很难保证其中的某个麦克风发生问题,无法正常录音,这种情形下需要剔除问题麦克风,此时原有的麦克风位置信息需要更新,为保证阵列算法仍然能够正常工作,此时需要校准确定正常麦克风阵列构成的新麦克风阵列及其相关信息。
现有技术对麦克风信号的校准,通常采用大型校准设备在专用的实验室内完成,非常费时费力,并不适用于消费电子。例如,现有技术一(CN200810213962,一种麦克风阵列及麦克风阵列校准的方法和模块)采用静默期的背景噪声作为校准声源,计算不同通道的增益,调整不同通道到相同增益。该技术方案采用静默期的相干性较低的背景噪声作为校准 声源,麦克风接收信号的信噪比较低,校准误差较大,同时只考虑麦克风自身的增益,没有考虑传播衰减等造成的幅度误差,特别对于远场情形下,各麦克风的语音信号之间仍然存在较大幅度误差,不适合于麦克风阵列信号处理。
现有技术二“Robust speech recognition using beamforming with adaptivemicrophone gains and multichannel noise reduction”采用语音段信号作为校准声源,计算不同通道的增益。该技术方案一方面在增益计算中没有剔出噪声的影响,噪声增益计算不准确,另一方面对于极端情况,即麦克风损坏无法正常工作的情形下,针对麦克风阵列没有提出解决方案。
实用新型内容
(一)要解决的技术问题
本实用新型提供了一种自校准的远场语音交互设备。
(二)技术方案
本实用新型提供了一种自校准的远场语音交互设备,包括:麦克风阵列与自校准和语音识别终端,所述麦克风阵列与所述自校准和语音识别终端电性连接;所述麦克风阵列采集远场语音信号,并将所述远场语音信号传输至所述自校准和语音识别终端,其中,所述远场语音信号包含由麦克风通道增益和信号传播衰减引起的误差;所述自校准和语音识别终端对所述误差进行校准,得到增强语音输出。
优选地,远场语音交互设备还包括控制端,所述控制端为手机。
优选地,所述自校准和语音识别终端为计算机或服务器。
优选地,所述自校准和语音识别终端包括:自校准模块和广义旁瓣对消器,所述麦克风阵列连接自校准模块,所述自校准模块连接所述广义旁瓣对消器,其中,所述自校准模块对所述误差进行校准,校准后的远场语音信号传输至所述广义旁瓣对消器;所述广义旁瓣对消器对校准后的远场语音信号进行处理,得到增强语音输出。
优选地,所述自校准模块包括:语音活动检测模块、相对增益计算模块和增益校准模块;其中,所述语音活动检测模块选取麦克风阵列的一个麦克风作为参考通道,利用所述参考通道提取远场语音信号中的语音段;所述相对增益计算模块连接所述语音活动检测模块,利用所述语音段计算 麦克风阵列中的其他麦克风相对于所述参考通道的相对增益;所述增益校准模块连接所述相对增益计算模块,根据所述相对增益,将其他麦克风的语音段调整到参考通道的增益水平,得到校准后的远场语音信号。
优选地,所述广义旁瓣对消器包括:固定波束形成模块、阻塞矩阵模块、自适应噪声抵消模块;其中,校准后的远场语音信号分别进入固定波束形成模块和阻塞矩阵模块;固定波束形成模块对校准后的远场语音信号进行处理,生成语音参考信号;阻塞矩阵模块对校准后的远场语音信号进行处理,生成噪声参考信号,语音参考信号与经过自适应噪声抵消模块的噪声参考信号求差,得到增强语音输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201621197888.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:油桶(ATF‑AW6SP)
- 下一篇:一种防爆型电力电容器结构