[发明专利]一种远距离拾音方法有效
申请号: | 201810017174.7 | 申请日: | 2018-01-08 |
公开(公告)号: | CN108109617B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 黃智;梁炎伟 | 申请(专利权)人: | 深圳市声菲特科技技术有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/02;G10L15/065 |
代理公司: | 深圳市凯达知识产权事务所 44256 | 代理人: | 王琦 |
地址: | 518000 广东省深圳市宝安*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于语音识别技术领域,公开了一种远距离拾音方法,包括以下步骤:由多个麦克风组成的麦克风阵列拾取环境声音,得到与麦克风个数对应的多路声音信号;各路的声音信号分别经过LMS自适应滤波处理,得到各路信号的到达时间差对声源进行定位,以及识别出各路信号的语音特征;将声源定位结果以及各路的语音特征进行ABF‑自适应波束形成处理,再把所有的信号叠加,提高输出语音信号的信噪比,将叠加后的信号作为目标源的声音输出。本发明能够实现准确拾取目标源的声音。 | ||
搜索关键词: | 一种 远距离 方法 | ||
【主权项】:
1.一种远距离拾音方法,其特征在于,包括以下步骤:101、由多个麦克风组成的麦克风阵列拾取环境声音,得到与麦克风个数对应的多路声音信号,每路声音信号包括回声信号、混响信号、目标源信号、噪声信号和干扰信号;102、各路的声音信号分别经过LMS自适应滤波处理,将两个相邻麦克风信号作为目标信号和输入信号,用输入信号去逼近目标信号,通过LMS调整滤波器系数得到各路信号的到达时间差对声源进行定位,以及识别出各路信号的语音特征;利用到达时间差确定目标声源的位置,具体包括:在一路信号中,对信号进行预加重、分帧、加窗处理,分帧长度为10--30ms,经过FFT处理,将各路信号进行合并,然后进行语音活动检测VAD,计算权函数、加权、多帧平滑处理、互相关函数、插值处理、峰值检测,然后对声源进行定位;识别出各路信号的语音特征,具体包括:在一路信号中,对信号进行预加重、分帧、加窗处理,分帧长度为10--30ms,经过FFT处理;经过FFT处理后的信号经过声谱图分析,基音、音色分析,共振峰提取语音特征,经倒谱法、谱包络法进行运算,识别出该路信号中的第一动态特征;经过FFT处理后的信号经过取绝对值或平方值处理,Mel滤波,然后取对数,进行DCT转换,识别出该路信号中的第二动态特征;如果第一动态特征与第二动态特征一致,则将动态特征作为语音特征输出,如果不一致,则不输出语音特征,返回重新处理;103、将声源定位结果以及各路的语音特征进行ABF-自适应波束形成处理,自动地迭代调节自身的滤波器参数,把不同相位的信号调整为相同的相位的信号后,再把所有的信号叠加,提高输出语音信号的信噪比,将叠加后的信号作为目标源的声音输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市声菲特科技技术有限公司,未经深圳市声菲特科技技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810017174.7/,转载请声明来源钻瓜专利网。
- 上一篇:信息处理方法、信息处理装置以及程序
- 下一篇:语音交互方法、系统以及终端设备