[发明专利]一种远距离拾音方法有效

专利信息
申请号: 201810017174.7 申请日: 2018-01-08
公开(公告)号: CN108109617B 公开(公告)日: 2020-12-15
发明(设计)人: 黃智;梁炎伟 申请(专利权)人: 深圳市声菲特科技技术有限公司
主分类号: G10L15/20 分类号: G10L15/20;G10L15/02;G10L15/065
代理公司: 深圳市凯达知识产权事务所 44256 代理人: 王琦
地址: 518000 广东省深圳市宝安*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于语音识别技术领域,公开了一种远距离拾音方法,包括以下步骤:由多个麦克风组成的麦克风阵列拾取环境声音,得到与麦克风个数对应的多路声音信号;各路的声音信号分别经过LMS自适应滤波处理,得到各路信号的到达时间差对声源进行定位,以及识别出各路信号的语音特征;将声源定位结果以及各路的语音特征进行ABF‑自适应波束形成处理,再把所有的信号叠加,提高输出语音信号的信噪比,将叠加后的信号作为目标源的声音输出。本发明能够实现准确拾取目标源的声音。
搜索关键词: 一种 远距离 方法
【主权项】:
1.一种远距离拾音方法,其特征在于,包括以下步骤:101、由多个麦克风组成的麦克风阵列拾取环境声音,得到与麦克风个数对应的多路声音信号,每路声音信号包括回声信号、混响信号、目标源信号、噪声信号和干扰信号;102、各路的声音信号分别经过LMS自适应滤波处理,将两个相邻麦克风信号作为目标信号和输入信号,用输入信号去逼近目标信号,通过LMS调整滤波器系数得到各路信号的到达时间差对声源进行定位,以及识别出各路信号的语音特征;利用到达时间差确定目标声源的位置,具体包括:在一路信号中,对信号进行预加重、分帧、加窗处理,分帧长度为10--30ms,经过FFT处理,将各路信号进行合并,然后进行语音活动检测VAD,计算权函数、加权、多帧平滑处理、互相关函数、插值处理、峰值检测,然后对声源进行定位;识别出各路信号的语音特征,具体包括:在一路信号中,对信号进行预加重、分帧、加窗处理,分帧长度为10--30ms,经过FFT处理;经过FFT处理后的信号经过声谱图分析,基音、音色分析,共振峰提取语音特征,经倒谱法、谱包络法进行运算,识别出该路信号中的第一动态特征;经过FFT处理后的信号经过取绝对值或平方值处理,Mel滤波,然后取对数,进行DCT转换,识别出该路信号中的第二动态特征;如果第一动态特征与第二动态特征一致,则将动态特征作为语音特征输出,如果不一致,则不输出语音特征,返回重新处理;103、将声源定位结果以及各路的语音特征进行ABF-自适应波束形成处理,自动地迭代调节自身的滤波器参数,把不同相位的信号调整为相同的相位的信号后,再把所有的信号叠加,提高输出语音信号的信噪比,将叠加后的信号作为目标源的声音输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市声菲特科技技术有限公司,未经深圳市声菲特科技技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810017174.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top