[发明专利]基于圆形麦克风阵列的智能交互方法及系统有效
申请号: | 201510246315.9 | 申请日: | 2015-05-14 |
公开(公告)号: | CN104936091B | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 李明子;王东;徐东阳;王海坤;马峰;曹圣红;王智国;胡郁;刘庆峰 | 申请(专利权)人: | 讯飞智元信息科技有限公司 |
主分类号: | H04R3/00 | 分类号: | H04R3/00 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 党丽;江怀勤 |
地址: | 230088 安徽省合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于圆形麦克风阵列的智能交互方法及系统,该方法包括:通过圆形麦克风阵列接收用户语音信号;对所述语音信号进行去噪处理,得到去噪后的语音信号;对去噪后的不同波束方向的语音信号进行预识别,并选择识别得分最高的语音信号的波束方向作为目标说话人方向,后续对在所述目标说话人方向上去噪后的语音信号进行语音识别,得到语音识别结果;根据所述语音识别结果执行操作。利用本发明,可以有效提高麦克风阵列波束输出的语音信号的信噪比,进而提高语音识别效果,使人机交互更智能。 1 | ||
搜索关键词: | 语音信号 圆形麦克风 去噪 语音识别结果 波束方向 语音识别 智能交互 用户语音信号 麦克风阵列 波束输出 阵列接收 信噪比 智能 | ||
通过圆形麦克风阵列接收用户语音信号;
对所述语音信号进行去噪处理,得到去噪后的语音信号;
对去噪后的不同波束方向的语音信号进行预识别,并选择识别得分最高的语音信号的波束方向作为目标说话人方向,对后续在所述目标说话人方向上去噪后的语音信号进行语音识别,得到语音识别结果,所述预识别包括:语音识别和/或声纹识别;
根据所述语音识别结果执行操作。
2.根据权利要求1所述的方法,其特征在于,所述对所述语音信号进行去噪处理,得到去噪后的语音信号包括:将所述语音信号转换为频域信号;
计算所述频域信号的优化参数,所述优化参数包括:指向性参数和白噪声增益,所述指向性参数是指期望信号相对于全向噪声的输入信噪比和麦克风的输入信噪比的比值,所述白噪声增益是指所述圆形麦克风阵列输出信噪比与输入信噪比的比值;
根据所述优化参数对所述频域信号进行优化,得到去噪后的语音信号。
3.根据权利要求2所述的方法,其特征在于,所述根据所述优化参数对所述频域信号进行优化还包括:在根据所述优化参数对所述频域信号进行优化时,对期望方向以外的其它方向波束陷零。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:从去噪后的语音信号的波束中选择能量大于设定阈值的波束作为优选波束;
所述对去噪后的不同波束方向的语音信号进行预识别包括:
对所述优选波束方向的语音信号进行预识别。
5.根据权利要求4所述的方法,其特征在于,所述对所述优选波束方向的语音信号进行预识别包括:对所述优选波束方向的语音信号进行语音识别和/或声纹识别,得到特定命令词和/或特定说话人。
6.根据权利要求4所述的方法,其特征在于,所述对所述优选波束方向的语音信号进行预识别包括:对所述优选波束方向的语音信号进行语音识别,得到语音识别结果。
7.一种基于圆形麦克风阵列的智能交互系统,其特征在于,包括:接收模块,用于通过圆形麦克风阵列接收用户语音信号;
去噪模块,用于对所述语音信号进行去噪处理,得到去噪后的语音信号;
识别模块,用于对去噪后的不同波束方向的语音信号进行预识别,并选择识别得分最高的语音信号的波束方向作为目标说话人方向,对后续在所述目标说话人方向上去噪后的语音信号进行语音识别,得到语音识别结果,所述预识别包括:语音识别和/或声纹识别;
交互处理模块,用于根据所述识别模块的语音识别结果执行操作。
8.根据权利要求7所述的系统,其特征在于,所述去噪模块包括:信号转换单元,用于将所述语音信号转换为频域信号;
计算单元,用于计算所述频域信号的优化参数,所述优化参数包括:指向性参数和白噪声增益,所述指向性参数是指期望信号相对于全向噪声的输入信噪比和麦克风的输入信噪比的比值,所述白噪声增益是指所述圆形麦克风阵列输出信噪比与输入信噪比的比值;
第一优化单元,用于根据所述优化参数对所述频域信号进行优化,得到去噪后的语音信号。
9.根据权利要求8所述的系统,其特征在于,所述去噪模块还包括:第二优化单元,用于在所述第一优化单元根据所述优化参数对所述频域信号进行优化时,对期望方向以外的其它方向波束陷零。
10.根据权利要求7至9任一项所述的系统,其特征在于,所述系统还包括:筛选模块,用于从去噪后的语音信号的波束中选择能量大于设定阈值的波束作为优选波束;
所述识别模块,具体用于对所述优选波束方向的语音信号进行预识别,以确定目标说话人方向。
11.根据权利要求10所述的系统,其特征在于,所述识别模块,具体用于对所述优选波束方向的语音信号进行语音识别,在识别到特定命令词后,选择识别得分最高的语音信号的波束方向作为目标说话人方向,并对后续在所述目标说话人方向上去噪后的语音信号进行语音识别,得到语音识别结果。
12.根据权利要求10所述的系统,其特征在于,所述识别模块包括:声纹识别单元和语音识别单元;所述声纹识别单元对所述优选波束方向的语音信号进行声纹识别,得到特定说话人,并选择识别得分最高的语音信号的波束方向作为目标说话人方向,并触发所述语音识别单元对后续在所述目标说话人方向上去噪后的语音信号进行语音识别,得到语音识别结果。13.根据权利要求10所述的系统,其特征在于,所述识别模块,具体用于对所述优选波束方向的语音信号进行语音识别,在得到语音识别结果后,选择识别得分最高的语音信号的波束方向作为目标说话人方向,并对后续在所述目标说话人方向上去噪后的语音信号进行语音识别,得到后续语音信号的语音识别结果。
14.根据权利要求7至9任一项所述的系统,其特征在于,所述圆形麦克风阵列中的多个麦克风为均匀分布或非均匀分布。15.根据权利要求7至9任一项所述的系统,其特征在于,所述圆形麦克风阵列的中心还设有一个麦克风。该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于讯飞智元信息科技有限公司,未经讯飞智元信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510246315.9/,转载请声明来源钻瓜专利网。
- 上一篇:音乐振动装置
- 下一篇:基于光感断电式环保节能耳机