[发明专利]基于圆形麦克风阵列的智能交互方法及系统有效

申请号：	201510246315.9	申请日：	2015-05-14
公开（公告）号：	CN104936091B	公开（公告）日：	2018-06-15
发明（设计）人：	李明子;王东;徐东阳;王海坤;马峰;曹圣红;王智国;胡郁;刘庆峰	申请（专利权）人：	讯飞智元信息科技有限公司
主分类号：	H04R3/00	分类号：	H04R3/00
代理公司：	北京维澳专利代理有限公司 11252	代理人：	党丽;江怀勤
地址：	230088 安徽省合肥市高***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于圆形麦克风阵列的智能交互方法及系统，该方法包括：通过圆形麦克风阵列接收用户语音信号；对所述语音信号进行去噪处理，得到去噪后的语音信号；对去噪后的不同波束方向的语音信号进行预识别，并选择识别得分最高的语音信号的波束方向作为目标说话人方向，后续对在所述目标说话人方向上去噪后的语音信号进行语音识别，得到语音识别结果；根据所述语音识别结果执行操作。利用本发明，可以有效提高麦克风阵列波束输出的语音信号的信噪比，进而提高语音识别效果，使人机交互更智能。 1
搜索关键词：	语音信号圆形麦克风去噪语音识别结果波束方向语音识别智能交互用户语音信号麦克风阵列波束输出阵列接收信噪比智能
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于圆形麦克风阵列的智能交互方法，其特征在于，包括：

通过圆形麦克风阵列接收用户语音信号；

对所述语音信号进行去噪处理，得到去噪后的语音信号；

对去噪后的不同波束方向的语音信号进行预识别，并选择识别得分最高的语音信号的波束方向作为目标说话人方向，对后续在所述目标说话人方向上去噪后的语音信号进行语音识别，得到语音识别结果，所述预识别包括：语音识别和/或声纹识别；

根据所述语音识别结果执行操作。

2.根据权利要求1所述的方法，其特征在于，所述对所述语音信号进行去噪处理，得到去噪后的语音信号包括：

将所述语音信号转换为频域信号；

计算所述频域信号的优化参数，所述优化参数包括：指向性参数和白噪声增益，所述指向性参数是指期望信号相对于全向噪声的输入信噪比和麦克风的输入信噪比的比值，所述白噪声增益是指所述圆形麦克风阵列输出信噪比与输入信噪比的比值；

根据所述优化参数对所述频域信号进行优化，得到去噪后的语音信号。

3.根据权利要求2所述的方法，其特征在于，所述根据所述优化参数对所述频域信号进行优化还包括：

在根据所述优化参数对所述频域信号进行优化时，对期望方向以外的其它方向波束陷零。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述方法还包括：

从去噪后的语音信号的波束中选择能量大于设定阈值的波束作为优选波束；

所述对去噪后的不同波束方向的语音信号进行预识别包括：

对所述优选波束方向的语音信号进行预识别。

5.根据权利要求4所述的方法，其特征在于，所述对所述优选波束方向的语音信号进行预识别包括：

对所述优选波束方向的语音信号进行语音识别和/或声纹识别，得到特定命令词和/或特定说话人。

6.根据权利要求4所述的方法，其特征在于，所述对所述优选波束方向的语音信号进行预识别包括：

对所述优选波束方向的语音信号进行语音识别，得到语音识别结果。

7.一种基于圆形麦克风阵列的智能交互系统，其特征在于，包括：

接收模块，用于通过圆形麦克风阵列接收用户语音信号；

去噪模块，用于对所述语音信号进行去噪处理，得到去噪后的语音信号；

识别模块，用于对去噪后的不同波束方向的语音信号进行预识别，并选择识别得分最高的语音信号的波束方向作为目标说话人方向，对后续在所述目标说话人方向上去噪后的语音信号进行语音识别，得到语音识别结果，所述预识别包括：语音识别和/或声纹识别；

交互处理模块，用于根据所述识别模块的语音识别结果执行操作。

8.根据权利要求7所述的系统，其特征在于，所述去噪模块包括：

信号转换单元，用于将所述语音信号转换为频域信号；

计算单元，用于计算所述频域信号的优化参数，所述优化参数包括：指向性参数和白噪声增益，所述指向性参数是指期望信号相对于全向噪声的输入信噪比和麦克风的输入信噪比的比值，所述白噪声增益是指所述圆形麦克风阵列输出信噪比与输入信噪比的比值；

第一优化单元，用于根据所述优化参数对所述频域信号进行优化，得到去噪后的语音信号。

9.根据权利要求8所述的系统，其特征在于，所述去噪模块还包括：

第二优化单元，用于在所述第一优化单元根据所述优化参数对所述频域信号进行优化时，对期望方向以外的其它方向波束陷零。

10.根据权利要求7至9任一项所述的系统，其特征在于，所述系统还包括：

筛选模块，用于从去噪后的语音信号的波束中选择能量大于设定阈值的波束作为优选波束；

所述识别模块，具体用于对所述优选波束方向的语音信号进行预识别，以确定目标说话人方向。

11.根据权利要求10所述的系统，其特征在于，

所述识别模块，具体用于对所述优选波束方向的语音信号进行语音识别，在识别到特定命令词后，选择识别得分最高的语音信号的波束方向作为目标说话人方向，并对后续在所述目标说话人方向上去噪后的语音信号进行语音识别，得到语音识别结果。

12.根据权利要求10所述的系统，其特征在于，所述识别模块包括：声纹识别单元和语音识别单元；所述声纹识别单元对所述优选波束方向的语音信号进行声纹识别，得到特定说话人，并选择识别得分最高的语音信号的波束方向作为目标说话人方向，并触发所述语音识别单元对后续在所述目标说话人方向上去噪后的语音信号进行语音识别，得到语音识别结果。

13.根据权利要求10所述的系统，其特征在于，

所述识别模块，具体用于对所述优选波束方向的语音信号进行语音识别，在得到语音识别结果后，选择识别得分最高的语音信号的波束方向作为目标说话人方向，并对后续在所述目标说话人方向上去噪后的语音信号进行语音识别，得到后续语音信号的语音识别结果。

14.根据权利要求7至9任一项所述的系统，其特征在于，所述圆形麦克风阵列中的多个麦克风为均匀分布或非均匀分布。

15.根据权利要求7至9任一项所述的系统，其特征在于，所述圆形麦克风阵列的中心还设有一个麦克风。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于讯飞智元信息科技有限公司，未经讯飞智元信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510246315.9/，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04R 扬声器、传声器、唱机拾音器或其他声—机电传感器；助听器；扩音系统
H04R3-00 用于传感器的电路
H04R3-02 .用于防止声反馈
H04R3-04 .用于校正频率响应
H04R3-12 .用于向两个或两个以上的扬声器分配信号
H04R3-14 ..交叉网络
H04R3-06 ..静电传感器的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于圆形麦克风阵列的智能交互方法及系统有效

专利文献下载