[发明专利]多音区语音识别方法、装置及存储介质在审
申请号: | 202110970147.3 | 申请日: | 2018-09-29 |
公开(公告)号: | CN113658588A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 欧阳能钧;梁启仍;宋晔 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/26;G10L21/0216;G10L21/0272 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 王云红;贾慧娜 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多音 语音 识别 方法 装置 存储 介质 | ||
1.一种多音区语音识别方法,其特征在于,包括:
使用麦克风模组收集语音采集环境中的语音,其中,预先为所述麦克风模组中的每个麦克风设置目标音区,所述目标音区是预先设定的所述语音采集环境中的多个独立音区中的一个;判断所述语音是否来自目标音区;
对来自除所述目标音区之外的其他音区的语音进行抑制;
接收来自所述麦克风模组中的多个麦克风的抑制后的语音;
从所述多个麦克风的目标音区中选择一个独立音区进行语音识别。
2.根据权利要求1所述的方法,其特征在于,从所述多个麦克风的目标音区中选择一个独立音区进行语音识别,包括:
识别所述多个麦克风的目标音区中是否有某个独立音区的语音中出现唤醒词;
若识别出某个独立音区的语音中出现唤醒词,则选择出现唤醒词的独立音区作为识别音区,对所述识别音区的语音进行语音识别。
3.根据权利要求2所述的方法,其特征在于,对所述识别音区的语音进行语音识别之后,还包括:
判断所述识别音区的识别过程是否结束;
若所述识别音区的识别过程已经结束,则重新从所述多个麦克风的目标音区中选择一个独立音区进行语音识别。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述语音采集环境包括车载环境;所述麦克风模组包括布置于前排顶灯位置的第一麦克风模组和布置于后排扶手箱出风口位置的第二麦克风模组,或者所述麦克风模组包括布置于前排顶灯位置的第一麦克风模组和布置于后排天窗边缘位置的第三麦克风模组。
5.根据权利要求4所述的方法,其特征在于,对抑制后的语音进行识别之前,还包括:
接收来自车机系统的所述抑制后的语音,其中,所述抑制后的语音是由所述麦克风模组通过音频总线传输给所述车机系统的。
6.根据权利要求5所述的方法,其特征在于,还包括:
设置所述车机系统的时分传输机制的队列排布方式,以适于传输所述抑制后的语音。
7.根据权利要求1-3中任一项所述的方法,其特征在于,对抑制后的语音进行识别之后,还包括:
根据语音识别的结果产生对所述抑制后的语音的响应信息;
展示所述语音识别的结果及所述响应信息。
8.一种多音区语音识别装置,其特征在于,包括:
语音采集单元,用于使用麦克风模组收集语音采集环境中的语音,其中,预先为所述麦克风模组中的每个麦克风设置目标音区,所述目标音区是预先设定的所述语音采集环境中的多个独立音区中的一个;
判断单元,用于判断所述语音是否来自目标音区;
抑制单元,用于对来自除所述目标音区之外的其他音区的语音进行抑制;
语音识别单元,包括接收子单元和识别子单元,其中,所述接收子单元用于接收来自所述麦克风模组中的多个麦克风的抑制后的语音;所述识别子单元用于从所述多个麦克风的目标音区中选择一个独立音区进行语音识别。
9.根据权利要求8所述的装置,其特征在于,所述识别子单元还用于:
识别所述多个麦克风的目标音区中是否有某个独立音区的语音中出现唤醒词;
若识别出某个独立音区的语音中出现唤醒词,则选择出现唤醒词的独立音区作为识别音区,对所述识别音区的语音进行语音识别。
10.根据权利要求9所述的装置,其特征在于,所述识别子单元还用于:
对所述识别音区的语音进行语音识别之后,判断所述识别音区的识别过程是否结束;
若所述识别音区的识别过程已经结束,则重新从所述多个麦克风的目标音区中选择一个独立音区进行语音识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110970147.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种碳包覆铁酸锌催化剂的制备方法及其应用
- 下一篇:显示膜片、壳体和电子设备