[发明专利]多音区语音识别方法、装置及存储介质在审
申请号: | 202110970147.3 | 申请日: | 2018-09-29 |
公开(公告)号: | CN113658588A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 欧阳能钧;梁启仍;宋晔 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/26;G10L21/0216;G10L21/0272 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 王云红;贾慧娜 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多音 语音 识别 方法 装置 存储 介质 | ||
本发明实施例提出一种多音区语音识别方法、装置及计算机可读存储介质。其中多音区语音识别方法包括:使用麦克风模组收集语音采集环境中的语音,其中,预先为所述麦克风模组中的每个麦克风设置目标音区,所述目标音区是预先设定的所述语音采集环境中的多个独立音区中的一个;判断所述语音是否来自目标音区;对来自除所述目标音区之外的其他音区的语音进行抑制;对抑制后的语音进行识别。本发明实施例使用麦克风模组隔离出不同音区,通过隔离出多个音区实现了语音采集环境内全员使用语音,并且每个音区隔离度能达到15‑20dB,实现了理想的隔离效果。
本申请是申请日为2018年09月29日、申请号为201811147010.2、发明名称为“多音区语音识别方法、装置及存储介质”的中国专利申请的分案申请。
技术领域
本发明涉及信息技术领域,尤其涉及一种多音区语音识别方法、装置及计算机可读存储介质。
背景技术
传统的语音识别技术方案都是围绕一个目标用户进行服务的。例如,传统的车载语音识别技术方案是围绕司机一个人服务的,前端麦克风的角度是对准主驾驶位来设计的。传统的核心垂类导航、音乐、电话等也都是围绕司机来展开设计的。其中,垂类就是垂直领域,特指某个领域,开发者可以根据用户使用场景设定特定领域使得识别结果更准确。比如垂直领域设定为“音乐”,则在语音识别时会优先识别为音乐相关的歌曲名、歌手名或者歌词。
传统的语音识别技术方案的缺陷在于只针对一个目标用户服务,无法实现在语音采集环境中全员使用语音服务。仍以车载语音识别为例,传统的语音识别技术方案只针对司机一个人服务,无法实现车内全员使用语音服务,给车内乘客带来不佳的用户体验。
发明内容
本发明实施例提供一种多音区语音识别方法、装置及计算机可读存储介质,以至少解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种多音区语音识别方法,包括:使用麦克风模组收集语音采集环境中的语音,其中,预先为所述麦克风模组中的每个麦克风设置目标音区,所述目标音区是预先设定的所述语音采集环境中的多个独立音区中的一个;判断所述语音是否来自目标音区;对来自除所述目标音区之外的其他音区的语音进行抑制;对抑制后的语音进行识别。
结合第一方面,本发明实施例在第一方面的第一种实现方式中,对抑制后的语音进行识别,包括:接收来自所述麦克风模组中的多个麦克风的抑制后的语音;从所述多个麦克风的目标音区中选择一个独立音区进行语音识别。
结合第一方面的第一种实现方式,本发明实施例在第一方面的第二种实现方式中,从所述多个麦克风的目标音区中选择一个独立音区进行语音识别,包括:识别所述多个麦克风的目标音区中是否有某个独立音区的语音中出现唤醒词;若识别出某个独立音区的语音中出现唤醒词,则选择出现唤醒词的独立音区作为识别音区,对所述识别音区的语音进行语音识别。
结合第一方面的第二种实现方式,本发明实施例在第一方面的第三种实现方式中,对所述识别音区的语音进行语音识别之后,还包括:判断所述识别音区的识别过程是否结束;若所述识别音区的识别过程已经结束,则重新从所述多个麦克风的目标音区中选择一个独立音区进行语音识别。
结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式或第一方面的第三种实现方式,本发明实施例在第一方面的第四种实现方式中,所述语音采集环境包括车载环境;所述麦克风模组包括布置于前排顶灯位置的第一麦克风模组和布置于后排扶手箱出风口位置的第二麦克风模组,或者所述麦克风模组包括布置于前排顶灯位置的第一麦克风模组和布置于后排天窗边缘位置的第三麦克风模组。
结合第一方面的第四种实现方式,本发明实施例在第一方面的第五种实现方式中,对抑制后的语音进行识别之前,还包括:接收来自车机系统的所述抑制后的语音,其中,所述抑制后的语音是由所述麦克风模组通过音频总线传输给所述车机系统的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110970147.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种碳包覆铁酸锌催化剂的制备方法及其应用
- 下一篇:显示膜片、壳体和电子设备