[发明专利]语音识别处理方法、装置、电子设备以及存储介质有效
申请号: | 202110488931.0 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113160822B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 夏帅;黄伟琦;江鹏 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 处理 方法 装置 电子设备 以及 存储 介质 | ||
1.一种语音识别处理方法,包括:
确定所述语音识别的使用场景;
根据所述使用场景获取对应的预置热词集合;
在对语音信息进行语音识别并获得语音识别结果时,根据所述预置热词集合中各热词的第一拼音信息和所述语音识别结果的第二拼音信息,确定所述语音识别结果之中的待替换词和所述待替换词对应的目标热词,所述待替换词为所述语音识别结果中的拼音信息与所述预置热词集合中的热词的拼音信息一致的词语;
将所述语音识别结果之中的待替换词替换成所述对应的目标热词;
所述根据所述预置热词集合中各热词的第一拼音信息和所述语音识别结果的第二拼音信息,确定所述语音识别结果之中的待替换词和所述待替换词对应的目标热词,包括:
确定所述预置热词集合中各热词的第一拼音信息;
对所述语音识别结果进行预处理;其中,所述预处理包括过滤标点符号、过滤特殊字符、英文字符中的至少一种;
将预处理后的所述语音识别结果转换为对应的拼音,以得到所述语音识别结果的第二拼音信息;
将所述各热词的第一拼音信息与所述语音识别结果的第二拼音信息进行对比,从所述第一拼音信息和所述第二拼音信息中确定出具有相同音节组成成分和结构的目标拼音;
根据所述第二拼音信息,将所述语音识别结果之中所述目标拼音对应的文本确定为所述待替换词;
将所述目标拼音对应的热词确定为所述目标热词;
其中,所述预置热词集合中的热词包括:
根据所述使用场景的语音识别经验得出的热词;和/或,
在所述使用场景中的语音识别过程中,对语音识别结果进行校正操作时所使用的替换词;
在将热词配置至所述预置热词集合之后,所述方法还包括:
获取所述热词中每个字的拼音;
如果所述热词中不存在多音字,则将所述热词中每个字的拼音进行组合,以得到所述热词的第一拼音信息;
如果所述热词中存在多音字,则将所述热词之中所述多音字的拼音和其他字的拼音从左到右进行两两排列组合,获得多个拼音排列组合结果;
将所述多个拼音排列组合结果作为所述热词的第一拼音信息;
其中,所述如果所述热词中存在多音字,则将所述热词之中所述多音字的拼音和其他字的拼音从左到右进行两两排列组合,获得多个拼音排列组合结果,包括;
在配置所述热词后,遍历每个新配置的热词,获取所述热词中每个字的拼音,如果其中包含了多音字,则取第一个字的所有拼音,和第二个字的所有拼音,进行两两排列组合,获得结果u,并将u和第三个字的所有拼音,进行两两排列组合,获得结果v,依次类推,最终获得拼音的结果列表。
2.根据权利要求1所述的语音识别处理方法,还包括:
判断所述待替换词之中文本间是否存在标点符号和/或特殊字符;
如果所述待替换词之中文本间存在标点符号和/或特殊字符,则不执行所述将所述语音识别结果之中的待替换词替换成所述对应的目标热词的步骤;
如果所述待替换词之中文本间不存在标点符号和/或特殊字符,则执行所述将所述语音识别结果之中的待替换词替换成所述对应的目标热词的步骤。
3.根据权利要求1所述的语音识别处理方法,还包括:
获取预置语气词集合;
将据所述预置语气词集合中的各语气词与所述语音识别结果进行文本匹配,将所述语音识别结果中匹配到的文本作为语气词进行替换处理。
4.根据权利要求3所述的语音识别处理方法,其中,所述预置语气词集合中的语气词包括:
根据所述使用场景的语音识别经验得出的语气词;和/或,
根据所述使用场景中讲话者的说话习惯而得到的语气词;和/或,
在所述使用场景中的语音识别过程中对语音识别结果进行校正操作时,将所述语音识别结果中替换成空字符的词作为语气词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110488931.0/1.html,转载请声明来源钻瓜专利网。