[发明专利]语音识别方法、装置、设备及计算机可读存储介质在审
申请号: | 201910342353.2 | 申请日: | 2019-04-26 |
公开(公告)号: | CN110164435A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 魏韬;马骏;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 刘挽澜 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音识别 语音识别结果 计算机可读存储介质 拼音字符串 预置数据库 目标拼音 目标文字 原始文字 字符串 结果转换 纠错处理 音调识别 语音交互 语音信息 最终结果 相似度 音信息 准确率 出错 查找 输出 | ||
本发明涉及语音交互技术领域,公开了一种语音识别方法、装置、设备及计算机可读存储介质,所述语音识别方法包括:获取语音信息,并对所述语音信息进行语音识别,得到原始文字识别结果;将所述原始文字识别结果转换成原始拼音字符串;查找预置数据库中与所述原始拼音字符串相似度最高的目标拼音字符串;从所述预置数据库中获取所述目标拼音字符串对应的目标文字,并输出所述目标文字以作为语音识别的最终结果。通过本发明,在得到语音识别结果后,进一步对语音识别结果进行纠错处理,避免了因音调识别错误而造成语音识别结果出错,提高了语音识别的准确率。
技术领域
本发明涉及语音交互技术领域,尤其涉及一种语音识别方法、装置、设备及计算机可读存储介质。
背景技术
目前,在语音交互业务中,一般是将用户语音识别为文字,然后根据识别到的文字进行业务处理。单对中文语音进行识别时,因为用户发音不标准或当前识别机制的缺陷,往往会将某个字的声调识别错误,例如,用户想要表达的是“补领驾驶证”,若识别为“不领驾驶证”,则导致业务处理出错,影响用户体验。
发明内容
本发明的主要目的在于提供一种语音识别方法、装置、设备及计算机可读存储介质,旨在解决现有技术中由于识别机制的缺陷,往往会将某个字的声调识别错误的技术问题。
为实现上述目的,本发明提供一种语音识别方法,所述语音识别方法包括以下步骤:
获取语音信息,并对所述语音信息进行语音识别,得到原始文字识别结果
将所述原始文字识别结果转换成原始拼音字符串;
查找预置数据库中与所述原始拼音字符串相似度最高的目标拼音字符串
从所述预置数据库中获取所述目标拼音字符串对应的目标文字,并输出所述目标文字以作为语音识别的最终结果。
可选地,所述查找预置数据库中与所述原始拼音字符串相似度最高的目标拼音字符串的步骤包括:
显示业务主题选择界面,接收选择指令;
基于所述选择指令,确定目标业务主题;
根据所述目标业务主题,查找所述预置数据库中的对应目标数据表;
确定所述目标数据表中与所述原始拼音字符串相似度最高的拼音字符串为目标拼音字符串。
可选地,在所述查找预置数据库中与所述原始拼音字符串相似度最高的目标拼音字符串的步骤之前,还包括:
创建业务主题对应的数据表;
获取业务主题对应的历史业务提问记录,所述历史业务提问记录中包含若干个业务提问;
获取每个业务提问对应的拼音字串符;
将业务提问及对应的拼音字串符关联存储至所述数据表中;
基于所述数据表,构建所述预置数据库。
可选地,所述确定所述目标数据表中与所述原始拼音字符串相似度最高的拼音字符串为目标拼音字符串的步骤包括:
计算所述原始拼音字符串与所述目标数据表中存储的各个拼音字符串的编辑距离;
基于所述编辑距离,得到所述原始拼音字符串与所述各个拼音字符串的相似度;
确定最高相似度对应的拼音字符串为目标字符串。
可选地,在所述确定最高相似度对应的拼音字符串为目标字符串的步骤之后,还包括:
检测所述最高相似度是否大于或等于预设阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910342353.2/2.html,转载请声明来源钻瓜专利网。