[发明专利]关键词校正方法、装置、计算机设备和存储介质在审
申请号: | 202110919541.4 | 申请日: | 2021-08-11 |
公开(公告)号: | CN113723081A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 贾亚龙;杨洋;李锋;张琛;万化 | 申请(专利权)人: | 上海浦东发展银行股份有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/284 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄晓庆 |
地址: | 200001*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 校正 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种关键词校正方法、装置、计算机设备和存储介质,该方法包括:从存储器中筛选出与待处理文本的关键字相关的多个参考文本,根据多个参考文本确定待处理文本中的待校正关键词;通过待校正关键词与多个参考文本的相似度从多个参考文本中确定候选参考文本;并根据待校正关键词与候选参考文本的音素相似度确定目标参考文本,最后基于目标参考文本对待校正关键词进行校正。本申请提供的关键词校正方法从音素力度针对候选参考文本与待校正关键词不同的音素相似度确定目标参考文本,确保了相似度高的待校正关键词与候选参考文本的编辑距离小于相似度低的待校正关键词与候选参考文本的编辑距离,能够提高对待校正关键词校正的准确率。
技术领域
本申请涉及语音识别技术领域,特别是涉及一种关键词校正方法、装置、计算机设备和存储介质。
背景技术
语音识别技术即将音频通过智能的识别设备转换成文本,随着语音识别技术的显著进步,语音识别技术逐渐进入汽车电子、医疗、金融、消费电子产品等各个领域。然而因为每个人的出生地、发音习惯等内在原因,以及信号干扰、网络不好等外在原因,语音识别的实际使用准确率较低,这极大地影响到需要利用语音识别进行后续操作的业务和工作。
现有的技术主攻方向是对语音识别的调优和改进,在识别的算法上进行技术的升级,达到更高的识别能力,很少将注意力转向对语音识别后进行二次处理校正这一方面,现存的也只是针对同音词进行校正。然而很多情况并非是识别能力不够,在现有标准普通话识别率几乎都能够准确识别的技术背景下,造成识别偏差的原因是由于人的发音差异和环境带来的干扰等,这些问题单靠提升识别能力很难攻克或者提升的空间极为有限。所以对解决语音识别准确率低的问题,效果不佳。
发明内容
本申请提供了一种能够关键词校正方法、装置、计算机设备和存储介质,能够提高对关键词的校正准确率。
本申请的第一方面提供了一种关键词校正方法,该方法包括:
根据多个参考文本确定待处理文本中的待校正关键词,多个参考文本为与待处理文本相关的文本;
通过待校正关键词与多个参考文本的第一相似度从多个参考文本中确定候选参考文本;
根据待校正关键词与候选参考文本的音素相似度确定目标参考文本;
基于目标参考文本对待校正关键词进行校正。
本申请的第二方面提供了一种关键词校正装置,该装置包括:
第一确定模块,用于根据多个参考文本确定待处理文本中的待校正关键词,多个参考文本为与待处理文本相关的文本;
第二确定模块,用于通过待校正关键词与多个参考文本的第一相似度从多个参考文本中确定候选参考文本;
第三确定模块,用于根据待校正关键词与候选参考文本的音素相似度确定目标参考文本;
校正模块,用于基于目标参考文本对待校正关键词进行校正。
本申请的第三方面提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述任一项的方法步骤。
本申请的第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一项的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海浦东发展银行股份有限公司,未经上海浦东发展银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110919541.4/2.html,转载请声明来源钻瓜专利网。