[发明专利]一种语音识别文本的校正方法、装置、计算机设备和存储介质在审

申请号：	201811549312.2	申请日：	2018-12-18
公开（公告）号：	CN109710929A	公开（公告）日：	2019-05-03
发明（设计）人：	曾晶;邓理平;陈桓;张良杰	申请（专利权）人：	金蝶软件（中国）有限公司
主分类号：	G06F17/27	分类号：	G06F17/27;G06F16/31;G10L15/26
代理公司：	广州华进联合专利商标代理有限公司 44224	代理人：	何平
地址：	518000 广东省深圳市南山区***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	校正候选文本文本语音识别文本编辑距离拼音计算机设备存储介质声音单元整体认读音节筛选声母韵母语音识别模糊音语料库准确率长时申请
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种语音识别文本的校正方法、装置、计算机设备和存储介质。方法包括：获取经语音识别得到的识别文本中各个词的拼音；基于语料库和所述各个词的拼音中声音单元的模糊音确定候选文本；所述声音单元包括声母、韵母和整体认读音节中的至少一种；根据所述识别文本和所述候选文本间的词数差、拼音总字母数和词总数，确定所述候选文本对应的编辑距离；按照所述编辑距离从所述候选文本中筛选出校正文本。采用本方法提出的编辑距离方法来筛选候选文本的校正文本，在识别文本较长时，可有效的校正语音识别文本，提高校正的准确率。

技术领域

本申请涉及计算机技术领域，特别是涉及一种语音识别文本的校正方法、装置、计算机设备和存储介质。

背景技术

随着互联网的发展，语音识别技术已经得到越来越广泛的应用。语音识别技术是机器通过识别和理解将输入的语音信号转变成相应的文本，实现人与机器的交流互动。

目前，大部分语音识别技术采用人工智能方法来自动识别语音，然而该语音识别技术的准确率容易受到环境、人的发音等因素的影响，准确率低。

发明内容

基于此，有必要针对上述技术问题，提供一种语音识别文本的校正方法、装置、计算机设备和存储介质。

一种语音识别文本的校正方法，所述方法包括：

获取经语音识别得到的识别文本中各个词的拼音；

基于语料库和所述各个词的拼音中声音单元的模糊音确定候选文本；所述声音单元包括声母、韵母和整体认读音节中的至少一种；

根据所述识别文本和所述候选文本间的词数差、拼音总字母数和词总数，确定所述候选文本对应的编辑距离；

按照所述编辑距离从所述候选文本中筛选出校正文本。