[发明专利]文字纠错方法、装置、电子设备和存储介质有效
| 申请号: | 201910747672.1 | 申请日: | 2019-08-14 |
| 公开(公告)号: | CN110472701B | 公开(公告)日: | 2023-07-07 |
| 发明(设计)人: | 曾菲 | 申请(专利权)人: | 广东小天才科技有限公司 |
| 主分类号: | G06F40/232 | 分类号: | G06F40/232;G06V30/146;G06V30/19;G06V30/262 |
| 代理公司: | 北京泽方誉航专利代理事务所(普通合伙) 11884 | 代理人: | 陈照辉 |
| 地址: | 523000 广东省东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文字 纠错 方法 装置 电子设备 存储 介质 | ||
本申请实施例公开了一种文字纠错方法、装置、电子设备和存储介质,该方法包括:对用户点击的目标文字进行识别,获取识别结果;将识别结果与预设字词库进行匹配,确定候选词语;针对各个候选词语,按照构成识别结果的各个第一文字在识别结果中的位置顺序,以及,构成候选词语的各个第二文字在候选结果中的位置顺序,依次计算各个第一文字和对应位置顺序的第二文字的第一匹配度;根据第一匹配度确定识别结果中的待纠错文字和候选词语中待纠错文字对应的备选文字;依次计算待纠错文字和每个备选文字的第二匹配度,选择第二匹配度最高的备选文字替换待纠错文字。这样提高了文字识别的准确率,进而提高了对识别文字的搜索的准确率,提高用户体验。
技术领域
本申请实施例涉及文字识别与处理技术,尤其涉及一种文字纠错方法、装置、电子设备和存储介质。
背景技术
随着科技的进步,文字识别技术的应用越来越广泛,例如在单据识别领域或学生使用学习平板电脑学习的过程中。尤其是当对图片识别时,原本图片存在一定的手写干扰,或者拍照环境灰暗,或者图片像素、清晰度、噪音等问题导致文字识别的准确率不高,经常会出现识别出相似的字或单词,如“闰”识别成了“闺”,这样就会影响到文字识别技术的实际应用。尤其是在学生学习过程中,在识别完成后还需要进一步搜索等,这样当字或词识别错误后,导致搜索的结果准确率也会随之降低。因此,如何进行纠错进而提升文字识别的准确率成为亟待解决的问题。
发明内容
本申请提供了一种文字纠错方法、装置、电子设备和存储介质,以解决现有技术中文字识别准确率低的问题。
本发明采用如下技术方案:
第一方面,本申请实施例提供了一种文字纠错方法,该方法包括:
对用户点击的目标文字进行识别,获取识别结果;
将所述识别结果与预设字词库进行匹配,确定候选词语;
针对各个候选词语,按照构成所述识别结果的各个第一文字在所述识别结果中的位置顺序,以及,构成所述候选词语的各个第二文字在所述候选词语中的位置顺序,依次计算所述各个第一文字和对应位置顺序的第二文字的第一匹配度;
根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字;
依次计算所述待纠错文字和每个备选文字的第二匹配度,选择所述第二匹配度最高的备选文字替换所述待纠错文字。
第二方面,本申请实施例提供了一种文字纠错装置,该装置包括:
识别结果获取模块,用于对用户点击的目标文字进行识别,获取识别结果;
候选词语确定模块,用于将所述识别结果与预设字词库进行匹配,确定候选词语;
第一匹配度确定模块,用于针对各个候选词语,按照构成所述识别结果的各个第一文字在所述识别结果中的位置顺序,以及,构成所述候选词语的各个第二文字在所述候选词语中的位置顺序,依次计算所述各个第一文字和对应位置顺序的第二文字的第一匹配度;
待纠错文字和备选文字确定模块,用于根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字;
文字纠错模块,用于依次计算所述待纠错文字和每个备选文字的第二匹配度,选择所述第二匹配度最高的备选文字替换所述待纠错文字。
第三方面,本申请实施例提供了一种电子设备,包括存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的文字纠错方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910747672.1/2.html,转载请声明来源钻瓜专利网。





