[发明专利]文字纠错方法、装置、电子设备和存储介质有效
| 申请号: | 201910747672.1 | 申请日: | 2019-08-14 |
| 公开(公告)号: | CN110472701B | 公开(公告)日: | 2023-07-07 |
| 发明(设计)人: | 曾菲 | 申请(专利权)人: | 广东小天才科技有限公司 |
| 主分类号: | G06F40/232 | 分类号: | G06F40/232;G06V30/146;G06V30/19;G06V30/262 |
| 代理公司: | 北京泽方誉航专利代理事务所(普通合伙) 11884 | 代理人: | 陈照辉 |
| 地址: | 523000 广东省东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文字 纠错 方法 装置 电子设备 存储 介质 | ||
1.一种文字纠错方法,其特征在于,包括:
对用户点击的目标文字进行识别,获取识别结果;
将所述识别结果与预设字词库进行匹配,确定候选词语;
针对各个候选词语,按照构成所述识别结果的各个第一文字在所述识别结果中的位置顺序,以及,构成所述候选词语的各个第二文字在所述候选词语中的位置顺序,依次计算所述各个第一文字和对应位置顺序的第二文字的第一匹配度;
根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字;
依次计算所述待纠错文字和每个备选文字的第二匹配度,选择所述第二匹配度最高的备选文字替换所述待纠错文字;
其中,所述对用户点击的目标文字进行识别,获取识别结果,包括:
计算所述用户点击的目标文字的像素坐标;
根据预设识别规则、预设字数阈值和所述目标文字的像素坐标,确定包括所述目标文字的目标词语;
对所述目标词语进行识别,获取识别结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述识别结果与预设字词库进行匹配,确定候选词语,包括:
将所述识别结果与预设字词库进行匹配,计算第三匹配度;
将所述第三匹配度最高的所述预设字词库中的至少一个词语作为候选词语。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字,包括:
选取第一匹配度最小的一组目标第一文字和目标第二文字;
确定所述目标第一文字为所述识别结果中的待纠错文字,以及,确定所述目标第二文字为所述待纠错文字对应的备选文字。
4.根据权利要求1所述的方法,其特征在于,依次计算所述待纠错文字和每个备选文字的第二匹配度,包括:
将所述待纠错文字和各个备选文字输入至预设形近字库;
分别计算所述待纠错文字和每个备选文字间之间的第二匹配度。
5.根据权利要求1所述的方法,其特征在于,所述预设识别规则包括成语识别、词语识别和单字识别的优先级依次降低。
6.一种文字纠错装置,其特征在于,包括:
识别结果获取模块,用于对用户点击的目标文字进行识别,获取识别结果;
候选词语确定模块,用于将所述识别结果与预设字词库进行匹配,确定候选词语;
第一匹配度确定模块,用于针对各个候选词语,按照构成所述识别结果的各个第一文字在所述识别结果中的位置顺序,以及,构成所述候选词语的各个第二文字在所述候选词语中的位置顺序,依次计算所述各个第一文字和对应位置顺序的第二文字的第一匹配度;
待纠错文字和备选文字确定模块,用于根据所述第一匹配度确定所述识别结果中的待纠错文字和所述候选词语中所述待纠错文字对应的备选文字;
文字纠错模块,用于依次计算所述待纠错文字和每个备选文字的第二匹配度,选择所述第二匹配度最高的备选文字替换所述待纠错文字;
其中,所述识别结果获取模块具体用于:
计算所述用户点击的目标文字的像素坐标;
根据预设识别规则、预设字数阈值和所述目标文字的像素坐标,确定包括所述目标文字的目标词语;
对所述目标词语进行识别,获取识别结果。
7.一种电子设备,其特征在于,包括:
存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5任一所述的文字纠错方法。
8.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-5任一所述的文字纠错方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910747672.1/1.html,转载请声明来源钻瓜专利网。





