[发明专利]一种识别文本编辑错误的方法、装置、设备及存储介质在审
申请号: | 201811603085.7 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109783811A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 赵耕弘;崔朝辉;赵立军;张霞 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘佳;王宝筠 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标准文本 目标文本 文本编辑 待检测文本 差异文本 存储介质 检测文件 检测 文本 修正 | ||
本发明公开了一种识别文本编辑错误的方法、装置、设备及存储介质。该方法包括:获取标准文本并在待检测文本中确定与该标准文本对应的目标文本;确定该目标文本与该标准文本相比的差异文本的长度,并根据该差异文本的长度与标准文本的长度之间的比例关系,识别出该目标文本是否为编辑错误的文本。可见,在利用该标准文本对待检测文件进行检测时,若待检测文本中存在文本编辑错误时,基于该目标文本与标准文本之间差异可以检测出待检测文本中存在编辑错误的目标文本,这样,在对所识别出的具有编辑错误的目标文本进行修正后,可以降低文本编辑错误的出现率,提高文本编辑的准确性。
技术领域
本发明涉及信息处理技术领域,特别是涉及一种识别文本编辑错误的方法、装置、设备及存储介质。
背景技术
随着电脑、智能手机等终端设备的普及,终端设备提供的文本编辑功能已经成为人们最常用的功能之一。在用户进行文本编辑时,经常可能出现多字、少字、错别字等编辑错误的文本内容。这些编辑错误的文本可能会文本含义发生极大地变化,因此,在某些文本编辑的场景中文本编辑错误往往是难以忍受的,尤其是在报纸、杂志、网站、新闻等领域中一些严格的固定用法。
发明内容
本发明所要解决的技术问题是,提供一种识别文本编辑错误的方法、装置、设备及存储介质,以使得编辑错误的文本能够被识别出来,从而降低文本编辑错误的出现率,提高文本编辑的准确性。
第一方面,本申请实施例提供了一种识别文本编辑错误的方法,该方法包括:
获取标准文本并在待检测文本中确定与所述标准文本对应的目标文本;
确定所述目标文本与所述标准文本相比的差异文本的长度;
根据所述差异文本的长度与所述标准文本的长度之间的比例关系,识别所述目标文本是否为编辑错误的文本。
在一些可能的实施方式中,所述差异文本的首字符与所述标准文本相应位置的字符不同,所述差异文本的尾字符与所述标准文本相应位置的字符不同,所述目标文本中除所述差异文本之外的其他字符均与所述标准文本相应位置的字符相同。
在一些可能的实施方式中,所述目标文本的首字符与所述标准文本的首字符相同,所述目标文本的尾字符与所述标准文本的尾字符相同。
在一些可能的实施方式中,所述根据所述差异文本的长度与所述标准文本的长度之间的比例关系,识别所述目标文本是否为编辑错误的文本,包括:
若所述差异文本的长度与所述标准文本的长度之间的比例未超过预设比例阈值且不为0,将所述目标文本识别为编辑错误的文本。
在一些可能的实施方式中,该方法还包括:
若识别出所述目标文本为编辑错误的文本,比较所述目标文本的长度与所述标准文本的长度;
若所述目标文本的长度与所述标准文本的长度相等,则将所述目标文本的编辑错误类型识别为错别字;
若所述目标文本的长度大于所述标准文本的长度,则将所述目标文本的编辑错误类型识别为多字;
若所述目标文本的长度小于所述标准文本的长度,则将所述目标文本的编辑错误类型识别为少字。
在一些可能的实施方式中,该方法还包括:
呈现第一提示信息,所述第一提示信息用于提示所述目标文本为编辑错误的文本并标注所述目标文本的编辑错误类型。
在一些可能的实施方式中,该方法还包括:
呈现第二提示信息,所述第二提示信息用于提示所述目标文本可被替换为所述标准文本。
第二方面,本申请实施例还提供了一种识别文本编辑错误的装置,该装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811603085.7/2.html,转载请声明来源钻瓜专利网。