[发明专利]文本修正方法以及装置在审
| 申请号: | 202210393422.4 | 申请日: | 2022-04-14 |
| 公开(公告)号: | CN114818667A | 公开(公告)日: | 2022-07-29 |
| 发明(设计)人: | 吕志强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F40/232 | 分类号: | G06F40/232 |
| 代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 李晓庆 |
| 地址: | 310013 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 修正 方法 以及 装置 | ||
本说明书实施例提供文本修正方法以及装置,其中,文本修正方法包括:获取原始文本和配置文件,对原始文本中的各字符进行识别,若识别出目标异常字符,则查询配置文件,确定目标异常字符对应的目标常规字符,利用目标常规字符替换原始文本中的目标异常字符,得到修正文本。保证了得到的修正文本可以被正确呈现,并提升了文本的利用率,而无需反复获取格式不同的同质文本,提升了文本处理的效率,增强了用户体验。
技术领域
本说明书实施例涉及文本编辑技术领域,特别涉及一种文本修正方法以及装置。
背景技术
随着互联网技术的发展,多种类型的文本在相关项目和服务中扮演越来越重要的角色。
由于文本数量的增加,和各种文本获取工具的开发,已经摒弃了过去用专门的文本格式文件进行传输,需要在多种文本格式间进行文本转转换,才能更大范围地使用文本信息。
但是,由于获取的文本来源众多,相关的文本编译规则差异很大,因而直接对不同格式的文本进行转换,会出现文本字符无法被识别的问题。因此,亟需一种文本修正方法,对难以识别的文本字符进行修正,来满足不同格式在完成转换后,依然可以在后续得到充分利用。
发明内容
有鉴于此,本说明书实施例提供了一种文本修正方法。本说明书一个或者多个实施例同时涉及一种文本修正装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种文本修正方法,包括:
获取原始文本和配置文件,其中,配置文件用于记录异常字符与常规字符的对应关系;
对原始文本中的各字符进行识别,若识别出目标异常字符,则查询配置文件,确定目标异常字符对应的目标常规字符;
利用目标常规字符替换原始文本中的目标异常字符,得到修正文本。
根据本说明书实施例的第二方面,提供了一种文本修正装置,包括:
获取模块,被配置为获取原始文本和配置文件,其中,配置文件用于记录异常字符与常规字符的对应关系;
查询模块,被配置为对原始文本中的各字符进行识别,若识别出目标异常字符,则查询配置文件,确定目标异常字符对应的目标常规字符;
修正模块,被配置为利用目标常规字符替换原始文本中的目标异常字符,得到修正文本。
根据本说明书实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,该计算机可执行指令被处理器执行时实现上述文本修正方法的步骤。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述文本修正方法的步骤。
根据本说明书实施例的第五方面,提供了一种计算机程序,其中,当计算机程序在计算机中执行时,令计算机执行上述文本修正方法的步骤。
本说明书一个或多个实施例中,获取原始文本和配置文件,对原始文本中的各字符进行识别,若识别出目标异常字符,则查询配置文件,确定目标异常字符对应的目标常规字符,利用目标常规字符替换原始文本中的目标异常字符,得到修正文本。按照配置文件,对存在于原始文本中的异常字符进行了对应的常规字符替换,得到修正文本,保证了得到的修正文本可以被正确呈现,并且通过对原始文本进行替换,也提升了文本的利用率,而无需反复获取格式不同的同质文本,提升了文本处理的效率,增强了用户体验。
附图说明
图1是本说明书一个实施例提供的一种文本修正方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210393422.4/2.html,转载请声明来源钻瓜专利网。





