[发明专利]文本处理方法、装置、设备及介质在审
申请号: | 202110647402.0 | 申请日: | 2021-06-10 |
公开(公告)号: | CN113343652A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 狄玮杰 | 申请(专利权)人: | 闪电快车软件(北京)有限公司 |
主分类号: | G06F40/174 | 分类号: | G06F40/174;G06F40/205;G06F40/289 |
代理公司: | 北京智燃律师事务所 11864 | 代理人: | 柴琳琳 |
地址: | 100101 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 处理 方法 装置 设备 介质 | ||
本申请公开地址了一种文本处理方法、装置、设备及存储介质,该方法包括:当接收到寄件指令后,获取包含寄件信息的待处理文本;采用预设的解析库对所述待处理文本进行解析处理,确定解析结果,所述解析结果包括至少一个寄件内容参数;将所述至少一个寄件内容参数中每个寄件内容参数写入与所述每个寄件内容参数对应的寄件信息输入位置,生成寄件页面。该技术方案无需用户手动写入寄件内容参数,仅需采用预设的解析库,能够解析得到寄件内容参数,进而快速将寄件内容参数写入对应的寄件信息输入位置,提高了文本写入效率,能够快速生成寄件页面,进一步很大程度上提高了用户体验。
技术领域
本发明一般涉及信息处理技术领域,具体涉及一种文本处理方法、装置、设备及介质。
背景技术
近年来,随着电子商务的迅猛发展,快递业务呈现高速增长趋势,其中,用户需要通过社交平台、手机APP或者本地电脑上填写完整的收/寄件人文本信息,以完成收/寄件等操作。该文本信息中可以包括:姓名、地址、行政区域、邮编、电话和部分无关信息。
相关技术中用户可以通过两种方式在寄件界面上填写相关快递信息,一种方式是将快递信息的文本分多次复制粘贴至相关位置,另一种方式是通过人工手动将对应文本内容输入至对应的位置,然而上述两种方式均使得寄件信息填写效率低下,导致用户体验差。因此,如何快速填写寄件信息,以提高用户寄件效率是现今需要解决的问题。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种文本处理方法、装置、设备及介质。
第一方面,本发明提供了一种文本处理方法,该方法包括:
当接收到寄件指令后,获取包含寄件信息的待处理文本;
采用预设的解析库对所述待处理文本进行解析处理,确定解析结果,所述解析结果包括至少一个寄件内容参数;
将所述至少一个寄件内容参数中的每个寄件内容参数写入与所述每个寄件内容参数对应的寄件信息输入位置,生成寄件页面。
在其中一个实施例中,所述解析结果包括电话内容、地址内容和姓名内容,采用预设的解析库对所述待处理文本进行解析处理,确定解析结果,包括:
根据预设的文本识别规则从所述待处理文本中提取至少一个数字串、姓名关键字和地址关键字,所述姓名关键字为包含预设姓名的保留字,所述地址关键字为包含预设省市乡的保留字;
基于所述每个数字串的长度和所述地址关键字,确定电话内容和所述地址内容;
将包含所述姓名关键字的文本确定为姓名内容。
在其中一个实施例中,基于所述每个数字串的长度,确定电话内容和所述地址内容,包括:
判断所述数字串的长度是否符合第一预设长度区间;
若符合第一预设长度区间,确定所述数字串为电话内容;
若不符合第一预设长度区间,判断所述数字串的长度是否符合第二预设长度区间,所述第一预设长度区间的最小阈值大于所述第二预设长度阈值;
若符合第二预设长度阈值,将符合所述第二预设长度阈值的数字串对应的文本确定地址内容。
在其中一个实施例中,在将符合所述第二预设长度阈值的数字串对应的文本确定地址内容之后,所述方法还包括:
对所述地址内容进行预处理,得到预处理后的地址内容;
按照预设的分割顺序,采用空格对所述预处理后的地址内容进行分词处理,得到多个字符串;
采用预设的单词对照表对所述每个字符串进行解析,确定省市乡编码;
去掉所述省市乡编码对应的字符串,确定地址解析结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闪电快车软件(北京)有限公司,未经闪电快车软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110647402.0/2.html,转载请声明来源钻瓜专利网。