[发明专利]地址信息提取方法、装置、计算机设备和存储介质在审
申请号: | 202110010825.1 | 申请日: | 2021-01-06 |
公开(公告)号: | CN114723353A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 姚淳子;王俊翔;刘龙威;李崇贵;仝淑雅 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06Q10/08 | 分类号: | G06Q10/08;G06V30/424;G06V10/82;G06F16/24;G06F16/29;G06N3/04;G06N3/08 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 毛丹 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 信息 提取 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种地址信息提取方法、装置、计算机设备和存储介质。所述方法通过获取待识别快递运单;提取待识别快递运单的原始地址信息;对原始地址信息中的层级地址信息进行标注,获取标注地址信息;根据标注地址信息与预设关键地址集,获取原始地址信息对应的标准地址信息。本申请通过提取快递运单内的原始地址,而后基于层级地址信息标注以及标准地址识别,来确定原始地址信息对应的标准地址信息,可以有效提高快递派件过程中的地址信息识别效率,避免出现因客户写错别字等原因导致地址信息不清楚,而使派件过程无法正常进行,影响快递派件效率的情况。
技术领域
本申请涉及计算机技术领域,特别是涉及一种地址信息提取方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术与物流技术的快速发展,快递逐渐成为人们生产生活中不可或缺的一部分。快递又称速递或快运,是指物流企业(含货运代理)通过自身的独立网络或以联营合作(即联网)的方式,将用户委托的文件或包裹,快捷而安全地从发件人送达收件人的门到门(手递手)的新型运输方式。在快递运输中,一般需要托运人填写运单来获取快递相应的寄件人、托运物品以及目的地址等信息。
然而,由于运单的地址信息一般是客户填写的原始文本,因为填写习惯和细化地址的差异,文本信息呈现了明显多样性和书写差异。当前运单标签上地址信息即为客户填写的内容,不规范的填写内容大大影响相关作业人员的操作效率,进而影响快递的派送时效。
发明内容
基于此,有必要针对上述技术问题,提供一种能够可以有效提高地址信息识别效率的地址信息提取方法、装置、计算机设备和存储介质。
一种地址信息提取方法,所述方法包括:
获取待识别快递运单;
提取所述待识别快递运单的原始地址信息;
对所述原始地址信息中的层级地址信息进行标注,获取标注地址信息;
根据所述标注地址信息与预设关键地址集,获取所述原始地址信息对应的标准地址信息。
在其中一个实施例中,所述根据所述标注地址与预设关键地址集,获取所述原始地址信息中的标准地址信息包括:
获取所述标注地址信息中的关键地址,与预设关键地址集中标准关键地址的相似度;
根据所述相似度,识别所述标注地址信息对应的标准关键地址;
根据所述标注地址信息与所述标准关键地址,获取所述原始地址信息对应的标准地址信息。
在其中一个实施例中,所述获取所述标注地址信息,与预设关键地址集中标准关键地址的相似度包括:
根据所述标注地址信息中的标注,识别所述标注地址信息中的兴趣面地址与标注关键地址;
查找所述兴趣面地址对应的预设关键地址集;
通过基于计算Word Embedding余弦距离的fasttext文本相似度算法,获取所述标注关键地址与所述预设关键地址集中标准关键地址的相似度。
在其中一个实施例中,所述获取所述标注地址信息,与预设关键地址集中标准关键地址的相似度之前,还包括:
获取带层级地址信息标注的历史快递运单数据;
根据所述层级地址信息标注,识别所述历史快递运单数据中的兴趣面地址,以及所述兴趣面地址对应的关键地址的地址组合;
对兴趣面地址相同的所述地址组合进行聚类,构建各兴趣面地址对应的预设关键地址集。
在其中一个实施例中,所述对兴趣面地址相同的所述地址组合进行聚类,构建各兴趣面地址对应的预设关键地址集之前,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110010825.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种移动式育苗穴盘播摆一体化装备
- 下一篇:一种脱硫循环泵外置圆形滤网
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置