[发明专利]一种地址聚合的方法、包裹聚合的方法以及设备有效
申请号: | 201710468203.7 | 申请日: | 2017-06-20 |
公开(公告)号: | CN109101474B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 王国印;郑耸 | 申请(专利权)人: | 菜鸟智能物流控股有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/289;G06F16/28;G06F16/9537;G06F16/29;G06Q10/08 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 党晓林;李辉 |
地址: | 英属开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 地址 聚合 方法 包裹 以及 设备 | ||
1.一种地址聚合的方法,其特征在于,所述方法包括:
获取多个标准门址;
将所述多个标准门址转化为多个结构化地址;
对所述多个结构化地址进行特征提取,得到与所述多个标准门址对应的多个特征集合,所述特征集合包括兴趣区域属性信息;
根据所述多个标准门址对应的多个特征集合确定所述多个标准门址中任意两个标准门址之间的相似度;
根据所述相似度将所述多个标准门址进行聚合,得到多个簇;
根据所述相似度将所述多个标准门址进行聚合,得到多个簇包括:
确定每个标准门址的相似标准门址;
判断每个标准门址以及对应的相似标准门址是否在簇中;
当判断为否时,将所述标准门址以及对应的相似标准门址加入到一新建的簇中;
否则,将所述标准门址以及对应的相似标准门址加入所述簇中;
将所述新建的簇以及所述簇作为聚合后得到的多个簇;
对所述多个结构化地址进行特征提取,得到与所述多个标准门址对应的多个特征集合包括:通过基于模板的N元模型对所述结构化地址进行特征提取,所述N元模型包括歧义度等级,提取得到的所述标准门址对应的特征集合中的多个特征对应的歧义度为所述N元模型的歧义度。
2.根据权利要求1所述的方法,其特征在于,将多个标准门址转化为多个结构化地址包括:
提取所述标准门址中的地名信息;
为每个所述地名信息加注语义标注信息,所述语义标注信息至少包括兴趣区域的道路及路号信息和/或兴趣区域的名字;
依据所述语义标注信息将所述地名信息放入结构化模板中,得到结构化地址。
3.根据权利要求1所述的方法,其特征在于,根据所述多个标准门址对应的多个特征集合确定所述多个标准门址中任意两个标准门址之间的相似度包括:通过相似度公式确定所述多个标准门址中任意两个标准门址之间的相似度。
4.根据权利要求3所述的方法,其特征在于,所述确定每个标准门址的相似标准门址包括:当两个标准门址对应的特征集合中存在相同的特征且所述相同的特征的歧义度等级为无歧义;或当两个标准门址之间的相似度不小于一预设阈值;或当两个标准门址对应的特征集合中存在同义的兴趣区域时,将所述两个标准门址作为相似标准门址。
5.根据权利要求3至4任意一项所述的方法,其特征在于,所述兴趣区域属性信息包括兴趣区域的道路及路号信息和/或兴趣区域的名字,所述方法还包括对所述多个簇进行命名,得到所述簇的名称。
6.根据权利要求5所述的方法,其特征在于,所述簇的名称包括簇ID,所述方法还包括:
获取组成所述簇的多个标准门址对应的多个特征集合;
将所述特征集合中的特征关联所述簇ID;
根据所述簇ID创建倒排索引,形成包裹聚合模型,所述包裹聚合模型为文本模型。
7.根据权利要求5所述的方法,其特征在于,所述簇的名称包括簇ID,所述方法还包括:
获取组成所述簇的多个标准门址,所述标准门址包括标准地址以及与所述标准地址对应的经纬度;
将所述多个标准门址关联所述簇ID;
根据所述多个标准门址包括的多个经纬度确定兴趣区域的中心点以及边界;
根据所述兴趣区域的中心点以及边界建立兴趣区域的多边形;
在所述多边形中建立网格;
建立所述网格与所述簇ID的映射关系,形成包裹聚合模型,所述包裹聚合模型为经纬度模型。
8.根据权利要求6或7任意一项所述的方法,其特征在于,所述方法还包括:获取包裹的通信地址;将所述通信地址与所述包裹聚合模型进行匹配,得到与所述包裹对应的簇;将所述包裹聚合在所述簇下。
9.根据权利要求8所述的方法,其特征在于,对所述多个簇进行命名包括:
获取组成所述簇的多个标准门址对应的特征集合;
根据所述特征集合依次确定每个道路及路号信息的频次以及区域名称的频次;
将频次最高的特征作为所述簇的名称。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于菜鸟智能物流控股有限公司,未经菜鸟智能物流控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710468203.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于处理二维数据表的方法和装置
- 下一篇:出行语音识别方法、系统和计算机设备