[发明专利]地区名称的标准化处理和清洗方法及系统在审
| 申请号: | 202211331439.3 | 申请日: | 2022-10-28 |
| 公开(公告)号: | CN115496037A | 公开(公告)日: | 2022-12-20 |
| 发明(设计)人: | 费振玉;单震;谢传家 | 申请(专利权)人: | 浪潮卓数大数据产业发展有限公司 |
| 主分类号: | G06F40/103 | 分类号: | G06F40/103;G06F40/242 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 潘悦梅 |
| 地址: | 214125 江苏省无锡市无锡经济开发区金融一街15号110*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了地区名称的标准化处理和清洗方法及系统,属于数据处理技术领域,要解决的技术问题为如何实现多源异构背景下各种非标准化地区名称的标准化处理以及清洗。包括如下步骤:基于国家行政部的行政区划分类标准,确定地区标准;根据所述地区标准,得到每个省份、每个城市以及每个区县的别名集;对于省级、城市级以及区县级的地区,按照笛卡尔乘积组合方式得到地区别名词典;基于省级、城市级以及区县级的地区对应的地区别名词典,对重名地区的别名词典进行检测和消除后,对地区别名词典进行汇总,得到最终的地区别名词典系统;基于所述最终的地区别名词典系统进行地区的标准化。 | ||
| 搜索关键词: | 地区 名称 标准化 处理 清洗 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211331439.3/,转载请声明来源钻瓜专利网。





