[发明专利]一种中文地址标准化方法、装置及电子设备在审
申请号: | 201910073229.0 | 申请日: | 2019-01-25 |
公开(公告)号: | CN109815498A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 马林 | 申请(专利权)人: | 深圳市小赢信息技术有限责任公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 杨军 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种中文地址标准化方法、装置及电子设备,根据预设分词数据库对源地址进行分词;复制分词结果以获得内容相同的第一列表和第二列表,根据预设的分级数据库对第一列表进行匹配,且根据对第一列表的匹配结果,对第二列表的内容进行切断或拼接以将分词后的源地址信息规整为待标准化地址;将待标准化地址输入预设的Trie树,以根据Trie树判断待标准化地址是否符合预设规范,对不符合预设规范的待标准化地址进行标记且反馈标准化失败的信息;或对不符合预设规范的待标准化地址进行补齐后生成标准化地址以供输出。本发明的中文地址标准化方法、装置及电子设备可以准确且高效的将文字信息中包含的源地址解析为标准地址,提升地址信息管理的效果。 | ||
搜索关键词: | 标准化地址 预设 装置及电子设备 地址标准化 分词 源地址 中文 数据库 地址信息管理 源地址信息 标准地址 分词结果 匹配结果 文字信息 规整 补齐 分级 拼接 解析 匹配 标准化 复制 反馈 输出 失败 | ||
【主权项】:
1.一种中文地址标准化方法,其特征在于,包括:接收源地址信息;根据预设分词数据库对所述源地址进行分词,分词结果包括关于源地址的词、单个字和/或单个符号;复制分词结果以获得内容相同的第一列表和第二列表,根据预设的分级数据库对所述第一列表进行匹配,且根据对所述第一列表的匹配结果,对所述第二列表的内容进行切断或拼接以将分词后的源地址信息规整为待标准化地址;将所述待标准化地址输入预设的Trie树,以根据所述Trie树判断所述待标准化地址是否符合预设规范,对不符合所述预设规范的待标准化地址进行标记且反馈标准化失败的信息;或对不符合所述预设规范的待标准化地址进行补齐后生成标准化地址以供输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市小赢信息技术有限责任公司,未经深圳市小赢信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910073229.0/,转载请声明来源钻瓜专利网。