[发明专利]基于滑动窗口最大匹配算法的地址匹配方法有效

专利信息
申请号: 201510092653.1 申请日: 2015-03-02
公开(公告)号: CN104615782B 公开(公告)日: 2017-10-10
发明(设计)人: 李晓林;魏运运;张彦铎;卢涛;段艳会;张玉敏;黄爽;万永静;杨威 申请(专利权)人: 武汉工程大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 湖北武汉永嘉专利代理有限公司42102 代理人: 王丹
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 滑动 窗口 最大 匹配 算法 地址 方法
【说明书】:

技术领域

发明涉及计算地址字符串中所有可能的行政区划,具体涉及基于滑动窗口最大匹配算法的地址匹配方法。

背景技术

数字城市是以空间信息为核心的城市信息系统体系,而在数字城市的信息资源的集成和融合中,地名地址匹配是一项非常关键的技术。地名地址匹配,又称为地理编码,它是基于空间定位技术的一种编码方法。

国外的地理赋值技术已基本成熟,但是对于中文地址的地理赋值方法还有待研究。一是因为中英文之间的差异,比如中文地址的词与词之间没有空格隔开等问题的存在。二是因为我国的现有地名,地址体系异常复杂,地址系统混乱、无需、缺乏规律性和统一的标准。因此,国外已有的地理赋值技术并不适合中国国情,直接套用国外的地理赋值技术是不可行的。

目前,国内各部门与学者已经陆续开展了中国地质标准化的研究,为标准地址库的建立奠定了良好的数据基础。但是普通百姓在输入其需要定位的地址时,往往输入的地址是一些模糊的中文地址。以地址“湖北武汉洪山江苏省鼓楼区办事处”为例,可能有几种不同的行政区划,如何通过算法计算出所有的行政区划,然后找出可信度最大的行政区划来进行准确的定位,是我国进入实用阶段的一个重要问题。

发明内容

针对上述现有技术中的不足,本发明的目的在于提供一种基于滑动窗口最大匹配算法的地址匹配方法,能够有效减少数据库的查询访问次数,加快匹配速度。

为了实现上述发明的目的,本发明提供了以下技术方案:一种基于滑动窗口最大匹配算法的地址匹配方法,其特征在于:它包括以下步骤:

S1、建立行政区划表:

行政区划表中包含行政区划信息,每个行政区划信息包含以下字段:序号、行政区划名称、行政区划级别,三者一一对应;

S2、对行政区划表建立匹配查询关系:

根据行政区划级别之间的隶属关系对行政区划信息建立关联性;

匹配查询:在给定一个查询字符串时,根据上述关联性输出对应的行政区划结果集,行政区划结果集包含与该行政区划匹配父行政区划,直到最高行政区划级别;

S3、设置滑动窗口,进行匹配查询:

3.1、读入待匹配地址字符串,设置滑动窗口的起始位置为待匹配地址字符串的第一位,截止位置为待匹配地址字符串的最后一位,取滑动窗口中的字符组成查询字符串,进行匹配查询;若匹配成功,则输出对应的行政区划结果集;若匹配不成功,则进行下一步;

3.2、滑动窗口的起始位置不变,将滑动窗口的截止位置向前移一位,取滑动窗口中的字符组成查询字符串,进行匹配查询;若匹配成功,则输出对应的行政区划结果集,将滑动窗口的起始位置设置为剩余字符串的开始,截止位置设置为剩余字符串的最后一位,继续进行匹配查询,直至截止位置减去起始位置的值小于2,进行下一步;若匹配不成功,则返回本步骤开始,继续进行匹配查询;

3.3、将滑动窗口的起始位置向后移一位,截止位置为待匹配地址字符串的最后一位,取滑动窗口中的字符组成查询字符串,进行匹配查询;若匹配成功,则输出对应的行政区划结果集;若匹配不成功,则返回本步骤开始,继续进行匹配查询,直至截止位置减去起始位置的值小于2,结束匹配查询。

按上述方案,所述的匹配查询包括完全匹配查询和部分匹配查询,若查询字符串包含行政区划特征词则进行完全匹配查询,否则进行部分匹配查询;

完全匹配查询:在给定一个包含行政区划特征词的查询字符串时,根据上述关联性输出对应的行政区划结果集,行政区划结果集包含与该行政区划匹配父行政区划,直到最高行政区划级别;

部分匹配查询:在给定一个不含行政区划特征词的查询字符串时,根据上述关联性输出对应的行政区划结果集,行政区划结果集包含与该行政区划匹配的父行政区划,直到最高行政区划级别;

其中行政区划隶属于与该行政区划匹配的父行政区划;行政区划结果集包含所有可能的行政区划的集合。

本发明的有益效果为:

1、将地理赋值的两个环节“地址分词”与“地址匹配”整合到了一起,即在分词的同时进行数据库匹配,实现了在分词完成的同时也查找到了所匹配的记录;通过这种方法可以有效的减少数据库的查询访问次数,从而加快匹配速度。

2、该算法通过移动窗口最大匹配算法,截取字符串中的字符对行政区划表进行完全匹配查询或部分查询匹配,返回对应的行政区划结果集,包含与该行政区划匹配父行政区划,直到省级。

具体实施方式

下面结合具体实例对本发明作进一步说明。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉工程大学,未经武汉工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510092653.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top