[发明专利]一种基于本体的城市交通异构数据集成系统及方法有效

专利信息
申请号: 201710873196.9 申请日: 2017-09-25
公开(公告)号: CN107491561B 公开(公告)日: 2020-05-26
发明(设计)人: 王海泉;张雅素;赵洁洁;吴世敏 申请(专利权)人: 北京航空航天大学
主分类号: G06F16/22 分类号: G06F16/22;G06F16/2455;G06F16/248;G06F16/25;G06F16/242
代理公司: 北京科迪生专利代理有限责任公司 11251 代理人: 安丽
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于本体的城市交通异构数据集成系统及方法,能够解决城市交通领域数据中的多种语法、语义、系统异构问题,提高数据处理工作效率。该系统由个模块组成:查询分解模块、本体与数据库映射模块、子查询生成模块、结果合并模块和包装器模块。所述方法利用本体,通过建立数据库表、字段与本体概念、属性之间的映射,实现对城市交通领域的常规以及特殊数据的管理,在进行数据集成的同时解决其中的异构问题。本发明充分考虑了城市交通领域数据相较其他领域数据的特有特征,解决了普适方法所不能解决的城市交通领域数据异构问题,从而为数据处理人员提供统一的数据查询接口,提高数据处理效率。
搜索关键词: 一种 基于 本体 城市交通 数据 集成 系统 方法
【主权项】:
一种基于本体的城市交通异构数据集成系统,其特征在于:包括本体与数据库映射模块、子查询分解模块、查询生成模块、包装器模块及查询结果合并模块,其中,查询分解模块、子查询生成模块、查询结果合并模块组成了数据集成系统的中介器;本体与数据库映射模块:负责全局查询中涉及的城市交通本体概念和属性至数据库表和字段的映射解析;所述本体与数据库映射模块中包括两个文件,即描述城市交通领域知识全局本体、数据源与全局本体间的映射规则文件;所述城市交通领域知识全局本体描述了交通领域内的概念与概念之间的关系,同时概念中也包含了一些描述概念特征的属性,所述属性为用户编写全局查询语句时所参照的规范词语表;所述映射规则文件记录了各城市交通数据源的数据库表和字段与全局本体概念和属性之间的对应关系;输入查询中涉及的本体概念和属性,通过查询存储在所述映射规则文件中的数据源与全局本体间映射规则,向查询分解模块返回与本次查询相关的数据源、数据库表和字段名称;查询分解模块:使用的全局查询语言基于SQL语言改编而来,为了处理城市交通异构数据中的轨迹数据、多种特殊情况添加针对轨迹数据的表映射函数以及格式转换函数;用户使用所述语言编写全局查询语句,查询分解模块通过对用户输入的全局查询语句进行解析,确定本次查询需要访问的数据源、数据库表和字段,解析过程通过建立查询树进行,查询树分别记录了全局查询语句中的概念、属性及本次查询所涉及的数据库表和字段;查询树建立的步骤为:首先对全局查询语句中的select、from、where三个子句进行解析,提取三个子句中涉及的本体概念和属性、表映射函数以及属性格式转换函数,然后从根节点开始逐层向下建立查询树,通过不断的调用本体与数据库映射模块解析查询语句中涉及的本体概念和属性所对应的数据库表和字段,完成查询树的建立;本模块可通过系统的外部接口调用,此时需要传入全局查询语句作为参数;用户也可以在查询界面的文本框内输入查询语句进行查询;子查询生成模块:根据查询分解模块生成的查询树,生成针对各交通数据源的子查询,为各数据源对应的包装器模块提供一次查询所需的全部信息;遍历查询树,提取本次查询涉及到的所有数据源,同时读取系统中包含的数据源配置文件(该文件保存了系统现有数据源的连接方式、数据内容简介等内容)中相应的信息,为所有涉及到的数据源生成一个包括子查询语句、数据源种类、数据库连接配置信息多种信息在内的子查询,并将该子查询发往包装器模块执行;包装器模块:每个数据源都有相应的包装器模块,从子查询生成模块接收到子查询后,通过子查询的转换、子查询执行和格式转换三个步骤得到子查询所指定的数据,并将该数据返回至查询结果合并模块进行连接,根据所对应的数据源种类的不同,不同数据源所对应的包装器模块分为SQL类包装器模块和非SQL类包装器模块两种,SQL类包装器模块首先需要将子查询转化成数据源能够直接执行的代码,然后读取子查询中的数据源连接配置信息,与数据源建立连接并执行查询,从而解决数据源系统异构问题,当数据源返回查询结果时,首先由各包装器模块根据子查询中的格式转换函数将来自数据源的结果进行格式转换,从而解决格式异构的问题,非SQL类包装器模块和SQL类包装器模块的工作过程基本相同,但在子查询转换步骤,非SQL类包装器模块只需解析子查询,不必生成数据源能够直接执行的代码;查询结果合并模块:收集各包装器模块发来的查询结果,并根据子查询之间的关系类别进行结果合并;该模块根据全局查询种类的不同,选择不同的策略进行结果合并,查询种类分为单概念查询、多概念查询,单概念查询又分为全部绑定和部分绑定两种情况:单概念全部绑定即全局查询语句的from子句中仅包含一个概念,且在根据映射规则使用数据库表和字段进行全局查询语句的概念和属性名称替换时,每一个属性都能找到其映射的数据库字段;部分绑定即在根据映射规则使用数据库表和字段进行全局查询语句的概念和属性名称替换时,至少有一个属性无法找到其映射的数据库字段,因此需要从描述同一批实体的其他数据源中获得这些字段;多概念查询即from子句中包含了多个概念的查询;在全局查询为单概念查询的情况下,对于全部绑定的子查询,简单的对多个结果集进行并操作得到一个新的结果集;对于部分绑定,需要对多个结果集进行连接操作,并去除其中的多余相交字段,从而获得最终结果集;在全局查询为多概念查询的情况下,需要首先对属于同概念的子查询进行全部或部分绑定的结果合并,再对不同概念的已合并结果进行再次合并,得到最终结果集;当调用本系统的外部接口进行查询时,最终结果集将会以list对象的方式返回给用户,用户也可以通过图形化的查询界面进行查询,此时查询结果将会以可视化表格的形式呈现给用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710873196.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top