[发明专利]一种多源异构割裂结构化数据转化方法及系统在审

专利信息
申请号: 201710188581.X 申请日: 2017-03-27
公开(公告)号: CN107168989A 公开(公告)日: 2017-09-15
发明(设计)人: 赵淦森;吴杰超;庄序填;任雪琦;杨雪芬;席云;胡波;王欣明;聂瑞华;唐华 申请(专利权)人: 华南师范大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 广州嘉权专利商标事务所有限公司44205 代理人: 胡辉
地址: 510631 *** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多源异构 割裂 结构 数据 转化 方法 系统
【说明书】:

技术领域

发明涉及数据处理技术领域,尤其涉及一种多源异构割裂结构化数据转化方法及系统。

背景技术

据IBM公司的分析,人类文明有90%的数据是在过去两年内产生的,到2020年,全世界所产生的数据规模将达到今天的44倍。而我国截至2015年12月,已经拥有6.88亿的互联网用户 ,13.06亿的手机用户 ,每天可产生海量的数据。大数据无论在大型企业,还是政府部门都发挥着相当的作用。

2015年8月国务院印发了《促进大数据发展行动纲要》(国发〔2015〕50号),明确强调“数据已成为国家基础性战略资源,大数据正日益对全球生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生重要影响”。该文件同时指出大数据的特点为“数量巨大、来源分散、格式多样”,要求通过“采集、存储和关联分析,从中发现新知识、创造新价值”。

在体量巨大之外,大数据的明显特征是“碎片化”。具体来说是同一个数据可能碎片化存储或者来源于不同的数据源,相互独立;同一对象的不同侧面和不同维度的数据碎片化存储于不同的地方,互不关联;同一侧面和维度的数据可能采用不同的结构和模式进行组织和表示,互不相同。总结而言,大数据的碎片化形成了多源、割裂、异构的数据形态。

因此,如何将多源、割裂、异构的数据融合是一个值得研究的问题。而在现有的系统中,对结构化数据的描述都具有独特性的。在多源的情况下,相同的信息在不同的系统具有不同的描述方式及不同的表达结构。因此,现有的数据融合及实体识别的方法都是基于特定结构的数据,一旦用于不同结构的数据,算法效果将大大降低。所以,在数据融合的过程中,不同的描述方式严重影响数据融合的质量及增加了数据融合的成本。

现有的技术主要采用基于模式集成方式,即通过模式转换实现不同数据库之间的转换,只能描述数据模型的结构信息,缺少了语义信息。同时根据1所说,现有的数据融合及实体识别的方法都是基于特定结构的数据。而Yodsawalai Chodpathumwan提出的一种独立表达方式的转换方法只针对于特定的两个能转换的数据库。但在现实的情况中,并不是所有的数据库的图结构都可以相互转换的。

发明内容

为了解决上述技术问题,本发明的目的是提供一种能提高信息完整度的一种多源异构割裂结构化数据转化方法及系统。

本发明所采取的技术方案是:

一种多源异构割裂结构化数据转化方法,包括以下步骤:

将多个数据源映射到对应的局部映射图;

将各局部映射图组成总映射图。

作为所述的一种多源异构割裂结构化数据转化方法的进一步改进,所述的将多个数据源映射到对应的局部关系图,这一步骤具体包括:

将数据源的各数据表分别映射到对应的局部映射图中对应的节点;

将数据源中各数据表的外键引用关系分别映射到对应的局部映射图中对应的边。

作为所述的一种多源异构割裂结构化数据转化方法的进一步改进,所述的节点包括结构信息和语义信息。

作为所述的一种多源异构割裂结构化数据转化方法的进一步改进,所述结构信息包括表结构、字段、字段类型和具体值。

作为所述的一种多源异构割裂结构化数据转化方法的进一步改进,所述语义信息包括数据表名、属性名称、具体属性和约束条件。

本发明所采用的另一技术方案是:

一种多源异构割裂结构化数据转化系统,包括:

局部映射单元,用于将多个数据源映射到对应的局部映射图;

映射组成单元,用于将各局部映射图组成总映射图。

作为所述的一种多源异构割裂结构化数据转化系统的进一步改进,所述的局部映射单元具体包括:

节点映射单元,用于将数据源的各数据表分别映射到对应的局部映射图中对应的节点;

边映射单元,用于将数据源中各数据表的外键引用关系分别映射到对应的局部映射图中对应的边。

作为所述的一种多源异构割裂结构化数据转化系统的进一步改进,所述的节点包括结构信息和语义信息。

作为所述的一种多源异构割裂结构化数据转化系统的进一步改进,所述结构信息包括表结构、字段、字段类型和具体值。

作为所述的一种多源异构割裂结构化数据转化系统的进一步改进,所述语义信息包括数据表名、属性名称、具体属性和约束条件。

本发明的有益效果是:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710188581.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top