[发明专利]链接数据集在审

专利信息
申请号: 201580081319.4 申请日: 2015-05-28
公开(公告)号: CN107851098A 公开(公告)日: 2018-03-27
发明(设计)人: 里沙尔德·霍克斯;路易斯·米格尔·瓦克罗·冈萨雷斯;劳伦斯·威尔科克 申请(专利权)人: 慧与发展有限责任合伙企业
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京德琦知识产权代理有限公司11018 代理人: 郭艳芳,康泉
地址: 美国德*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 链接 数据
【说明书】:

背景技术

彼此之间没有可导航关系的数据集可以通过将一个数据集中的对象(实体)与另一数据集中共享共同属性的对象相关联来进行联合。

附图说明

现在将参考附图并通过非限制性示例的方式来描述各示例,其中:

图1是链接两个数据集的方法的示例的流程图;

图2是链接两个数据集的方法的示例的流程图;

图3是链接创建机制的描述的示例;

图4是链接创建机制的示例的流程图;

图5是链接两个数据集的方法的示例;

图6是维护两个数据集之间的链接的方法的示例;以及

图7是用于链接两个数据集的示例装置的示意图。

具体实施方式

存在着用于对数据集进行联合并且用于实现跨联合数据集的查询的多种技术,包括记录联动、关系数据库、概率数据库、演绎数据库和复用图。这些技术中的每一种都涉及创建将被联合的数据集中的每个数据集的模型。术语“模型”旨在指代系统中的底层实体、它们随时间的演变以及它们之间的相互作用的简化表示。

记录联动技术对同一个表中或者数据库不同表中的重复记录进行检测。这些技术中的多种技术允许用户根据哪两个项目将被标记为相同来指定相似性函数。对这些相似性函数加以控制的规则通常被硬编码,因此非专业人士难以对相似性函数进行调整。

概率数据库包括:(1)不完整关系R的集合,其中具有缺失或不确定的数据;(2)跨越这些关系的所有可能的完整版本的概率分布F,也称为可能世界。不完整关系被定义在概型(schema)上,该概型包含有包括R中的所有候选和外键属性在内的确定性属性的(非空)子集、以及概率属性的子集。确定性属性没有与其任何值相关联的不确定性,而概率属性可以包含缺失或不确定的值。这些缺失或不确定的值的概率分布F由诸如贝叶斯网络(Bayesian Network)或马尔可夫随机场(Markov Random Field)等概率图形模型来表示。每个可能的数据库实例都是R中的缺失和不确定的数据的潜在完成。已经提出了一组SQL扩展以使概率数据库能够选择被用于在单个数据库管理系统内创建数据集之间的联合的最佳过程。然而,这些扩展是以高度命令的方式来表达的,这使得非专业人士难以理解和使用。

演绎数据库是能够基于存储在演绎数据库中的规则和事实来执行演绎(即得出更多事实)的数据库系统。演绎数据库代表诸如Prolog等逻辑编程语与关系数据库之间的混合。其结果是,能够使用声明性语言来查询演绎数据库。演绎数据库中的联合可以被看作是逻辑推理过程“采取行动(takes down to earth)”并映射到数据库上的特定动作的模板(templates)。与所有数据库系统一样,演绎数据库中的联合仅包括结果集,而不是数据模型本身的一部分。因此,联合是针对每个查询而重新计算的。

复用图(Multiplex graphs)是一种数据模型,其能够维护跨越图的联合,这是因为联合的结果成为该数据模型本身的一部分。这有助于构建跨越复用图(或多个复用图)的查询。然而,复用图的创建是一个手动过程,它涉及以特定方式来创建复用链接。用户明确地对如何创建跨图链接进行建模,并且响应于对底层图的变更而手动更新这些链接。

在下面的描述中,术语“等价性(equivalence)”被用于指代第一数据集中的实体或实体的属性被认为与第二数据集中的实体或实体的属性相同。用于确定实体或属性是否相同的标准可能会例如依赖于特定应用、用户偏好等而发生变化,因此给定的实体/属性对可能会在一个示例中包含等价性,但是在另一个示例中不包含等价性。

在下面的描述中,术语“高级”被用来指代从计算机或处理的细节中强抽象出的语言,该语言被用来描述该计算机或处理。因此,为了说明的目的,高级语言被理解为查询语言,其并未规定创建联合所要遵循的一系列命令,而是更接近于非技术用户指定这种操作的方式。这样的一个示例可以使用自然语言元素。因此,可以容易地使用高级语言,而无需对将运行查询的底层计算机系统或处理有任何详细的了解。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧与发展有限责任合伙企业,未经慧与发展有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201580081319.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top