[发明专利]用于检测数据源中的偏差的方法、设备和计算机程序有效
申请号: | 201380057211.2 | 申请日: | 2013-09-05 |
公开(公告)号: | CN104756113B | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 帕特里克·古林;安德列斯·托斯滕森 | 申请(专利权)人: | 瑞典爱立信有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 穆童 |
地址: | 瑞典斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 数据源 中的 偏差 方法 设备 计算机 程序 | ||
1.一种用于检测至少两个不同数据源的数据之间的偏差的方法,每一个数据源包括多个数据公布,每一个数据公布包括多个数据值,所述方法包括:
标识(102)数据公布对,每一对包括第一数据源中的第一数据公布和第二数据源中的第二数据公布,其中,针对数据公布对中的第一数据公布和第二数据公布的唯一匹配数据属性,数据值的子集相等;
确定(104)所述多个数据公布对中的每一个数据公布对中的第一数据公布的数据值和第二数据公布的数据值的多个组合中的个体组合是否满足多个关系模式算法中的个体关系模式算法;
确定(106)针对所述多个数据公布对所确定的关系模式算法的满足的符合性水平;
基于所确定的符合性水平,从所述多个关系模式算法中选择(108)关系模式算法;
关于所选择的关系模式算法,分析(110)个体数据公布对的数据值组合,以检测个体数据公布对中不符合所选择的关系模式算法的数据值组合,不符合指示(114)个体数据公布对的数据的可能偏差。
2.根据权利要求1所述的方法,其中,所述符合性水平是针对与所述多个数据公布对的相同数据属性组合有关的数据值的组合来确定(106)的。
3.根据权利要求2所述的方法,其中,确定(104)满足包括:针对所述多个数据公布对中的每一个数据公布对,在比较矩阵Hxy中将所述多个数据公布对中的每一个数据公布对中的第一数据公布的数据值与第二数据公布的数据值进行组合,其中,x指示所述第一数据公布的数据属性的数量并且同时指示所述矩阵的列的数量,y指示所述第二数据公布的数据属性的数量并且同时指示所述矩阵的行的数量。
4.根据权利要求3所述的方法,其中,针对所述多个数据公布对,所述相同数据属性组合涉及所述比较矩阵Hxy中的相同位置nab,其中,a=整数1至x中的任意一个,b=整数1至y中的任意一个。
5.根据权利要求1所述的方法,其中,选择(108)包括:基于所确定的符合性水平,针对与所述多个数据公布对的相同数据属性组合有关的数据值的组合分别选择关系模式算法。
6.根据权利要求1所述的方法,还包括:
检测(202)所述第一数据源中数据值唯一的至少一个数据属性;以及
检测(204)所述第二数据源中数据值唯一的至少一个数据属性,以及
从所检测的所述第一数据源中的至少一个数据属性和所检测的所述第二数据源中的至少一个数据属性中选择(206)所述第一数据源中具有最多共同数据值的数据属性和所述第二数据源中具有最多共同数据值的数据属性,作为所述第一数据源的唯一匹配数据属性和所述第二数据源的唯一匹配数据属性。
7.根据权利要求1所述的方法,还包括:
按所述唯一匹配数据属性的数据值的递增或递减数据值顺序对所述第一数据源和/或所述第二数据源中的数据公布进行排序。
8.根据权利要求1所述的方法,还包括:
针对所述第一数据源,通过针对确定所述第一数据源的数据属性的数据值的特性的值类型算法集暴露数据值来检测(302)所述数据属性的元数据,
在所述第二数据源中,通过针对确定数据属性的数据值的特性的值类型算法集暴露数据值来检测(304)所述数据属性的元数据。
9.根据权利要求6或7或8所述的方法,其中,检测(302)所述第一数据源中的元数据包括:检测(202)所述第一数据源中数据值唯一的至少一个数据属性,以及检测(304)所述第二数据源中的元数据包括:检测(204)所述第二数据源中数据值唯一的至少一个数据属性。
10.根据权利要求1所述的方法,其中,基于所确定的符合性水平从所述多个关系模式算法中选择(108)关系模式算法仅当所述多个关系模式算法中存在所确定的符合性水平高于定义阈值的关系模式算法时才执行。
11.根据权利要求10所述的方法,其中,当所述多个关系模式算法中存在多于一个所确定的符合性水平高于所述定义阈值的关系模式算法时,选择(108)关系模式算法包括:使用优先级算法来决定选择所述多于一个关系模式算法中的哪一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞典爱立信有限公司,未经瑞典爱立信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380057211.2/1.html,转载请声明来源钻瓜专利网。