[发明专利]一种基于四个维度进行数据质量监测及评价方法在审
申请号: | 201610115562.X | 申请日: | 2016-03-01 |
公开(公告)号: | CN105741196A | 公开(公告)日: | 2016-07-06 |
发明(设计)人: | 李莉丽;李光亚;陈诚;宋元成;于灏 | 申请(专利权)人: | 万达信息股份有限公司 |
主分类号: | G06Q50/10 | 分类号: | G06Q50/10;G06F17/10 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 四个 维度 进行 数据 质量 监测 评价 方法 | ||
技术领域
本发明涉及一种对数据质量进行检测及评价的方法。
背景技术
作为所有上层系统应用的基础,数据质量的好坏将直接影响到各类应用功能的使用效果。但是由于各接入平台建设水平参差不齐,上传数据的质和量都存在不同程度的差异,严重影响了数据在上层系统中的应用效果。
发明内容
本发明的目的是将提供一种对数据质量进行检测及评价的方法。
为了达到上述目的,本发明的技术方案是提供了一种基于四个维度进行数据质量监测及评价方法,其特征在于,包括以下步骤:
步骤1、将数据质量管理体系中所有可监控、可计算的数据指标在指标源中统一编码管理,从而形成监测指标,将所有监测指标分为完整性、一致性、规范性和及时性四个维度进行监测,其中:
完整性是为了监测当前数据质量管理体系是否将业务日期内的数据完整上传,为了便于数据质量问题追溯,将完整性监测进一步细分为关联性和业务约束性两类;
一致性是为了监测当前数据质量管理体系上传的统计指标是否与明细报告汇总值相符;
规范性是为了监测当前数据质量管理体系上传的数据是否满足接口中定义的数据规范性要求;
及时性是为了监测当前数据质量管理体系上传的数据是否在业务数据产生后及时上传;
步骤2、计算隶属于关联性的各监测指标的关联率,计算隶属于业务约束性的各监测指标的约束符合率,计算隶属于一致性的各监测指标的明细数据统计结果与业务运营一致率,计算隶属于规范性的各监测指标的规范率,计算隶属于及时性的各监测指标的平均差异天数;
步骤3、分别为关联率、约束符合率、明细数据统计结果与业务运营一致率、规范率、平均差异天数设定不同的等分区间,等分区间对应的最高分值为MAX,根据该得分区间计算分别隶属于关联性、业务约束性、一致性、规范性及及时性的各监测指标的得分;
步骤4、将一致性得分的满分设定为A,计算得到隶属于一致性的N1个监测指标的得分的总和sum1,则将单指标体系得分1的权重,即单指标体系权重1,设为a;
计算得到隶属于关联性的N21个监测指标的得分的总和sum21,计算得到隶属于业务约束性的N22个监测指标的得分的总和sum22,则将单指标体系得分2的权重,即单指标体系权重2,设为b;
计算得到隶属于规范性的N3个监测指标的得分的总和sum3,则将单指标体系得分3的权重,即单指标体系权重3,设为c;
计算得到隶属于及时性的N4个监测指标的得分的总和sum4,则将单指标体系得分4的权重,即单指标体系权重4,设为d;
步骤5、计算得到当前数据质量管理体系的评价得分P,将当前数据质量管理体系的上次评价得分记为P-1,则有:
优选地,在所述步骤5中,所述平滑系数初始化为120%。
优选地,在所述步骤5之后,还包括:
步骤6、设目标区域内有n家机构运行了数据质量管理体系,通过所述步骤1至步骤5分别计算每家机构的数据质量管理体系的评价得分,其中,第i家机构的数据质量管理体系的评价得分为Pi,则目标区域的数据质量评价得分为PD,则有
本发明提出了一种基于四个维度的数据质量监测及评价体系,该体系采用分级量化的方法,向不同的接入平台提供技术支撑和管理措施,从数据一致性、完整性、规范性、及时性四个维度全面监测及提高数据上传质量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于万达信息股份有限公司,未经万达信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610115562.X/2.html,转载请声明来源钻瓜专利网。