[发明专利]基于元数据的数据质量校验系统在审
| 申请号: | 202210824074.1 | 申请日: | 2022-07-14 |
| 公开(公告)号: | CN115292298A | 公开(公告)日: | 2022-11-04 |
| 发明(设计)人: | 刘磊;徐奎东;毛志军;汤士伟;谢志宇;徐瀚昌;姜锋;沈欢;杨秋芬;潘宁;张丽;马玉刚;党忠妍;汪森然;王卫新;周融;王奇;韦法林;田亚龙;张志航;吕军成 | 申请(专利权)人: | 万达信息股份有限公司 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2457;G06F16/22;G06F16/28;G06F11/34 |
| 代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
| 地址: | 200233 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 数据 质量 校验 系统 | ||
1.一种基于元数据的数据质量校验系统,其特征在于,包括元数据管理子系统、数据质量评估子系统以及数据质量展示子系统,其中:
元数据管理子系统根据质量校验分类定义元数据模型,配置好数据源后,元数据管理子系统把数据源的数据库、表、字段信息存储到元数据库中,再基于采集到的数据库、表、字段信息和元数据模型,生成具体的不同规范类型的数据质量考核指标,其中:
元数据模型通过类Class来描述,由基本信息类baseInfo、约束性类constraint、评估配置类evaluation构成,在基本信息类baseInfo中定义元数据的基本信息,在约束性类constraint中实现对基础标准规范性的定义以及面向数据集的约束性的定义,在评估配置类evaluation中配置评估参数;
数据质量考核指标分为约束性、关联性、规范性、及时性和稳定性;
数据质量评估子系统基于元数据管理子系统生成的数据质量考核指标,从所有数据质量考核指标中选择一个或多个元数据指标生成数据质量评估模型,再对数据质量评估模型进行分析计算,得到数据质量控制指标考核结果,其中:
数据质量评估模型是需求,选择一个或多个元数据映射生成的元数据指标来生成一套数据质量评分标准;
数据质量评估子系统对于属于关联性的元数据指标的考核方法是计算该元数据指标的关联率,关联率=M/N,某机构上传至数据质量校验系统的表T1包含N条表数据,其中有M条表数据能够关联上同一机构上传的表T2;
数据质量评估子系统对于属于约束性的元数据指标的考核方法是计算该元数据指标的约束符合率=M/N,某机构上传至数据质量校验系统的表T1包含N条表数据,其中有M条表数据能够找到同一机构上传的表T2记录;
数据质量评估子系统对于属于一致性的元数据指标的考核方法是计算该元数据指标的明细数据统计结果与业务运营一致率=(TOTAL1-TOTAL2)/TOTAL1,某机构通过表T1向数据质量校验系统上报数据量是TOTAL1,同一机构通过表T2向数据质量校验系统上报数据量是TOTAL2;
数据质量评估子系统对于属于规范性的元数据指标的考核方法是计算该元数据指标的规范率=M/N,某机构上传至数据质量校验系统的表T1包含N条表数据,其中目标字段填报规范的记录条数为M条;
数据质量评估子系统对于属于及时性的元数据指标的考核方法是计算该元数据指标的平均差异天数=M/N,某机构上传至数据质量校验系统的表T1包含N条表数据,该机构最后一次上传时间与业务时间的差距之和为M天;
数据质量评估子系统对于属于稳定性的元数据指标的考核方法是计算非断传天数的比例=(N-M)÷N,某机构上传至数据质量校验系统的天数N天,断传天数为M天;
数据质量展示子系统,用于展示数据质量控制指标考核结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于万达信息股份有限公司,未经万达信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210824074.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





