[发明专利]一种数据质量检查规则有效性评估及反馈优化方法、存储介质及系统在审
申请号: | 202210606874.6 | 申请日: | 2022-05-31 |
公开(公告)号: | CN114926057A | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 唐力;赵志宇;徐欢;杨秋勇;徐敏;高伟;李劲松 | 申请(专利权)人: | 云南电网有限责任公司信息中心 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/04;G06K9/62;G06N5/02 |
代理公司: | 广州永华专利代理有限公司 44478 | 代理人: | 梁国锐 |
地址: | 650214 云南省昆*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 质量 检查 规则 有效性 评估 反馈 优化 方法 存储 介质 系统 | ||
本发明提供一种数据质量检查规则有效性评估及反馈优化方法、存储介质及系统,该方法包括:从数据质量检查规则集当中选取出需评估的第一数据质量检查规则,根据多项质量规则评估指标构建数据质量检查规则评估体系,利用各项质量规则评估指标对第一数据质量检查规则进行评估得到评分,结合各项质量规则评估指标的评分和权重分配情况计算得到有效性评估结果,若有效性评估结果没有达到第一预设程度则从数据质量知识库中找出相似度最高的第二数据质量检查规则,若该相似度达到第二预设程度则利用第二数据质量检查规则所关联的优化知识对第一数据质量检查规则进行优化,然后根据优化后的第一数据质量检查规则更新数据质量检查规则集。
技术领域
本发明涉及数据处理技术领域,特别涉及一种数据质量检查规则有效性评估及反馈优化方法、存储介质及系统。
背景技术
数据质量检查规则集是指用户根据数据标准定义的数据质量检查规则的集合,其中的数据质量检查规则可供数据质量引擎读取并执行从而进行数据质量检查,然后数据质量引擎将检查产生的结果存放在监控结果表中供用户监控。
不同类型数据所关联的数据标准可能有所不同,若在数据质量检查过程中数据质量引擎所读取到的数据质量检查规则与待进行数据质量检查的数据所关联的数据标准不相符,则利用该读取到的数据质量检查规则进行数据质量检查所得到的结果会与实际有所偏差。例如,某字段数据的字符长度为10,其所关联的数据标准为字符长度不得超过9,根据该数据标准定义的数据质量检查规则就是检查字段数据的字符长度是否超过9,那么利用该数据质量检查规则对该字段数据进行数据质量检查得到的结果实际应是不通过,但是,数据质量检查规则集当中可能不存在检查字段数据的字符长度是否超过9的数据质量检查规则,那么在数据质量检查的过程中,数据质量引擎读取到的数据质量检查规则就不是检查字段数据的字符长度是否超过9,而是相似度最高的其他数据质量检查规则,例如是检查字段数据的字符长度是否超过10,那么利用该读取到的数据质量检查规则进行数据质量检查所得到的结果就是通过,该结果与实际有所偏差。
发明内容
本发明要解决的技术问题是如何减少数据质量检查的结果偏差。
为解决上述技术问题,本发明提供一种数据质量检查规则有效性评估及反馈优化方法,包括如下步骤:
A.从数据质量检查规则集当中选取出需评估的第一数据质量检查规则;
B.获取能分别从不同维度对所述第一数据质量检查规则进行评估的多项质量规则评估指标,根据所述多项质量规则评估指标构建数据质量检查规则评估体系;
C.利用所述数据质量检查规则评估体系中的各项质量规则评估指标对所述第一数据质量检查规则进行评估,得到各项质量规则评估指标的评分;
D.获取各项质量规则评估指标的权重分配情况,结合各项质量规则评估指标的评分计算得到所述第一数据质量检查规则的有效性评估结果;
E.获取分别对预设的多条数据质量检查规则进行优化操作所生成的多条优化知识,根据所述多条优化知识构建数据质量知识库;
F.判断所述有效性评估结果是否达到第一预设程度,若没有达到则分析所述数据质量知识库当中各条优化知识分别关联的其他数据质量检查规则与所述第一数据质量检查规则之间的相似度,找出相似度最高的第二数据质量检查规则;
G.判断所述第一数据质量检查规则与所述第二数据质量检查规则之间的相似度是否达到第二预设程度,若达到则利用所述第二数据质量检查规则所关联的优化知识对所述第一数据质量检查规则进行优化,若没有达到则获取用户输入的针对所述第一数据质量检查规则的优化知识进行优化,并将针对所述第一数据质量检查规则的优化知识新增到所述数据质量知识库中;
H.根据优化后的第一数据质量检查规则更新所述数据质量检查规则集。
优选地,所述质量规则评估指标包括规范性指标、运行指标和稽核指标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南电网有限责任公司信息中心,未经云南电网有限责任公司信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210606874.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无人机集群弹性安全编队方法
- 下一篇:钢件表面发黑的处理工艺
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置