[发明专利]数据质量检测方法及装置在审
申请号: | 201811559820.9 | 申请日: | 2018-12-19 |
公开(公告)号: | CN109685360A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 金日海;王怡君;王双;刘俊良 | 申请(专利权)人: | 成都四方伟业软件股份有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 陈治位 |
地址: | 610000 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据信息 数据质量检测 检测算法 分布式计算 分析数据 检测结果 检测 数据分析技术 获取数据 检测数据 检测条件 预先设置 | ||
本发明提供一种数据质量检测方法及装置,涉及数据分析技术领域。该数据质量检测方法包括:通过获取数据信息和检测算法,数据信息为预检测的数据信息,检测算法用于检测数据信息的质量;并根据检测算法,采用分布式计算的方式对数据信息进行检测,获取检测结果;最后根据检测结果和预先设置的检测条件,确定数据信息的质量。通过分布式计算的方式对数据信息进行检测,提高分析数据质量的速度,从而可以提高分析数据质量的效率。
技术领域
本发明涉及数据分析技术领域,具体而言,涉及一种数据质量检测方法及装置。
背景技术
随着大数据时代的到来,信息数据呈爆炸性增长,各个行业或者企业在运营的过程中产生的有价值的数据越来越多,因此,对于数据质量的提升也变得越来越重要。
相关技术中,具有数据质量检测功能的软件,可以获取需要进行质量检测的数据信息,并依次对该数据信息的质量进行分析,最终可以向用户展示数据信息的质量分析的结果。
但是,相关技术中,依次对该数据信息的质量进行分析时,会出现分析速度较慢,导致分析效率过低的问题。
发明内容
本发明的目的在于,针对上述现有技术中的不足,提供一种数据质量检测方法及装置,以解决相关技术中,依次对该数据信息的质量进行分析时,会出现分析速度较慢,导致分析效率过低的问题。
为实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种数据质量检测方法,包括:
获取数据信息和检测算法,所述数据信息为预检测的数据信息,所述检测算法用于检测所述数据信息的质量;
根据所述检测算法,采用分布式计算的方式对所述数据信息进行检测,获取检测结果;
根据所述检测结果和预先设置的检测条件,确定所述数据信息的质量。
进一步地,在所述获取检测算法之前,所述方法还包括:
获取检测规则信息,所述检测规则信息用于指示检测所述数据信息的规则;
所述获取检测算法,包括:
根据所述检测规则信息和预先设置的算法模型,生成检测算法。
进一步地,在所述根据所述检测算法对所述数据信息进行检测,获取检测结果之前,所述方法还包括:
通过所述检测算法关联所述检测规则信息和所述数据信息。
进一步地,所述根据所述检测结果和预先设置的检测条件,确定所述数据信息的质量,包括:
若所述检测结果满足预先设置的检测条件,则展示界面信息,所述界面信息用于表示所述数据信息未存在质量问题;
若所述检测结果不满足预先设置的检测条件,则展示告警信息,所述告警信息用于表示所述数据信息存在质量问题。
进一步地,所述获取数据信息,包括:
获取原始数据,所述原始数据为预检测的数据;
根据预先设置的操作,对所述原始数据进行筛选,得到数据信息。
第二方面,本发明实施例还提供了一种数据质量检测装置,所述装置包括:
第一获取模块,用于获取数据信息和检测算法,所述数据信息为预检测的数据信息,所述检测算法用于检测所述数据信息的质量;
检测模块,用于根据所述检测算法,采用分布式计算的方式对所述数据信息进行检测,获取检测结果;
确定模块,用于根据所述检测结果和预先设置的检测条件,确定所述数据信息的质量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都四方伟业软件股份有限公司,未经成都四方伟业软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811559820.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理