[发明专利]基于改进AHP的数据元件质量动态评估方法及设备在审
申请号: | 202210213627.X | 申请日: | 2022-03-07 |
公开(公告)号: | CN114298614A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 陆志鹏;王希勤;朱立锋;郑曦;周崇毅;国丽;刘国栋;赵健;温彦龙;李勇;乔亲旺;胡成盛;胡俊;谢冬水 | 申请(专利权)人: | 中国电子信息产业集团有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 张然 |
地址: | 100190 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 ahp 数据 元件 质量 动态 评估 方法 设备 | ||
本发明公开了一种基于改进AHP的数据元件质量动态评估方法及设备,所述方法包括:基于数据元件,构建多层次数据元件质量评估体系;利用层次分析法AHP,构建数据元件质量评估体系的权重矩阵;运行数据元件,计算数据元件结果的信息熵值;基于信息熵值,分别计算数据元件模型以及数据元件结果的质量评分修正因子,以计算数据元件模型的当前质量评分以及数据元件结果的当前质量评分;基于数据资源的当前质量评分、数据元件模型的当前质量评分以及数据元件结果的当前质量评分,结合权重矩阵,计算数据元件的当前质量评估值。本发明降低了主观因素对AHP所得权重排序的影响,从而使得数据元件质量评估结果接近真实情况。
技术领域
本发明涉及数据元件评估技术领域,尤其涉及一种基于改进AHP的数据元件质量动态评估方法及设备。
背景技术
数据元件是原始数据资源到数据应用之间的标准中间态,具备安全属性和价值属性,一组数据元件能够规模化应用到不同的场景。数据元件相较于原始数据,不同的数据元件从安全、合规、标准化等方面经过了脱敏、降密级、预处理、特征提取、特征优化等一系列加工处理操作形成标准的初级数据产品。比如相亲市场中,客户需要了解相亲对方的婚姻状况、收入情况、是否有犯罪记录等信息,而婚姻情况、收入明细、犯罪记录等既属于原始数据资源,又属于敏感个人信息,不能直接流通,通过构建是否有离复婚史、收入特征、是否有犯罪记录等特征,经过加密存储、加密传输、加密加工、主体告知或授权使用,形成安全合规的数据元件。数据元件质量的好坏依赖于所使用的原始数据资源质量、数据元件模型的质量及数据元件结果的质量。
当前数据元件质量评估主要以专家打分的方式为主,十分依赖专家自身的知识水平。在实际应用过程中,难以客观的对不同领域的数据进行质量评价,甚至同一领域数据评估结果也会有很大差异,评估流程无法量化,难以构建科学模型。而且这种模式自动化水平不足,需要大量的人工评判工作,且无法根据数据更新情况动态调整评价结果,严重制约了数据元件质量评估的标准化水平,从而不利于数据元件大规模流通。
发明内容
本发明实施例提供一种基于改进AHP的数据元件质量动态评估方法及设备,用以解决现有技术中数据元件质量评估效率差、效果不佳的问题。
根据本发明实施例的基于改进AHP的数据元件质量动态评估方法,包括:
基于数据元件,从数据资源、数据元件模型以及数据元件结果三方面出发,构建多层次数据元件质量评估体系;
利用层次分析法AHP,构建所述数据元件质量评估体系的权重矩阵;
运行所述数据元件,以获取数据元件结果,并基于所述数据元件结果,采用熵权法,计算所述数据元件结果的信息熵值;
基于所述信息熵值,根据公式1-2,分别计算所述数据元件模型以及所述数据元件结果的质量评分修正因子:
公式1,
公式2,
其中,表示所述信息熵值,表示所述数据元件使用的数据资源的当前质量评分,表示预设数据资源质量较其他指标权重阈值,均为预设权重值;
基于所述和所述,计算所述数据元件模型的当前质量评分以及所述数据元件结果的当前质量评分;
基于所述数据资源的当前质量评分、所述数据元件模型的当前质量评分以及所述数据元件结果的当前质量评分,结合所述权重矩阵,计算所述数据元件的当前质量评估值。
根据本发明的一些实施例,所述数据资源的质量评价指标包括:数据资源完整性、数据资源规范性、 数据资源准确性、数据资源唯一性、数据资源一致性、以及数据资源时效性;
所述数据元件模型的质量评价指标包括:数据元件模型准确性、和数据元件模型适用性;
所述数据元件结果的质量评价指标包括:数据元件结果规范性、数据元件结果安全性、以及数据元件结果适用性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子信息产业集团有限公司,未经中国电子信息产业集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210213627.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置