[发明专利]用于数据价值优化的匿名化模型推荐方法及设备在审
申请号: | 202210921066.9 | 申请日: | 2022-08-02 |
公开(公告)号: | CN115098887A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 张罗刚;张宏国;马超;于海宁;孙迎港;颜亭 | 申请(专利权)人: | 哈尔滨理工大学;中数(深圳)时代科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06Q10/06 |
代理公司: | 哈尔滨市晨晟知识产权代理有限公司 23219 | 代理人: | 刘文权 |
地址: | 150006 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 数据 价值 优化 匿名 模型 推荐 方法 设备 | ||
本发明提出一种用于数据价值优化的匿名化模型推荐方法、设备,包括:导入原始数据,根据原始数据的类型和级别,确定原始数据的风险阈值;根据用户需求,判断匿名化方法为正向辅助推荐或反向主动推荐;分别根据选择的匿名化方法匹配一组候选配置方案,并对原始数据进行匿名化处理;对匿名化处理后的数据进行风险分析,保留符合风险阈值的数据;再对数据进行效用分析,选择其中最大值对应的匿名后数据作为输出;并将结果加入历史配置方案资源池。本发明能够在保证数据安全的前提下,在对数据进行匿名化处理后使得数据价值最大化。
技术领域
本申请涉及数据隐私保护技术领域,尤其涉及一种用于数据价值优化的匿名化模型推荐方法及设备。
背景技术
在互联网、云计算等技术迅速发展的背景下,数据要素成为继土地、劳动、资产、技术之后的第五大生产要素。数据的流通推动着医疗、金融等行业的迅速发展,但与此同时,数据流通过程中数据的隐私泄露风险也急剧上升。通常,在数据流通之前,会对数据进行脱敏处理。但是脱敏之后的数据的可用性会大大降低,即该数据的价值会大幅减少。因此需要找到一种方法,能够在保证数据安全的情况下最大化数据的可用性,最大限度保留数据价值。
匿名化技术是用于解决因链接攻击而造成隐私泄露问题的主要技术之一。目前的匿名化方法主要是通过对原始数据进行泛化和抑制,使得攻击者无法识别到数据源中的个人。匿名化技术与一般的扭曲、扰乱和随机化的方法不同,使用匿名化技术得到的匿名后的数据保存了数据的真实性。而匿名化模型的类型多、参数多,且参数之间存在潜在的相关性关系,导致数据处理者进行参数配置时,非常耗时且极易发生错误。
发明内容
有鉴于此,本申请提出一种用于数据价值优化的匿名化模型推荐方法及设备,可以在对数据进行匿名化处理,保证数据安全的前提下实现数据要素的价值保持,使得数据价值最大化。
一方面,本发明提出一种用于数据价值优化的匿名化模型推荐方法,包括:
导入原始数据,根据原始数据的类型和级别,确定原始数据的风险阈值rt;
根据用户需求,判断匿名化方法为正向辅助推荐或反向主动推荐;
若为正向辅助推荐,则获取配置参数p0,所述配置参数p0包括隐私模型、隐私模型参数、抑制限制率及属性权重;并根据KNN算法,在历史配置方案资源池中,基于数据特征F、配置参数p0和风险阈值rt自动匹配一组候选配置参数,并将获取的配置参数p0和自动匹配的一组候选配置参数记为P=[p0,p1,p2,p3……,pn];
若为反向主动推荐,则获取设定的效用的期望值ut;使用K-Means算法在历史配置方案资源池中,基于数据特征F、风险阈值rt及效用的期望值ut,匹配一组候选配置方案Ps=[ps1,ps2,ps3,……,psn];
使用正向辅助推荐的候选配置参数P或反向主动推荐的候选配置参数Ps中的配置方案分别对原始数据进行匿名化处理;其中使用正向辅助推荐的候选配置参数P对原始数据进行匿名化处理后的数据记为D=[d0,d1,d2,d3……dn],使用反向主动推荐的候选配置参数Ps对原始数据进行匿名化处理后的数据记为Ds=[ds1,ds2,ds3,……,dsn];
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学;中数(深圳)时代科技有限公司,未经哈尔滨理工大学;中数(深圳)时代科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210921066.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耐高温阻燃光纤光缆
- 下一篇:一种竹木结构折叠悬梯
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置