[发明专利]一种机器学习中的数据隐私保护方法和系统有效
| 申请号: | 201810487937.4 | 申请日: | 2018-05-21 |
| 公开(公告)号: | CN108717514B | 公开(公告)日: | 2020-06-16 |
| 发明(设计)人: | 秦波;唐文易;赵素云;陈红 | 申请(专利权)人: | 中国人民大学 |
| 主分类号: | G06F21/60 | 分类号: | G06F21/60;H04L29/06 |
| 代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 徐宁;孙楠 |
| 地址: | 100872 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 机器 学习 中的 数据 隐私 保护 方法 系统 | ||
本发明涉及一种机器学习中的数据隐私保护方法和系统,其特征在于包括以下步骤:1)选择需要应用的加密算法及系统参数,生成密钥;2)对原始数据进行加密,产生相应的密文数据;3)使用密文数据对需要使用的机器学习模型进行训练和参数调整,得到最优机器学习模型;4)采用步骤2)方法将待预测或分类的原始数据用步骤1)中的密钥进行加密,输入最优机器学习模型,得到预测或分类结果。本发明结合保序/保分布性质的加密算法与机器学习模型,能够保护原始数据和机器学习模型。保序/保分布性质的加密算法输出的密文膨胀程度远低于全同态加密算法而且能够保持明文数据中的某些分布特征,使得机器学习效率较高且具有较好的扩展性。
技术领域
本发明涉及数据安全领域,特别是涉及一种机器学习中的数据隐私保护方法和系统。
背景技术
近年来,随着信息技术的不断发展,机器学习技术已经成为了大数据时代下的技术基石。机器学习技术根据已有的数据进行探索,发现数据中潜在的联系,依据所得到的模型进行分类或预测。众多的服务提供商将机器学习模型作为一种资源向公众提供服务,为人们带来了众多的便利。然而,当前的基于机器学习的服务忽略了公众的隐私问题。为了能够训练模型,服务提供商大量搜集用户信息,其中甚至包括了用户的隐私数据。用户在上传这些数据后失去了对数据的控制权,无法保证数据是否被滥用,造成隐私泄露的隐患。
目前应用于机器学习中的隐私保护方法主要有以下几个方面的安全问题:
1)目前的统计数据安全保护,主要集中于群体数据中保护个体数据不被提取,但是缺乏对数据内容本身的保护;
2)已有方案提出利用全同态加密技术处理数据并应用于机器学习,但全同态加密生成的密文长度远远大于明文长度,导致训练效率严重下降,因此全同态加密在实用性方面较差;
3)应用基于全同态加密的处理方法时,相应机器学习算法需要进行对应的修改,增加了模型的精度损失,同时也降低了该方法的可扩展性。
发明内容
针对上述问题,本发明的目的是提供一种机器学习中的数据隐私保护方法和系统,能够有效应用于机器学习领域的数据安全保护领域。
为实现上述目的,本发明采取以下技术方案:一种机器学习中的数据隐私保护方法,其特征在于其包括以下步骤:1)选择需要应用的加密算法及系统参数,生成密钥;2)对原始数据进行加密,产生相应的密文数据;3)使用密文数据对需要使用的机器学习模型进行训练和参数调整,得到最优机器学习模型;4)采用步骤2)方法将待预测或分类的原始数据用步骤1)中的密钥进行加密,输入最优机器学习模型,得到预测或分类结果。
所述步骤1)中,所述密钥的生成方法包括以下步骤:1.1)根据应用需求,选择具有保序或保分布性质的加密算法;1.2)根据选择的加密算法的要求及应用需求,选择系统参数;1.3)利用系统参数,产生相应的密钥并保存。
所述步骤2)中,所述密文数据的产生方法,包括以下步骤:2.1)对原始数据进行预处理,使其与所述步骤1)中选择的加密算法的明文空间相匹配;2.2)利用所述步骤1)中存储的密钥对预处理后的原始数据进行加密,生成相应的密文数据。
所述步骤3)中,所述最优机器学习模型的构建方法,包括以下步骤:3.1)选择需要使用的机器学习模型,并设定初始参数;3.2)利用所述步骤2)中产生的部分或全部样本密文数据对选择的机器学习模型进行训练,并根据训练结果对机器学习模型的初始参数进行调整,以达到最优效果,得到最优机器学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810487937.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





