[发明专利]一种基于安全多方计算的特征融合隐私保护方法在审
申请号: | 202210183933.3 | 申请日: | 2022-02-28 |
公开(公告)号: | CN114614983A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 杨小川;张全新;杨洁;韩伟锋;张合沛;苏兵;马秀苹;谭毓安 | 申请(专利权)人: | 北京理工大学 |
主分类号: | H04L9/08 | 分类号: | H04L9/08;H04L9/40 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 张利萍 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 安全 多方 计算 特征 融合 隐私 保护 方法 | ||
本发明涉及一种基于安全多方计算的特征融合隐私保护方法,属于数据安全技术领域。本方法基于安全多方计算,提供了一种安全的多方联合机器学习数据预处理方案,采用针对任意多参与方的安全多方计算架构,能够在特征融合阶段保护隐私数据,使得外包计算方只获得融合后的特征,而各方均不泄露隐私。同时,只需要在特征融合阶段执行一次,而无需在后续训练过程的迭代中反复进行安全多方计算协议,无需在机器学习训练时的大量迭代过程中反复加密和通信,极大地提高了计算效率。
技术领域
本发明涉及一种特征融合隐私保护方法,具体涉及一种基于安全多方计算的特征融合隐私保护方法,属于数据安全技术领域。
背景技术
在装备智能制造和运维领域,机器学习和深度学习方法越来越多地应用于对装备生产制造和运行中产生的数据进行分析。在运行过程中,使用机器学习模型对装备数据进行分析,可以对故障做出预警和故障的溯源,同时装备的运维数据又可以反哺装备制造过程,进一步优化装备制造的质量。
然而,机器学习和深度学习模型的训练往往需要海量的数据,这些数据在实际生活中分散在不同的制造方、运维方。而现有大多的模型训练方式是集中式的,即,各方将数据汇集在某一可信的第三方手中,并签订相关的保密协议。第三方使用各方的数据进行集中式的训练,但是,这种集中式的训练方式存在隐私泄露的风险。此外,除第三方可能泄露外,在集中式的管理下,一旦第三方数据库被攻破,也可能会导致各方的数据均泄露。因此,近几年针对数据隐私保护的机器学习模型训练的研究逐渐火热。
针对数据隐私的保护,不仅需要保证数据在传输过程中不以明文形式出现,同时也应当保护各方的隐私数据不向其他参与方泄露。在实际应用场景中,采集终端获取的数据往往不会直接用于模型训练,而是先进行特征融合后,使用融合后的新特征进行训练。
现有的使用安全多方计算保护数据隐私的技术方案,大多采用全同态加密、秘钥分享、姚氏混淆电路等手段,现有的解决方法多是直接对原始数据进行加密,使用加密后的数据直接进行训练。尽管严格保护了数据的隐私,但也消耗了极大的资源,需要付出很大的计算和通信代价,尤其是全同态加密将带来很大的密文扩张。
发明内容
本发明的目的是为了解决现有技术无法在装备制造、运维过程中,各方隐私地进行联合机器学习模型训练的问题,创造性地提出一种基于安全多方计算的特征融合隐私保护方法。
本方法的创新点在于:基于安全多方计算,提供了一种安全的多方联合机器学习数据预处理方案,能够在特征融合阶段保护隐私数据,使得外包计算方只获得融合后的特征,而各方均不泄露隐私。同时,时间成本集中于数据预处理阶段,仅需一次处理即可,无需在机器学习训练时的大量迭代过程中反复加密和通信,极大地提高了计算效率。
有益效果
本发明,与现有技术相比,具有如下有益效果:
1.本发明只需要在特征融合阶段执行一次,而无需在后续训练过程的迭代中反复进行安全多方计算协议,提高计算效率;
2.本发明后续的模型训练过程无需再进行密文操作,提升了计算效率;
3.本发明提供了针对任意多参与方的安全多方计算架构;
4.本发明加密传输过程中的加密方案为RSA加密,相较于同态加密,加密效率高且密文扩张小。
附图说明
图1是本发明实施例的整体框架图;
图2是本发明实施实例中的特征融合算法的算数电路图;
图3是本发明实施实例中的公钥分发框架图;
图4是本发明实施实例中的秘密分享示意图;
图5是本发明实施实例中的秘密分享下特征融合流程框架图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210183933.3/2.html,转载请声明来源钻瓜专利网。