[发明专利]一种基于安全多方计算技术的隐私保护实体识别工具在审
申请号: | 202310053178.1 | 申请日: | 2023-02-03 |
公开(公告)号: | CN116011015A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 李牧;孙明正;冯逸骏;杨心怡 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60;H04L9/08;G06F40/295 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 安全 多方 计算 技术 隐私 保护 实体 识别 工具 | ||
本发明通过网络安全领域的方法,实现了一种基于安全多方计算技术的隐私保护实体识别工具。包含嵌入矩阵共享、高敏感模块优化以及隐私保护预分块三个模块;嵌入矩阵共享模块获得高维词矩阵;高敏感模块优化模块对现有的四种高敏感模块进行优化;所述隐私保护预分块模块对两个计算参与方得到各自对应的一半结果A和结果B,并通过秘密共享协议的解密算法得到完整的明文结果“0”或“1”,即实体“匹配”或“不匹配”。本发明提供的方法提出了一个兼具稳定性和鲁棒性的隐私保护实体识别框架PRIBER,能够在Bert模型上采用安全多方计算技术执行实体识别二分类任务,并且不牺牲实体识别本身的准确性。
技术领域
本发明涉及信息安全技术领域,尤其涉及一种基于安全多方计算技术的隐私保护实体识别工具。
背景技术
隐私保护实体识别旨在匹配出来自不同数据库的两条记录是否属于真实世界的同一个实体,同时不会暴露敏感信息。在大规模预训练语言模型Bert的支撑下,实体记录之间的相似度判别可以不仅仅受限于文本层面,还能受益于可以捕获语义的深度神经网络架构,因此实体识别本身的效率有了很大的提升。而如何在保护隐私信息的条件下,高效地完成Bert上的实体识别任务,就成为了一个亟待解决的问题。
现有的解决方案要么适用于很少有非线性操作的小模型,要么适用于非机器学习的低效实体识别方案。将安全多方计算技术引入实体识别任务是一个新颖的方案,它可以让每个参与方在不获取任何明文信息的情况下,独立完成Bert模型上的实体识别计算任务。我们采用了安全多方计算中的秘密共享技术,该技术具有信息论安全性和密码学安全性的双重保护。在此技术中,利用随机数和对应的加密算法,使得每个参与方拥有原始数据的一部分密文份额,而当且仅当所有的密文份额都被获取到后,原始明文才能被正确恢复。
现有技术存在一种安全多方计算技术应用于机器学习模型的工具Crypten,它提供了基本的安全多方计算和通信原语,以及一些神经网络中出现的非线性函数的多项式近似算法。Crypten提供模型加密和数据加密两个模块,模型通过安全类注册以及参数秘密共享来实现,数据通过直接进行秘密共享实现。由于秘密共享协议只具有同台可加性,对于神经网络中出现的e指数、倒数、平方根等非线性模块,采用牛顿-拉普森迭代、豪斯霍尔德迭代等算法进行近似。
但该技术存在如下问题:
首先,Bert模型含有需要明文索引的词嵌入模块,现有技术Crypten很难应用于其上,使得秘密共享份额能够与加密模型的输入端所匹配。其次,由于Bert模型的维度大,层数深,Crypten中的很多近似算法在Bert模型计算的过程中不收敛,导致整个模型输出错误结果。最后,Crypten没有覆盖一个完整的实体识别任务流程,缺少实体识别任务中的预分块步骤。
本发明解决的问题是:如何在大规模语言模型Bert上正确、稳定地应用安全多方计算方法,以完成隐私保护实体识别任务,并且不损失实体识别的准确度。
具体来说,实现Bert模型中的明文词嵌入模块与安全多方计算技术的匹配,不易收敛的高敏感模块(HSM)的优化,以及带有隐私保护的实体识别预分块模块的设计。
发明内容
为此,本发明首先提出一种基于安全多方计算技术的隐私保护实体识别工具,
包含嵌入矩阵共享、高敏感模块优化以及隐私保护预分块三个模块;
所述嵌入矩阵共享模块采用嵌入共享算法处理模型,通过对电商平台作为模型拥有者提供的共享嵌入矩阵进行索引,获得高维词矩阵;
所述高敏感模块优化模块对现有的bert模型中的四种高敏感模块进行优化,并使用秘密共享协议对数据和模型进行加密,参与者各自获得数据和模型的一半密文,并通过密文推理阶段,每个参与方独立地计算自己的密文各自独立地进行密文上的计算操作;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310053178.1/2.html,转载请声明来源钻瓜专利网。