[发明专利]一种基于安全多方计算技术的隐私保护实体识别工具在审
申请号: | 202310053178.1 | 申请日: | 2023-02-03 |
公开(公告)号: | CN116011015A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 李牧;孙明正;冯逸骏;杨心怡 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60;H04L9/08;G06F40/295 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 安全 多方 计算 技术 隐私 保护 实体 识别 工具 | ||
1.一种基于安全多方计算技术的隐私保护实体识别工具,通过输入电商平台各方数据,计算参与各方是否属于同一实体,其特征在于:包含嵌入矩阵共享、高敏感模块优化以及隐私保护预分块三个模块;
所述嵌入矩阵共享模块采用嵌入共享算法处理模型,通过对电商平台作为模型拥有者提供的共享嵌入矩阵进行索引,获得高维词矩阵;
所述高敏感模块优化模块对现有的四种高敏感模块进行优化,并使用秘密共享协议对数据和模型进行加密,参与者各自获得数据和模型的一半密文,并通过密文推理阶段,每个参与方独立地计算自己的密文各自独立地进行密文上的计算操作;
所述隐私保护预分块模块对两个计算参与方得到各自对应的一半结果A和结果B,并通过秘密共享协议的解密算法得到完整的明文结果“0”或“1”,即在电商活动各方都不暴露自己信息的情况下,通过相似度计算得出实体“匹配”或“不匹配”,即是否属于同一实体的结论。
2.如权利要求1所述的一种基于安全多方计算技术的隐私保护实体识别工具,其特征在于:所述公向算法处理模型当存在一个数据对s和一个经过微调的模型M时,模型拥有者首先将其Embedding层参数共享给数据拥有者,数据拥有者使用特定的分词器将数据对划分为tokens,然后,对于每个token,使用查找表来获得训练阶段得到的Embedding矩阵,以及其他Bert模型特有的Embedding,经过嵌入部分后,再进行层的归一化操作,最后应用秘密共享技术为数据拥有者和模型拥有者各自生成秘密共享份额;在加密数据集的Embedding得到数据共享份额之后对模型加密,得到加密模型。
3.如权利要求2所述的一种基于安全多方计算技术的隐私保护实体识别工具,其特征在于:所述其他Bert模型特有的Embedding包括位置、标记类型。
4.如权利要求2所述的一种基于安全多方计算技术的隐私保护实体识别工具,其特征在于:所述现有的四种高敏感模块进行优化具体包括,首先对Softmax函数进行优化,当上一层的输入进入softmax模块时,首先对其进行解密,让数据拥有者和模型拥有者得到softmax的明文输入,分别独立进行明文上的softmax计算,最后将结果重新利用秘密共享协议加密;
其次对平方根函数进行优化,首先引入一个因子r,利用此因子将原始值缩小到对应的收敛范围内,通过小范围的平方根逼近函数处理之后,再对结果乘以因子r,得到最终结果,在输入值上首先做max操作,判断最大值是否超过迭代次数为6时的收敛上界,若超过,便按照10的倍数设定因子r,从而动态扩展设置近似函数的收敛域;
之后对倒数的多项式近似优化,使用Newton-Raphson迭代法:
首先在初始化阶段,由于此近似算法的收敛条件为:并设定初始值y0(x)=3e0.5-x;
最后对Bert中的激活函数进行优化,使用GELU作为默认激活函数,其中包含高斯误差函数erf:
并设置GELU函数的近似:x*sigmoid(1.702x)。
5.如权利要求4所述的一种基于安全多方计算技术的隐私保护实体识别工具,其特征在于:所述隐私保护预分块模块采用PrivBlocking算法,对每个数据拥有者都保存一个原始数据库或表,这些数据库或表是方案感知的或方案感知的,首先进行预处理,使每个记录都是一个纯文本,去除属性界限,其余部分将同步在不同的数据拥有者上使用相同的方法执行,对于每个记录,使用Bert的Tokenizer生成Token列表,并创建一个Bloom过滤器结构,然后,对于每个Token,通过不同的哈希函数将“1”生成到相应的Bloom过滤器位置,在这个迭代结束时,每条数据都将持有一个只有“1”和“0”的Bloom过滤器;
在每个数据拥有者获得其私有的Bloom过滤器后,进行笛卡尔积,并获得可能匹配的索引对[x,y],而不泄漏敏感信息,最后,通过检查在相同的对应位置中有多少个“1”,并使用阈值s,锁定减少的候选对索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310053178.1/1.html,转载请声明来源钻瓜专利网。