[发明专利]隐私数据的保护方法、装置及电子设备有效
| 申请号: | 202011269227.8 | 申请日: | 2020-11-13 |
| 公开(公告)号: | CN112100677B | 公开(公告)日: | 2021-02-05 |
| 发明(设计)人: | 吴若凡 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F40/30;G06F40/284;G06F17/18 |
| 代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 隐私 数据 保护 方法 装置 电子设备 | ||
本说明书实施例提供一种隐私数据的保护方法、装置及电子设备,根据该方法,获取预设的各个目标文本单元各自对应的各个语义向量;任一目标文本单元对应的语义向量表征该目标文本单元的语义;确定各个目标文本单元在待保护的隐私文本数据中出现的各个频度;基于所述各个语义向量及所述各个频度,确定各个目标文本单元各自对应的各个目标向量;对所述各个目标向量进行满足差分隐私的扰动处理,得到所述各个目标向量各自对应的各个隐私保护向量;上传所述各个隐私保护向量。如此能够使待保护的隐私文本数据得到保护,即使上传的隐私保护向量被恶意攻击者截获,也无法从该隐私保护向量中提取隐私文本数据中的信息,降低了隐私文本数据被泄露的风险。
技术领域
本说明书一个或多个实施例涉及数据挖掘的技术领域,特别涉及一种隐私数据的保护方法、装置及电子设备。
背景技术
用户通过用户设备输入的文本信息(如留言,聊天记录,搜索记录等),能够直接或间接地体现出用户的特征和偏好,这些文本信息对于数据的挖掘与分析具有极其重要的意义。但是,这些文本信息又涉及到用户的个人隐私,因此,如何在保护用户隐私的前提下进行文本信息的挖掘与分析,在数据挖掘领域变得尤为重要。
发明内容
为了解决上述技术问题之一,本说明书一个或多个实施例提供一种隐私数据的保护方法、装置及电子设备。
根据第一方面,提供一种隐私数据的保护方法,应用于用户设备,包括:
获取预设的各个目标文本单元各自对应的各个语义向量;其中,任一目标文本单元对应的语义向量表征该目标文本单元的语义;
确定所述各个目标文本单元在待保护的隐私文本数据中出现的各个频度;
基于所述各个语义向量及所述各个频度,确定所述各个目标文本单元各自对应的各个目标向量;其中,任一目标文本单元对应的目标向量为该目标文本单元对应的语义向量与该目标文本单元对应的频度的乘积;
对所述各个目标向量进行满足差分隐私的扰动处理,得到所述各个目标向量各自对应的各个隐私保护向量;
上传所述各个隐私保护向量。
可选的,所述对所述各个目标向量进行满足差分隐私的扰动处理,包括:
随机生成所述各个目标向量的扰动向量;其中,生成任一扰动向量的概率与该扰动向量的范数负相关;
针对各个目标向量,将该目标向量的扰动向量与该目标向量相加,得到该目标向量对应的隐私保护向量。
可选的,生成任一扰动向量的概率与预设项成正比,该预设项以自然常数的倒数为底数,以该扰动向量的范数与预设常数的乘积为指数。
可选的,所述目标文本单元包括以下至少一种:字,词语,短语,句子以及表情。
根据第二方面,提供一种对隐私保护向量进行处理的方法,应用于服务器,包括:
接收上传的各个隐私保护向量,其中,所述各个隐私保护向量通过第一方面中任一项所述的方法生成;
获取由所述各个语义向量构成的语义矩阵;
基于所述语义矩阵确定所述各个隐私保护向量各自对应的各个混淆向量;所述混淆向量表征经过隐私保护后,所述目标文本单元在所述隐私文本数据中出现的频度的混淆信息;
将所述各个混淆向量输入目标分析模型,以进行分析决策。
可选的,针对任一隐私保护向量,通过如下方式确定该隐私保护向量对应的混淆向量:
利用该隐私保护向量减所述语义矩阵与参考向量之乘积得到目标差值;所述参考向量包括一位非零位;
确定使所述目标差值的二范数平方最小的参考向量作为目标参考向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011269227.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





