[发明专利]一种以用户为中心的个性化推荐隐私保护方法及系统有效
申请号: | 202010674632.1 | 申请日: | 2020-07-14 |
公开(公告)号: | CN112035755B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 高能;张逸飞;屠晨阳;彭佳;李敏;单亦伟 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06N3/08 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 余功勋 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 中心 个性化 推荐 隐私 保护 方法 系统 | ||
本发明提供一种以用户为中心的差分隐私个性化推荐方法及系统:生成m个哈希函数,并发送至任一用户侧,用户侧通过用户与本地物品集合的历史交互记录,构造一n维的第一用户表示向量;接收用户侧发送的m维第二用户表示向量,所述第二用户表示向量依据m个哈希函数由第一用户表示向量转换;计算若干待预测物品的待预测物品表示向量,将所述第二表示向量与一待预测物品表示向量逐组地输入一神经协同过滤学生模型,得到该用户对各待预测物品的评分,并根据所述评分进行物品推荐。本发明避免服务方或可信第三方在集中对原始数据进行隐私化处理时的隐私泄露隐患,能够为未出现在训练集中的用户提供推荐,使用户避免向服务方发送唯一标识来获取推荐。
技术领域
本发明属于网络空间安全与隐私保护领域,尤其涉及一种以用户为中心的差分隐私个性化推荐方法及系统。
背景技术
在互联网上信息过载的环境中,大量的研究推动了个性化推荐系统的迅猛发展,以便从海量的数据中挖掘出对用户有价值的内容。在电影、购物、景点等多种场景中,服务方可以利用用户对物品的历史访问数据,预测用户对未访问物品的偏好,从而为用户提供个性化的推荐。然而,由于潜在的内部人员泄密和外部恶意攻击等风险,用户的数据隐私面临着泄露的威胁。同时,随着数据挖掘技术的发展,对手可能利用机器学习等方法从用户对物品的历史访问数据中推断出用户的性别、年龄、职业等敏感属性信息,进一步引发用户对个人隐私的担忧。
在个性化推荐的场景中,一般的隐私保护方法主要由服务方或可信第三方对收集到的用户数据进行数据的匿名化处理,包括差分隐私、K匿名、数据泛化等,向数据中加入扰动来断开数据与具体用户的关联,从而进一步训练机器学习模型得到个性化的向量表示作为用户的特征,储存在服务方,并与用户ID关联起来。当用户请求推荐时,将自己的用户ID发送给服务方,服务方根据用户ID取对应的向量进行计算,进而根据每个用户的表示向量来计算推荐结果。其中,差分隐私和本地差分隐私是目前唯一具有可证明隐私保证的技术。然而,目前基于差分隐私或本地差分隐私的方法具有不可忽视的数据可用性代价,为了保证差分隐私引入的扰动足够保护用户隐私,数据的表示能力下降。此外,目前基于协同过滤、基于内容的个性化推荐方法仅专注于在训练过程中已有用户的隐私保护,而不能处理新用户或匿名用户的数据,影响服务的可扩展性。
发明内容
根据上述发展现状,本发明的目的在于提出一种以用户为中心的个性化推荐隐私保护方法及系统,在用户侧对用户的历史数据进行向量化表示,将得到的用户表示发送给服务方,实现服务方收集到的信息同时具有隐私性和较好的可用性,从而训练个性化推荐模型,并采用知识蒸馏方法得到与原始训练数据无关的模型,实际提供服务的模型不接触原始训练数据,进一步保证防止模型过拟合可能导致的用户隐私泄露。
为了达到上述目的,本发明采用了以下方案:
一种以用户为中心的差分隐私个性化推荐方法,其步骤包括:
1)生成m个哈希函数,并发送至任一用户侧,所述用户侧通过用户与本地物品集合的历史交互记录,构造一n维的第一用户表示向量,其中n为物品数量;
2)接收用户侧发送的m维第二用户表示向量,所述第二用户表示向量依据m个哈希函数由第一用户表示向量转换;
3)计算若干待预测物品的待预测物品表示向量,将所述第二表示向量与一待预测物品表示向量逐组地输入一神经协同过滤学生模型,得到该用户对各待预测物品的评分,并根据所述评分进行物品推荐;
其中,通过以下步骤得到神经协同学生模型:
a)服务方获取一包括待预测物品与若干用户侧本地物品集合的物品总集合及若干用户侧的样本第一用户表示向量,并获取物品总集合中每一样本物品的样本物品表示向量;
b)逐组将样本第一用户表示向量及相应样本物品表示向量,输入一神经协同过滤模型,并以样本用户对样本物品的评分记录为标签、样本用户对相应样本物品的评分为输出进行训练,得到神经协同过滤教师模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010674632.1/2.html,转载请声明来源钻瓜专利网。