[发明专利]一种基于差分隐私的TopN协同过滤推荐方法在审
申请号: | 201710795637.8 | 申请日: | 2017-09-06 |
公开(公告)号: | CN107491557A | 公开(公告)日: | 2017-12-19 |
发明(设计)人: | 胡俊峰;吴响;毛亚青;王换换 | 申请(专利权)人: | 徐州医科大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 北京盛凡智荣知识产权代理有限公司11616 | 代理人: | 晏荣府 |
地址: | 221004 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 隐私 topn 协同 过滤 推荐 方法 | ||
技术领域
本发明涉及差分隐私保护技术及协同推荐技术领域,具体是一种基于差分隐私的TopN协同过滤推荐方法。
背景技术
推荐算法是一种对用户的历史数据进行知识发现,并将这些知识用于预测用户对相关对象喜好程度的方法。推荐算法的应用方向主要包括:预测用户对物品的评分及利用TopN向用户推荐个性化的推荐列表。其中,TopN推荐是国内外学者普遍认可的具有实际意义的推荐模型。而在众多的推荐算法中,协同过滤算法是最为常用的推荐算法,基于协同过滤算法的TopN推荐系统常被用于各大网站从而提高用户体验。然而,在收集大量的用户信息进行数据分析与研究的同时,个体的敏感信息也存在着隐私泄露的风险。例如,攻击者根据目标用户的推荐列表推测其浏览记录从而获取用户的个人喜好,或者通过对个人背景知识的研究能够推测出用户的隐私信息等。
目前,基于数据失真的隐私保护方法(如k-匿名、l-多样性以及t-接近等模型)只能应对特定背景知识下的攻击,无法适应多种背景知识的联合攻击,具有很大的局限性。此外,推荐系统的攻击者往往具备了解用户大量的历史行为记录的先决条件,即具有大量的背景知识,因而使用基于数据失真的方法无法对推荐过程进行有效的隐私保护。差分隐私是一种已经被广泛应用的具有严格数学推导的隐私保护模型。该模型主要是通过向分析结果中添加噪音扭曲数据来达到隐私保护的目的,并可以确保数据分析的精确性。其优点是无视攻击者拥有多少背景知识,极为契合推荐系统隐私保护的需求。本发明旨在将差分隐私应用到TopN推荐系统,防止TopN推荐过程中用户的敏感信息泄露。
推荐系统中的隐私保护问题目前已有学者注意到,但其研究成果有限。一种具有隐私保护的协同过滤推荐算法被首次提出,其隐私保护仅仅是对收集的原始数据进行随机扰动。此后,有学者将差分隐私应用到推荐系统,对item-to-item协方差矩阵进行差分隐私处理,证明了对推荐过程进行差分隐私保护是可行的。在此基础上,基于代理的个性化推荐系统CRESDUP被提出,更有学者将隐私保护机制运用到基于社交网络的协同过滤推荐中。然而,现有的有关差分隐私保护的文献还未有涉及TopN推荐系统的隐私保护。
发明内容
为了克服上述现有技术的缺点,本发明提供一种基于差分隐私的TopN协同过滤推荐方法,从数据预处理和推荐算法两个方面进行改进,在保护用户隐私信息的同时实现精准的推荐。
本发明是以如下技术方案实现的:一种基于差分隐私的TopN协同过滤推荐方法,包括数据预处理单元、评分预测单元和TopN推荐单元,具体如下:
A、数据预处理单元:由用户原始评分记录建立用户评分矩阵,获得加噪后的全局平均评分、用户平均评分和项目平均评分;
B、评分预测单元:利用加噪后的全局平均评分、用户平均评分和项目平均评分进行评分预测和数据的恢复处理;
C、TopN推荐单元:根据余弦相似度计算用户之间的相似度,寻找与目标用户兴趣相似的用户,利用协同过滤算法生成推荐候选列表,然后采用拉普拉斯机制对其扰动,最后进行选取目标用户最感兴趣的TopN个项目进行推荐。
优选的,数据预处理单元具体步骤如下:
1)首先,根据原始用户评分记录建立原始用户评分矩阵Rm*n,其中m为用户数,n为项目总数;
2)然后,计算全局平均评分G,并对其添加噪声Lap(△f/ε1),全局敏感度△f=rmax-rmin,其中rmin和rmax分别为最低评分和最高评分,ε1为隐私预算,得到带有差分隐私保护的项目平均评分DPG;
3)接下来,先统计参与项目i评分的用户的个数ICnt用来计算带差分隐私保护的项目平均评分IAvg[i];
4)如果带差分隐私保护的项目平均评分IAvg[i]小于rmin或者大于rmax则返回执行步骤3),否则直接执行步骤5);
5)与步骤3)同理计算带差分隐私的用户平均评分UAvg[u],并将其控制在[rmin,rmax]范围内。
优选的,评分预测单元具体步骤如下:
1)利用数据预处理单元得到的项目平均评分IAvg[i]和用户平均评分UAvg[u]计算预测评分
2)对预测评分进行恢复处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐州医科大学,未经徐州医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710795637.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:时空全要素语义查询服务系统及其方法
- 下一篇:元数据更新方法及装置