[发明专利]基于差分隐私保护的邻域推荐方法有效
申请号: | 201810200442.9 | 申请日: | 2018-03-12 |
公开(公告)号: | CN108427891B | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 李千目;耿夏琛;侯君 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/9536;G06Q30/02 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 薛云燕 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 隐私 保护 邻域 推荐 方法 | ||
1.一种基于差分隐私保护的邻域推荐方法,其特征在于,包括以下步骤:
步骤1、在训练阶段,将已收集的用户对物品的评价或喜好,转化为用户-评分矩阵,作为推荐方法模型的训练集;
步骤2、通过差分隐私平均值计算方法,计算出差分隐私保护下的平均值;
步骤3、通过基于差分隐私的偏置项计算,计算出差分隐私保护下的用户偏置项和物品偏置项;
步骤4、在评分预测阶段,利用基于指数机制的差分隐私保护邻居选择方法选择邻居;
步骤5、利用相似度的局部敏感度,添加拉普拉斯噪声进行差分隐私保护;
步骤6、最后利用评分预测模型与训练出的差分隐私保护模型参数,预测用户对物品的评分;
步骤4中所述的在评分预测阶段,利用基于指数机制的差分隐私保护邻居选择方法选择邻居,具体如下:
假设用户-物品评分数据R=rui,目标用户为u,目标物品为i,候选物品列表为I,候选物品列表中包含当前用户曾经评价过且与物品i存在相似度的物品;设qi(I,nj)为可用性函数,nj为根据可用性函数qi(I,nj)每次输出的邻居,由于邻居选择的目的是从候选物品列表I中选择与当前物品ii相似度最大的k个物品,因此采用物品间相似度作为可用性函数,即:
qi(I,nj)=sim(i,j)
其中sim(i,j)为物品ii与物品ij的相似度;
假设Δq为可用性函数的敏感度,根据差分隐私保护指数机制的定义,提出的差分隐私邻居选择方法在每次选择的过程中,以与成比例的概率从I中选出邻居nj;随后将方法迭代k次,选取k个隐私保护邻居,输出即为物品i的k个差分隐私保护邻居;
在邻域推荐方法模型的基础上引入偏置项,在评分预测时考虑了偏置项对评分的影响,此时评分预测的模型为:
其中,μ为评分的全局平均数,bu为用户偏置项,bi为物品偏置项;
步骤5中所述的利用相似度的局部敏感度,添加拉普拉斯噪声进行差分隐私保护,具体如下:
差分隐私保护相似度加扰的目的是在进行评分预测时,对其中的相似度进行差分隐私保护,差分隐私保护的实现方式为拉普拉斯机制;
假设Δrsim为相似度的敏感度,∈4为差分隐私保护相似度加扰隐私预算,为上一步邻居选择环节选择出的物品i的k个邻居,对于中的每个物品j,按如下公式计算差分隐私保护的相似度:
2.根据权利要求1所述的基于差分隐私保护的邻域推荐方法,其特征在于,步骤1中所述的在训练阶段,将已收集的用户对物品的评价或喜好,转化为用户-评分矩阵,具体如下:
将已收集的用户对物品的评价或喜好,转化为n×m的用户-评分矩阵Rn×m,用户集U={u1,u2,...,un},其中n为用户总数,物品集I={i1,i2,...,im},其中m为物品总数,rui为用户u对物品i的评分。
3.根据权利要求1所述的基于差分隐私保护的邻域推荐方法,其特征在于,步骤2中所述的通过差分隐私平均值计算方法,计算出差分隐私保护下的平均值,具体如下:
(3.1)计算评分求和的敏感度:Δrsum=rmax-rmin,其中rmax表示评分中的最大值,rmin表示评分中的最小值;
(3.2)计算评分计数的敏感度:Δrcount=1;
(3.3)计算出差分隐私保护的评分和其中ε1为平均值计算的差分隐私预算,R表示评分矩阵,rui为评分矩阵中用户u对物品i的评分;
(3.4)计算出差分隐私保护的评分计数|R|+Lap(2Δrcount/ε1);
(3.5)计算差分隐私保护的评分平均值:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810200442.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种敏感数据动态检测方法及装置
- 下一篇:存储器件、存储器控制器及其操作方法