[发明专利]一种基于RBM与差分隐私保护的聚类的电影推荐方法及系统有效
申请号: | 201810973951.5 | 申请日: | 2018-08-24 |
公开(公告)号: | CN109033453B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 陈志立;乔明浩;仲红;张顺;崔杰 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62 |
代理公司: | 合肥兴东知识产权代理有限公司 34148 | 代理人: | 胡东升 |
地址: | 230601 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 rbm 隐私 保护 电影 推荐 方法 系统 | ||
1.一种基于RBM与差分隐私保护的聚类的电影推荐方法,其特征在于,该推荐方法包括以下流程:
S1、初始化阶段:收集所有用户对项目的评分信息,生成一个用户项目评分矩阵;
S2、聚类阶段:在得到的用户项目评分矩阵中,以单个用户为基础,对所有用户进行聚类操作,把所有用户分为k个类;
S3、生成推荐模型阶段:得到所有用户的聚类结果,然后在每个聚类中使用RMB算法生成各自的推荐模型;
S4、在线用户电影推荐阶段:用户登录系统,在推荐模型中选出评分高的且用户无观看记录的T个项目推送到用户界面;
在所述的聚类阶段中,具体地,包括以下过程:
(1)随机生成k个M维的向量作为初始的聚类中心点;
(2)分别计算每个用户到这k个聚类中心点的距离,得到用户距离k个中心点的距离,用户属于距离其最近的中心点所确定的聚类;
(3)所有用户都完成计算后,分别计算每个聚类中所有用户的各维数据平均值,将其作为新的聚类中心点;
(4)在新的聚类中心点基础上重复步骤(2)、步骤(3),直至聚类中心点不再改变为止,否则重复步骤(2)、步骤(3)直至聚类中心点不再改变;
(5)聚类稳定后判断每个聚类所含用户的数目,若其所含用户的数目大于2N/k,或小于N/2k,则需要重新聚类;
(6)待上述步骤完成,计算每个聚类的中心点并加入Laplace(5k/2εN)的噪声,然后对所有用户再进行一次聚类,得到最终聚类结果;
在所述的生成推荐模型阶段中:具体地,包括以下过程:
(1)对于每个用户,使用RBM推荐算法对M个电影项目进行评分,生成一个6行M列的矩阵,矩阵中的元素为0或1;
(2)若用户的评分为r,则在对应的r+1行填入1,此项目对应的其他行数据用0填充,每个用户作为一个RBM输入;
(3)RBM对应的显示层节点数为用户进行评分项目的数目,隐藏层的节点的个数为h,h在实验过程中根据经验取值,每个聚类中所有用户对应的隐藏层节点个数相同;
(4)每个用户训练其各自的权重矩阵,聚类中所有用户对于相同项目的权重为单个用户对此项目权重的平均值,最终得到聚类对应的权重矩阵。
2.根据权利要求1所述的基于RBM与差分隐私保护的聚类的电影推荐方法,其特征在于,在所述的初始化阶段中:
所述的用户对项目的评分信息为文件形式,其包括存储用户编号、项目编号、用户对项目的评分、评分时间;
生成用户项目评分矩阵的具体方法为:模型训练首先把文件形式的评分信息进行处理,提取其中的用户编号、项目编号、用户对项目的评分,从而得到用户项目评分矩阵;其中用户数为N,项目数为M,评分范围为1-5,没有评分的项目默认评分为0。
3.根据权利要求1所述的基于RBM与差分隐私保护的聚类的电影推荐方法,其特征在于,所述k个M维的向量的数据范围为0-5,所述距离为欧几里得距离。
4.根据权利要求1所述的基于RBM与差分隐私保护的聚类的电影推荐方法,其特征在于,所述权重训练过程为:用户的评分向量作为RBM输入,得到隐藏层节点的输出值,然后以隐藏层值为输入,求出显示层节点对应的值,判断反馈的显示层值与原先输入显示层值的误差,当误差小于预先设定的阈值或达到预先设定的迭代上限,权重矩阵训练完成,若不满足结束条件,则调整权重矩阵继续迭代计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810973951.5/1.html,转载请声明来源钻瓜专利网。