[发明专利]一种融合相似性和共同评分项数量的概率矩阵分解模型在审
申请号: | 201710475797.4 | 申请日: | 2017-06-21 |
公开(公告)号: | CN107291894A | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 林泓;石义龙;於利艳;傅楚豪;李玉强 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 武汉开元知识产权代理有限公司42104 | 代理人: | 潘杰,胡艺 |
地址: | 430070 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种融合相似性和共同评分项数量的概率矩阵分解模型,提出了一种新颖的融合相似性和共同评分项数量的概率矩阵分解模型,该模型在PMF的基础上,通过相似性来约束因子矩阵的内积,同时对共同评分项数量建立合适的罚函数,并把罚函数和因子矩阵的内积关联在一块来共同约束因子矩阵,从而提高因子矩阵的质量。本发明成功结合了相似性在发掘局部关系方面的优势和概率矩阵分解模型在挖掘全局关系方面的优势,同时该模型还考虑到了共同评分项数量对相似性可信赖度的影响。相比之间所做的研究,本发明在推荐精度方面具有显著的提高。 | ||
搜索关键词: | 一种 融合 相似性 共同 评分 数量 概率 矩阵 分解 模型 | ||
【主权项】:
一种融合相似性和共同评分项数量的概率矩阵分解模型,其特征在于,包括:步骤1,建立用户‑项目评分矩阵R,所述用户‑项目评分矩阵R中各个元素为Ri,j,i=1,2,..N,j=1,2,3,..M,N表示推荐系统中的用户数量,M表示推荐系统中的项目数量;步骤2,建立评分指示矩阵IR,所述评分指示矩阵IR中各个元素表示用户i对项目j是否进行过评分,若是,则若否,则步骤3,通过皮尔森相关系数计算用户相似度矩阵D,所述用户相似度矩阵D中各个其中Di,k表示用户i和用户k之间的相似性,Di,k=Σj∈J(Ri,j-Ri‾)(Rk,j-Rk‾)Σj∈J(Ri,j-Ri‾)2Σj∈J(Rk,j-Rk‾)2]]>其中,J表示用户i和k共同评价过的项目集合,表示用户i对所有已评价项目的平均评分,表示用户k对所有已评价项目的平均评分;步骤4,通过改进的余弦相似性计算项目相似度矩阵S,所述相似度矩阵S中各个元素Sj,p表示项目j与项目p之间的相似性,Sj,p=Σi∈I(Ri,j-Ri‾)(Ri,p-Ri‾)Σi∈I(Ri,j-Ri‾)2Σi∈I(Ri,p-Ri‾)2]]>其中I为同时评价过项目j和p的用户集;步骤5,建立用户共同评分项数量矩阵CD,所述用户共同评分项数量矩阵CD中各个元素表示用户i和用户k共同评价过的项目的数量,其中Ri和Rk分别表示用户i和用户k的评价过的项目的集合;步骤6,建立项目共同评分项数量矩阵CS,所述项目共同评分项数量矩阵CS中各个元素表示同时评价过项目j和项目p的用户的数量,其中Rj和Rp分别表示评价过项目j和项目p的用户集合;步骤7,将所述用户共同评分项矩阵CD和所述项目共同评分项矩阵CS代入所述罚函数ω(c),得到用户相似性权重矩阵ID=ω(CD),和项目相似性权重矩阵IS=ω(CS),所述罚函数ω(c)为ω(c)=0c<αc-α/β-αα≤c<β1c≥β]]>其中,阈值α和β(α<β)分别表示最小评分项数量和最大评分项数量;步骤8,建立损失函数E=12Σi=1NΣj=1NIi,jR(Ri,j-g(UiTVj))2+σR22σD2Σi=1NΣk=1NIi,kD(Di,k-g(UiTUk))2+σR22σS2Σj=1MΣp=1MIj,pS(Sj,p-g(VjTVp))2+λU2Σi=1NUiTUi+λV2Σj=1MVjTVj]]>其中和为评分矩阵R、D和S的方差,g(x)=1/(1+exp(‑x)),λU和λV为用来抑制过拟合的模型参数,U和V分别表示用户因子矩阵和项目因子矩阵,Ui和Uk分别表示用户i和用户k对应的用户因子向量,Vj和Vp分别表示项目j和项目p对应项目因子向量,所述损失函数E即为概率矩阵分解模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710475797.4/,转载请声明来源钻瓜专利网。