[发明专利]一种基于用户对项目类评分的协同过滤方法有效
申请号: | 201711183572.8 | 申请日: | 2017-11-23 |
公开(公告)号: | CN108132964B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 张艺;史维峰;冯旭 | 申请(专利权)人: | 西北大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 张明 |
地址: | 710069 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于用户对项目类评分的协同过滤方法,该方法提出在特征矩阵的基础上引入对项目类的评分,根据用户主观评分高低得出用户在访问次数的基础上对项目类的偏好,即用户的真实喜好;根据用户的真实喜好并结合评分相似度得出用户的最终相似度。在真实数据集上的测试验证,在用户特征矩阵中引入评分能够更加准确的反应用户偏好,预测用户真实评分,提高推荐系统的准确性。本方法解决了现有方法存在的只是根据用户客观行为识别用户兴趣偏好,不能从用户主观方面真实反映用户偏好的缺陷,从而有效提高推荐系统的质量。 | ||
搜索关键词: | 一种 基于 用户 项目 评分 协同 过滤 方法 | ||
【主权项】:
一种基于用户对项目类评分的协同过滤方法,其特征在于,包括以下步骤:步骤一,针对用户集合U中的任意的用户ui和用户uj,按照以下方法计算用户ui和用户uj总相似度:步骤S10,对用户ui访问的项目的特征类进行整理提取,再把用户ui对项目的评分映射为用户ui对对应特征类的评分,得出用户ui对特征类的评分表;步骤S11,统计用户ui对某一特征类t的访问次数ci,t和用户ui访问过的项目总数|Ii|,并按公式1计算用户ui对所述特征类t的感兴趣程度Qi,t:
步骤S12,计算用户ui对项目的平均评分
并统计出用户ui在特征类t中评分中大于平均评分的个数ni,t,通过公式2计算出用户ui在特征类评分的因素上对特征类的偏好程度Pi,t:
步骤S13,结合用户ui对特征类的感兴趣程度和特征类的偏好程度,按公式3计算用户ui对特征类的真实偏好程度Hi,t:Hi,t=Qi,t×Pi,t 公式3步骤S14,通过公式4求得用户ui与用户uj兴趣偏好之间的相似度hSim(i,j):
上式中,Ci,j表示用户ui和用户uj共同访问过的特征类的集合,c是集合Ci,j中的一个特征类,
和
表示用户ui和用户uj对所述特征类集合中所有特征类真实偏好程度的平均值,Hi,c和Hj,c表示用户ui和用户uj对特征类c的真实偏好程度;步骤S15,统计用户ui和用户uj的共同评分集合Ii,j、用户ui和用户uj评分项目的总和Ii∪Ij,按公式5计算出用户ui和用户uj之间的共同评分权重wi,j:
步骤S16,按照公式6计算用户ui和用户uj的评分相似度:
上式中,Ii,j表示用户ui和用户uj共同访问过的项目的集合,e是集合Ii,j中的一个项目,
和
表示用户ui和用户uj对所述项目集合中项目评分的平均值,ri,e和rj,e表示用户ui和用户uj对项目e的评分;步骤S17,根据公式7计算出用户ui和用户uj最终的评分相似度:scSim(i,j)=sim(i,j)×wi,j 公式7步骤S18,根据公式8计算出用户ui和用户uj总相似度,其中α+β=1:Sim(i,j)=α×scSim(i,j)+β×hSim(i,j) 公式8步骤二,对于用户集合U中的一个待推荐的目标用户ud,根据步骤一中的方法找出与目标用户ud总相似度最高的前N个用户,构成目标用户ud的最近邻居集合Neighber(ud);根据公式9对目标用户ud没有评分的项目计算预测评分Rk(d):
上式中,uv是最近邻居集合Neighber(ud)中的一个用户,sim(d,v)是用户ud和用户uv的总相似度,
表示用户ud对其已经评过分的项目的平均分,rv,k表示用户uv对项目k的评分,该项目k为目标用户ud没有评过分的项目;调整公式8中的α的值,根据公式9得出评分结果;步骤三,根据最优的评分结果对项目进行排序,并将排序靠前的项目推荐给目标用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711183572.8/,转载请声明来源钻瓜专利网。