[发明专利]一种基于中介真值程度度量和用户的协同过滤推荐方法有效
申请号: | 201811548134.1 | 申请日: | 2018-12-18 |
公开(公告)号: | CN109635200B | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 周宁宁;陆荣 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 彭雄 |
地址: | 210033 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 中介 真值 程度 度量 用户 协同 过滤 推荐 方法 | ||
1.一种基于中介真值程度度量和用户的协同过滤推荐方法,其特征在于,包括以下步骤:
步骤1,用户兴趣相似度计算:
检索整个训练集记录各物品被购买的次数,按从大到小排序,根据推荐物品数n选择前F/n个物品组成热门物品集G′,0F/n0.05F,F表示训练集中物品总数,根据用户曾经有过正反馈的物品集得到共有物品集S,
S=N(i)∩N(j),
其中,N(i)表示用户i曾经有过正反馈的物品集,N(j)表示用户j曾经有过正反馈的物品集;
将热门物品集G′引入,得到去除热门物品后的用户反馈数据集:
N(i)′=N(i)-N(i)∩G′
N(j)′=N(j)-N(j)∩G′
建立物品到用户的倒查表:
C[i][j]=|N(i)′∩N(j)′|
若用户i,j同时属于倒查表中M1个物品对应的用户列表,则令C[i][j]=M1,
通过改进的余弦相似值公式计算用户i和j的兴趣相似度:
步骤2,基于中介真值程度度量的评分相似程度计算:
用户i和j对物品对象的评分是n1~n2之间的任意一个正整数值,记谓词P(x(i,j))表示待考察的用户i与j对物品对象评分相同,表示N(i)与N(j)相异,~P(x(i,j))表示i与j介于相同相异之间,通过计算距离比例函数hTg(x(i,j))得到用户i与j对物品g评分的相似程度;
根据用户对物品的评分得到相对评分f(x(i,j)):
f(x(i,j))=|Qig-Qjg|;
其中,Qig为用户i对物品g的评分,Qjg为用户j对物品g的评分;
在数轴上y=f(x(i,j))以~P为对称中心,左右分别为P和的取值为[0,n2-n1];
y=f(x(i,j))的值落在三个值域(αr+εr,αl-εl),(0,αr+εr),(αl-εl,n2-n1)内,~P(x(i,j))的区域为(αr+εr,αl-εl),P(x(i,j))的区域为(0,αr+ωr),的区域为(αl-εl,n2-n1),P(x(i,j))的真值为1,的真值为0;
相对于P(x(i,j))的距离比例函数:
其中,
其中,通过距离比例函数hTg(x(i,j))的计算,得到用户i与j对物品对象g评分的相似程度;
遍历共有物品集S,将用户i与j所有共有物品对象评分的相似程度求和,再除以共有物品集S的大小n,得到综合评分相似程度hTn(x(i,j)):
步骤3,推荐结果依据综合评分相似程度由小到大排序选择邻居对象。
2.根据权利要求1所述基于中介真值程度度量和用户的协同过滤推荐方法,其特征在于:遍历训练集抽取数据组成用户-物品集和用户-物品-评分集,计算用户与其他用户之间的用户兴趣相似度,选择相似度在前2K的用户作为该用户的邻居用户集M,K为推荐用户数。
3.根据权利要求2所述基于中介真值程度度量和用户的协同过滤推荐方法,其特征在于:遍历邻居用户集M,从用户-物品-评分集中提取出邻居用户集中对应的用户-物品-评分,计算出相对评分,计算候选用户的物品评分相似程度,最后计算得出用户的综合物品评分相似程度。
4.根据权利要求3所述基于中介真值程度度量和用户的协同过滤推荐方法,其特征在于:根据推荐用户数K,依据综合物品评分相似程度由小到大排序选择邻居用户对象。
5.根据权利要求1所述基于中介真值程度度量和用户的协同过滤推荐方法,其特征在于:P(x(i,j))所代表的区域占20%,所代表的区域占50%,~P(x(i,j))所代表的区域占30%。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811548134.1/1.html,转载请声明来源钻瓜专利网。