[发明专利]基于综合相似度迁移的协同过滤方法有效
申请号: | 201810050004.9 | 申请日: | 2018-01-18 |
公开(公告)号: | CN108269172B | 公开(公告)日: | 2020-02-18 |
发明(设计)人: | 琚生根;孙界平;陈黎;夏欣;金玉;王婧研 | 申请(专利权)人: | 四川大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06N99/00 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 何健雄 |
地址: | 610041 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于综合相似度迁移的协同过滤方法,与现有技术相比,本发明在相似度计算上,即利用了用户评分信息同时也利用了用户属性信息,并且考虑了用户间对满意度的打分标准的差异性,采用了用户评分分布一致性来衡量用户评分相似度的方法,提高了相似度计算的准确性,从而提高了数据迁移的质量。实验结果表明,该模型较其他方法能比较有效地缓解数据稀疏性问题。未来可以考虑联合项目相似度或其他知识,如文本信息,对辅助领域的数据进行迁移,通过这种方式可以提高迁移数据的质量,从而提高推荐精确度。 | ||
搜索关键词: | 基于 综合 相似 迁移 协同 过滤 方法 | ||
【主权项】:
1.一种基于综合相似度迁移的协同过滤算法,其特征在于,包括以下步骤:(1)基于综合相似度迁移的推荐算法:设有两个平台e1和e2,U1表示只在平台e1中存在历史行为信息的用户,U2表示只在平台e2中存在历史行为信息的用户,Uc表示在平台e1和e2中均有过历史行为信息的用户,定义为交叉用户;在实际情况中,交叉用户的数量远远小于非交叉用户的数量;通过交叉用户,为非交叉用户U1和U2建立起相似度联系,以此帮助目标领域进行推荐;(2)相似度迁移:非交叉用户U1和用户U2无法直接计算相似性,但是,用户U1和用户U2分别与交叉用户Uc的相似度是可以计算的,所以,可将交叉用户Uc作为纽带来建立用户U1和用户U2的相似度;相似度迁移步骤:首先找出与平台1和平台2的公共用户集Uc;然后分别计算U1与Uc的相似性,记为向量
U2与Uc的相似性,记为
最后计算
与
的内积,即为U1和U2的传递相似度其中,U11表示平台1中的非交叉用户1,U21、U22表示平台2中的非交叉用户1,Uc1、Uc2等表示交叉用户,S1、S2等表示相似度;如果要计算U11与U21之间的相似度,则可通过Uc1、Uc2、Uc3过渡,间接计算
综上,则U1和U2之间的相似度计算可形式化为:
(3)相似度计算:计算非交叉用户U1与U2的相似度之前,需先计算非交叉用户U1、U2分别与交叉用户的相似度,相似度计算如下:1)用户评分相似度本文通过评分分布一致性、可信度两方面衡量用户评分相似度;评分分布一致性是由两用户评价过的相同物品的评分分布决定;评分分布越一致,说明两用户的兴趣越相似;设{ur1,ur2,...,urn},{ur1,ur2,...,urn}分别为用户u与用户v对共同物品的评分集,将两组数据分别进行递增排序,即{ur1,ur2,...,urn},
如果1,2,...,n与x1,x2,...,xn的匹配度越大,则表明两者的一致性越高;计算公式如下所示;
可信度是根据两用户评价过的相同物品的数量决定的,若数量很小,即使评分分布一致,也不代表两者一定相似;计算公式如下所示;
其中,Iu表示用户u评价的物品集;用户评分相似度计算公式如下所示;sim1(u,v)=dist(u,v)conf(u,v) (1‑4)2)用户属性相似度用户属性相似度是根据用户属性来衡量;一般认为,拥有相同属性的用户在一定程度上具有相似的兴趣;计算公式如下所示;
其中,n表示属性个数,sim(u,v,i)表示在第i个属性上两用户是否相同,如相同,则为1,反之为0,di表示第i个属性的区分度,如果具有某属性的用户对所有物品都进行了评分则表明该属性没有区分度,其值由不同数据集决定;3)最终相似度一般情况下,当用户对某物品评分之后,应该尽量利用用户对物品评分信息,当用户对某物品没有评分,则应尽量利用用户属性信息;当用户所评分的物品数量增多时,算法应平滑过渡到使用评分信息进行推荐,本文使用sigmoid函数进行平滑处理,最终用户相似度定义如下:sim(u,v)=αsim1(u,v)+(1‑α)sim2(u,v) (1‑6)
其中,Cuv表示用户u和用户v共同评价的物品集合;由上述公式表示,用户相似度计算会随着用户所评价物品数量的增多,平滑过渡到使用评分信息,这种平滑过渡可以提高在冷启动状态下预测准确率;(4)算法描述:A)计算用户相似度算法:第一步根据用户属性信息,计算用户属性相似度;第二步根据用户评分信息,计算用户评分相似度;第三步:根据用户属性相似度与用户评分相似度,计算最终用户相似度;B)基于迁移学习的推荐算法:第一步计算U1与Uc之间的相似度
第二步计算U2与Uc之间的相似度
第三步计算迁移相似度
第四步利用迁移相似度
结合UCF算法进行推荐。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810050004.9/,转载请声明来源钻瓜专利网。