[发明专利]一种应用在协同过滤方法中的相似度计算方法及系统有效
| 申请号: | 201910478934.9 | 申请日: | 2019-06-04 |
| 公开(公告)号: | CN110377841B | 公开(公告)日: | 2022-01-07 |
| 发明(设计)人: | 杨志明 | 申请(专利权)人: | 深思考人工智能机器人科技(北京)有限公司 |
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
| 代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 牛峥;王丽琴 |
| 地址: | 100084 北京市海淀区上*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 应用 协同 过滤 方法 中的 相似 计算方法 系统 | ||
本发明公开了一种应用在协同过滤推荐方法中的相似度计算方法及系统,本发明实施例提出了不需要用户的评分数据,而是基于用户的相关评论信息的协同过滤推荐方法,特别是对现有的协同过滤推荐方法中的计算相似度的步骤进行了改进,使得相似度计算部分只依据用户的评论信息进行建模,而后在使用时直接输入用户的评分信息就可以得到相似度结果。这样,就可以在不需要用户的评分数据基础上,实现协同过滤推荐方法中的相似度之间的计算。
技术领域
本发明涉及计算机技术领域,特别涉及一种应用在协同过滤推荐方法中的相似度计算方法及系统。
背景技术
随着互联网技术的快速发展,互联网网络侧根据用户数据为用户进行个性化推荐。在进行个性化推荐过程中,需要根据用户的历史偏好和行为的用户历史数据,给用户提供其感兴趣的推荐信息。为了实现为用户推荐信息,可以采用协同过滤推荐方法进行推荐。
当前的协同过滤推荐方法大都需要基于用户对物品的显式评分来构建推荐模型,然后将用户的评分信息输入到推荐模型中,最终输出得到推荐信息。
当前的协同过滤推荐方法包括:
第一步骤,计算用户之间的相似度
当前用于计算用户之间的相似度度量方法有很多,其中广泛被使用的有欧氏距离、余弦相似度、皮尔斯相关系数和杰卡德相似系数等,欧氏距离、余弦相似度及皮尔斯相关系数等都需要基于用户对物品的评分计算,杰卡德相似系数可以在没有被评分的情况下完成用户相似度的计算,其考虑的是用户相关的物品数量,计算公式为:
其中Jaccard(u,v)表示用户u和用户v之间的相似度;Iu和Iv分别表示与用户u和用户v相关的物品集合;Iu,v表示与用户u和用户v相关物品的交集。
第二步骤,获取目标用户的K个最近邻用户集合
基于第一步骤中计算的用户之间的相似度,筛选出与目标用户相似度最大的K个用户集合,即筛选出与目标用户最相似的K个用户。
第三步骤,获取目标用户的潜在推荐物品集合
基于目标用户的K个最近邻用户集合,获取目标用户的潜在推荐物品集合,具体实施步骤分为:a、获取目标用户的K个最近邻用户集合中所有用户的相关物品的并集;b、从a中的相关物品的并集中删除与目标用户相关的所有物品;c、根据b获得的物品集合就是目标用户潜在的推荐物品集合。
第四步骤,获取向目标用户的推荐物品集合
对第三步骤得到的目标用户的潜在推荐物品集合,分别计算其中所有物品的偏好度,计算公式为:
其中pu,i表示用户u对物品i的偏好度;Ui表示与物品i相关的用户集合;Uu表示用户u的K最近邻用户集合;su,v表示用户u和用户v之间的相似度;rvi表示用户v对物品i的评分。
可以看出,目前的协同过滤推荐方法的整个流程中都需要用户主动提供的评分数据参与,当获取不到用户的评分数据时则无法完成协同过滤推荐。然而目前越来越普遍的情况为:网络侧无法获取到用户的主动评分数据,比如网络侧未提供对物品的显式评分选项,而仅仅提供了对物品的评论选项,类似于点赞或收藏等选项等,这时就无法采用当前的协同过滤推荐方法为用户推荐信息。
更进一步地,作为协同过滤推荐方法中的计算基础,用户之间的相似度计算,除了杰卡德相似系数方式的计算,其他的计算方式也需要机遇用户的评分数据。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深思考人工智能机器人科技(北京)有限公司,未经深思考人工智能机器人科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910478934.9/2.html,转载请声明来源钻瓜专利网。





