[发明专利]一种基于多源用户评论的评分预测方法有效
申请号: | 202010051421.2 | 申请日: | 2020-01-17 |
公开(公告)号: | CN111274493B | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 邵杰;王晓晨;肖廷松;徐行 | 申请(专利权)人: | 电子科技大学;宜宾电子科技大学研究院 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62;G06F17/16 |
代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 李蕊 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 评论 评分 预测 方法 | ||
本发明提供了一种基于多源用户评论的评分预测方法,属于推荐系统领域。对用户历史消费记录进行数据预处理;根据用户‑物品评分矩阵和相似度公式计算得到不同用户之间的相似度,使用相似度最高的相似用户撰写的相关评论对用户评论进行补充;接着提取评论特征;最后进行评论特征融合处理。本发明可以基于用户历史消费记录筛选出相似用户撰写的相关评论,对用户评论进行补充,为每位用户都构建一个用户评论补充文档,可以缓解用户评论的数据稀疏问题,丰富用户画像,提升评分预测的准确性,进而提高用户对推荐系统的满意度。此外,用户评论补充文档是由相似用户撰写的相关评论构成的,与用户自己撰写的评论存在一定的差异性,可以提高推荐的多样性。
技术领域
本发明属于推荐系统领域,尤其涉及一种基于多源用户评论的评分预测方法。
背景技术
在如今互联网信息过载的情况下,无明确需求的信息消费者想方便地找到感兴趣的内容,信息生产者则想将自己的内容推送给合适的目标用户,推荐系统应运而生。评分预测是推荐系统中的一类经典模型,系统对用户所有没消费过的物品进行评分预测,然后将预测分数最高的N个物品推荐给用户。评分预测问题中目前采用最广泛的方法是协同过滤算法,协同过滤算法通过利用用户行为数据来挖掘出用户的兴趣,并为其推荐可能感兴趣的物品,经典工作包括矩阵分解算法(MF)及其扩展工作概率矩阵分解算法(PMF)等(Koren,Y.,Bell,R.M.,Volinsky,C.:Matrix factorization techniques for mendersystems.IEEE Computer 42(8),30–37(2009).和Salakhutdinov,R.,Mnih,A.:Probabilistic matrix factorization.In:NIPS.pp.1257–1264(2007).),上述工作只利用用户历史评分数据,将用户和物品都映射到高维空间中用向量进行表示,然后计算点积得到预测结果。
虽然协同过滤算法性能很好,但是它无法为消费记录少的用户提供良好的个性化推荐服务。也就是说,协同过滤算法存在的数据稀疏问题比较严重。数据稀疏问题是因为现在待处理的推荐系统规模越来越大,用户和商品数目动辄上亿,两个用户之间选择的重叠非常少,例如淘宝网的数据稀疏度在百万分之一以下。数据稀疏问题直接影响到推荐系统的推荐质量,因此受到了学术界和工业界的高度关注。目前提出的解决数据稀疏问题的方式主要包括:
简单填值:简单填值法就是用一个固定的数值填充系统中所有的未评分的物品,从而解决稀疏性问题的一种方法,常用所有评分的平均值进行填充。
聚类:该方法根据用户兴趣之间的差异,利用某种聚类算法将系统中的所有用户划分为不同的群体;系统把用户所在群体的中心值作为用户对未评物品的评分预测值,进行用户-物品评分矩阵的填充。主要的聚类方法有k-means聚类和遗传聚类等。
降维:用户-物品评分矩阵出现数据稀疏的情况是由物品的高维数据引起的,因此可以考虑采取一定措施降低物品数据的维度,进而达到约减数据的目的。目前常见的降维技术主要有简单降维方法、矩阵分解和主成分分析(PCA)三类。
融合:协同过滤算法利用的信息只是用户评分数据,基于内容的过滤可以利用用户和物品的固有属性和描述信息,因此将这两种方式融合在一起可以增加可利用的数据量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学;宜宾电子科技大学研究院,未经电子科技大学;宜宾电子科技大学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010051421.2/2.html,转载请声明来源钻瓜专利网。