[发明专利]一种基于观点增强的主题协同过滤推荐方法在审
申请号: | 201810036537.1 | 申请日: | 2018-01-15 |
公开(公告)号: | CN108228867A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 彭敏;施洪亮;胡刚 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/06 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 协同过滤 矩阵 评论文本 平均绝对误差 词义 集成属性 模型计算 情感极性 商品推荐 属性词汇 算法计算 主题模型 情感词 构建 邻近 表现 分析 | ||
1.一种基于观点增强的主题协同过滤推荐方法,其特征在于,包括以下步骤:
步骤1:基于LDA主题模型提取评论文本属性面;
步骤2:根据LDA提取到的属性词,利用word2vec模型计算属性词之间的关系,将相似的属性词归为一类;
步骤3:通过属性面观点增强分析得到评论文本的情感极性;
步骤4:根据情感词极性和属性词构建打分矩阵,根据打分方式通过协同过滤算法计算用户之间的相似性;
步骤5:对任意用户u,从步骤4中的相似度矩阵选择与其最相似的k个邻居,将相似度最高的商品推荐给用户u。
2.根据权利要求1所述的基于观点增强的主题协同过滤推荐方法,其特征在于:步骤1中,利用LDA算法进行短文本的主题挖掘,挖掘一个商品的各属性词。
3.根据权利要求1所述的基于观点增强的主题协同过滤推荐方法,其特征在于:步骤2中,word2vec模型将每个属性词映射到一个低维稠密的实数向量空间,在空间上,语义相似的词能够汇聚成一起形成一个属性面。
4.根据权利要求1所述的基于观点增强的主题协同过滤推荐方法,其特征在于:步骤3中,评论文本的情感极性表达了用户对商品的情感倾向,分为积极、消极和中性三种;采用观点增强的方法来计算每个评论文本的情感倾向;同时,结合每个评论文本的用户总体星数评分与情感倾向进行判断,对不一致情况下的评论文本进行剔除;其中,将评论文本一颗或两颗星定义为消极,得分为-1;评论是三颗星的定义为中性,得分为0;评论是四颗或五颗星则定义为积极,得分为1。
5.根据权利要求1所述的基于观点增强的主题协同过滤推荐方法,其特征在于:步骤4中,根据主题-词汇分布以及情感极性打分,得到用户i对商品j的fk属性面的偏好度为:
其中,为主题词wn在属性面fk分布中的概率值,属性面fk由主题fn根据word2vec模型汇集而成;Sij为用户i对商品j评论的情感打分;N表示评论文本中总的用户数;
结合关注度的影响,得到用户i对商品j的fk属性面的综合评分:
Pijk=θikFijk (2)
其中,LDA主题模型中所得到的文档-主题分布矩阵θik用于表达用户i对第k个属性面的关注度;
结合公式(2)提供的用户i对商品j的fk属性面的综合评分,对于用户u和用户v,定义它们对商品j的属性面情感评分分别为Pujk和Pvjk,进而通过协同过滤算法得到用户u和用户v在评论文本属性面上的相似度:
其中,Iu和Iv分别表示商品评论集合,kuj和kvj分别表示用户u和用户v对商品j的属性面的评论文本集合;根据属性面相似度评分,对用户u的n个邻近用户计算商品c的评分:
其中,buc表示基准的平均推荐评分,ruj表示用户u对商品j的评分,baj表示用户u的相似用户对商品j的平均评分;a表示用户u相似用户中的其中一个,总共n个。
6.根据权利要求1-5任意一项所述的基于观点增强的主题协同过滤推荐方法,其特征在于:步骤5中,通过计算不同主题数k下的MAE值并确定最优的主题数;
其中,{p1,p2,...,pn}表示通过推荐算法得到的用户评论文本集合,pi表示集合中的一个值;{q1,q2,...,qn}表示实际的用户评分集合,qj表示此集合中的一个值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810036537.1/1.html,转载请声明来源钻瓜专利网。