[发明专利]一种基于多源用户评论的评分预测方法有效
申请号: | 202010051421.2 | 申请日: | 2020-01-17 |
公开(公告)号: | CN111274493B | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 邵杰;王晓晨;肖廷松;徐行 | 申请(专利权)人: | 电子科技大学;宜宾电子科技大学研究院 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62;G06F17/16 |
代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 李蕊 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 评论 评分 预测 方法 | ||
1.一种基于多源用户评论的评分预测方法,其特征在于,包括以下步骤:
S1、对每条用户历史消费记录进行数据预处理;
S2、针对每位用户u消费过的每个物品i,根据用户-物品评分矩阵和相似度公式计算得到不同用户之间的相似度,选择出消费过物品i的所有用户中与用户u相似度最高的相似用户撰写的对物品i的评论,并把该评论添加至用户u的评论补充文档中;
S3、分别提取用户u的评论补充文档、物品i的评论文档以及用户u的评论文档的评论特征;
S4、将提取的评论特征进行连接,并将连接后的向量输入至多层感知器中进行评论特征融合处理,并根据融合结果得到最终的评分预测结果,从而完成基于多源用户评论的评分预测。
2.根据权利要求1所述的基于多源用户评论的评分预测方法,其特征在于,所述步骤S1包括以下步骤:
S101、删除每条用户历史消费记录的评论中的停止词、数字、标点符号以及出现频率高于0.5的高频单词,其中,停止词为使用频率高的字或词,包括冠词、介词、副词或连词;
S102、根据经删除操作后的每条用户历史消费记录的评论,计算得到数据中包含的所有单词的TF-IDF分数,并选择TF-IDF分数最高的2万个单词构建词典,其中,TF-IDF表示词频-逆向文件频率;
S103、删除评论中所述词典以外的所有单词;
S104、对英文单词/中文字数长度超过300的评论做截断操作,并对英文单词/中文字数长度不满300的评价补0并延长长度至300,从而完成对用户历史消费记录中评论的数据预处理。
3.根据权利要求1所述的基于多源用户评论的评分预测方法,其特征在于,所述步骤S2包括以下步骤:
S201、从经预处理后的用户历史消费记录中筛选出包含有物品i但不包括用户u的所有用户消费记录;
S202、将对物品i评分与用户u之间差异不超过1的用户作为用户u的候选相似用户;
S203、利用用户-物品评分矩阵和相似度公式计算得到用户u的候选相似用户中的所有用户与用户u的相似度;
S204、将与用户u相似度最高的相似用户对物品i的评论作为用户u的补充评论,并把所述补充评论添加至用户u的评论补充文档中;
S205、判断用户u的每条历史消费记录是否都进行了评论补充,若是,则进入步骤S3,否则,返回步骤S201。
4.根据权利要求3所述的基于多源用户评论的评分预测方法,其特征在于,所述步骤S203中所有用户与用户u的相似度rx,y的表达式如下:
其中,Ix和Iy为用户x和用户y消费过的物品集合,xi和yi为用户x和用户y对物品i的评分,和为用户x和用户y的平均分。
5.根据权利要求1所述的基于多源用户评论的评分预测方法,其特征在于,所述步骤S3包括以下步骤:
S301、分别对用户u的评论补充文档、物品i的评论文档以及用户u的评论文档中每个单词进行词嵌入处理,分别得到用户u评论补充文档的词嵌入矩阵、物品i评论文档的词嵌入矩阵以及用户u评论文档的词嵌入矩阵;
S302、利用卷积神经网络提取上述各所述词嵌入矩阵中的评论特征。
6.根据权利要求5所述的基于多源用户评论的评分预测方法,其特征在于,所述步骤S301包括以下步骤:
S3011、分别将用户u评论补充文档、物品i评论文档以及用户u评论文档中的每个单词映射至多维空间中,并用相应的词嵌入向量表示;
S3012、根据各单词在上述各文档中的位置,将所述词嵌入向量表示进行连接,分别得到用户u评论补充文档的词嵌入矩阵、物品i评论文档的词嵌入矩阵以及用户u评论文档的词嵌入矩阵,所述词嵌入矩阵的表达式如下:
D=(e1,e2,...,el)
其中,D为词嵌入矩阵,l为评论文档的长度,ei为文档中第i个单词对应的词嵌入向量,i=1,2,...,l。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学;宜宾电子科技大学研究院,未经电子科技大学;宜宾电子科技大学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010051421.2/1.html,转载请声明来源钻瓜专利网。