[发明专利]一种基于多源用户评论的评分预测方法有效

专利信息
申请号: 202010051421.2 申请日: 2020-01-17
公开(公告)号: CN111274493B 公开(公告)日: 2020-09-08
发明(设计)人: 邵杰;王晓晨;肖廷松;徐行 申请(专利权)人: 电子科技大学;宜宾电子科技大学研究院
主分类号: G06F16/9536 分类号: G06F16/9536;G06K9/62;G06F17/16
代理公司: 成都正华专利代理事务所(普通合伙) 51229 代理人: 李蕊
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 用户 评论 评分 预测 方法
【权利要求书】:

1.一种基于多源用户评论的评分预测方法,其特征在于,包括以下步骤:

S1、对每条用户历史消费记录进行数据预处理;

S2、针对每位用户u消费过的每个物品i,根据用户-物品评分矩阵和相似度公式计算得到不同用户之间的相似度,选择出消费过物品i的所有用户中与用户u相似度最高的相似用户撰写的对物品i的评论,并把该评论添加至用户u的评论补充文档中;

S3、分别提取用户u的评论补充文档、物品i的评论文档以及用户u的评论文档的评论特征;

S4、将提取的评论特征进行连接,并将连接后的向量输入至多层感知器中进行评论特征融合处理,并根据融合结果得到最终的评分预测结果,从而完成基于多源用户评论的评分预测。

2.根据权利要求1所述的基于多源用户评论的评分预测方法,其特征在于,所述步骤S1包括以下步骤:

S101、删除每条用户历史消费记录的评论中的停止词、数字、标点符号以及出现频率高于0.5的高频单词,其中,停止词为使用频率高的字或词,包括冠词、介词、副词或连词;

S102、根据经删除操作后的每条用户历史消费记录的评论,计算得到数据中包含的所有单词的TF-IDF分数,并选择TF-IDF分数最高的2万个单词构建词典,其中,TF-IDF表示词频-逆向文件频率;

S103、删除评论中所述词典以外的所有单词;

S104、对英文单词/中文字数长度超过300的评论做截断操作,并对英文单词/中文字数长度不满300的评价补0并延长长度至300,从而完成对用户历史消费记录中评论的数据预处理。

3.根据权利要求1所述的基于多源用户评论的评分预测方法,其特征在于,所述步骤S2包括以下步骤:

S201、从经预处理后的用户历史消费记录中筛选出包含有物品i但不包括用户u的所有用户消费记录;

S202、将对物品i评分与用户u之间差异不超过1的用户作为用户u的候选相似用户;

S203、利用用户-物品评分矩阵和相似度公式计算得到用户u的候选相似用户中的所有用户与用户u的相似度;

S204、将与用户u相似度最高的相似用户对物品i的评论作为用户u的补充评论,并把所述补充评论添加至用户u的评论补充文档中;

S205、判断用户u的每条历史消费记录是否都进行了评论补充,若是,则进入步骤S3,否则,返回步骤S201。

4.根据权利要求3所述的基于多源用户评论的评分预测方法,其特征在于,所述步骤S203中所有用户与用户u的相似度rx,y的表达式如下:

其中,Ix和Iy为用户x和用户y消费过的物品集合,xi和yi为用户x和用户y对物品i的评分,和为用户x和用户y的平均分。

5.根据权利要求1所述的基于多源用户评论的评分预测方法,其特征在于,所述步骤S3包括以下步骤:

S301、分别对用户u的评论补充文档、物品i的评论文档以及用户u的评论文档中每个单词进行词嵌入处理,分别得到用户u评论补充文档的词嵌入矩阵、物品i评论文档的词嵌入矩阵以及用户u评论文档的词嵌入矩阵;

S302、利用卷积神经网络提取上述各所述词嵌入矩阵中的评论特征。

6.根据权利要求5所述的基于多源用户评论的评分预测方法,其特征在于,所述步骤S301包括以下步骤:

S3011、分别将用户u评论补充文档、物品i评论文档以及用户u评论文档中的每个单词映射至多维空间中,并用相应的词嵌入向量表示;

S3012、根据各单词在上述各文档中的位置,将所述词嵌入向量表示进行连接,分别得到用户u评论补充文档的词嵌入矩阵、物品i评论文档的词嵌入矩阵以及用户u评论文档的词嵌入矩阵,所述词嵌入矩阵的表达式如下:

D=(e1,e2,...,el)

其中,D为词嵌入矩阵,l为评论文档的长度,ei为文档中第i个单词对应的词嵌入向量,i=1,2,...,l。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学;宜宾电子科技大学研究院,未经电子科技大学;宜宾电子科技大学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010051421.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top