[发明专利]一种基于LSTM多实体特征融合的虚假评论检测方法有效

专利信息
申请号: 202010030663.3 申请日: 2020-01-13
公开(公告)号: CN111259140B 公开(公告)日: 2023-07-28
发明(设计)人: 向凌云;郭国庆;刘宇航 申请(专利权)人: 长沙理工大学
主分类号: G06F16/35 分类号: G06F16/35;G06F18/24;G06F18/25;G06N3/0442;G06N3/0464
代理公司: 北京迎硕知识产权代理事务所(普通合伙) 11512 代理人: 钱扬保;张群峰
地址: 410114 湖南省*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 lstm 实体 特征 融合 虚假 评论 检测 方法
【权利要求书】:

1.一种基于LSTM多实体特征融合的虚假评论检测方法,其特征在于包括以下步骤:步骤1,将评论按用户和产品分别进行分组,提取待检测评论基于产品实体的评论序列和基于用户实体的评论序列;步骤2,对每个实体中的评论进行向量化,使用卷积神经网络提取文本特征;步骤3,根据相关行为分析,对每个实体的每条评论的行为特征进行提取;步骤4,将每个实体中每条评论的文本特征与行为特征进行联合,对评论的时序联合特征进行再提取,得到待检测评论在各个实体中的特征向量表示形式;步骤5,融合待检测评论在不同实体中的特征向量,学习新的特征并构建分类器,进行虚假评论和正常评论的判定;

步骤1包括:将评论数据集中的所有评论按照用户分组并依据发布时间进行排序,取用户u在发布待检测评论r之前已发布的k条评论,表示为:

ur={ruk,ru(k-1),…,ru2,ru1,r},

ur为待检测评论r与其对应用户u在待检测评论r之前最新发布的k条评论的集合;

将评论数据集中的所有评论重新按照产品分组并依据发布时间先后进行排序,将产品p在获得待检测评论r之前获得的m条评论表示为:

pr={rpm,rp(m-1),…,rp2,rp1,r};

步骤3中,从评论、用户和商品三个层面为ur和pr中的每条评论分别提取三类行为特征:每条评论从用户层面提取6个行为特征,依次为:一天内发布的最大评论数量MNR、正面评价的比例PR、负面评价的比例NR、平均偏差率avgRD、用户评价分数的分布的熵ERD、突发性BST;基于产品每条评论提取6个类似的产品实体关联的行为特征,依次为:一天内发布的最大评论数量MNR、正面评价的比例PR、负面评价的比例NR、平均偏差率avgRD、用户评价分数的分布的熵ERD、突发性BST;从评论行为出发,每条评论提取5个行为特征,依次为:在所有商品评论中的次序Rank、评分偏差率的绝对值RD、评分的极端性EXT、带阈值的评分偏差率DEV、是否为单例ISR。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙理工大学,未经长沙理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010030663.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top