[发明专利]一种应用于消费平台上的虚假评论信息识别方法及装置有效
申请号: | 201610916472.0 | 申请日: | 2016-10-20 |
公开(公告)号: | CN106484679B | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 李晶;吴国仕;姚旭;邹长生 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F40/279 | 分类号: | G06F40/279 |
代理公司: | 11403 北京风雅颂专利代理有限公司 | 代理人: | 李阳;于洁 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种应用于消费平台上的虚假评论信息识别方法及装置包括:从消费平台上抓取多条消费评论信息;确定群体性虚假评论人;确定每个评论人的可信度;确定每个商家的可信度;确定每条消费评论信息的独立可信度;识别虚假评论信息。本发明能够在消费平台上确定以中文撰写的多种类型的评论的可信度,并识别出虚假评论。 | ||
搜索关键词: | 一种 应用于 消费 平台 虚假 评论 信息 识别 方法 装置 | ||
【主权项】:
1.一种应用于消费平台上的虚假评论信息识别方法,其特征在于,包括:/n从消费平台上抓取多条消费评论信息;每条消费评论信息包括评论人、商家、发表时间、文本内容与评分;/n确定群体性虚假评论人;所述确定群体性虚假评论人,为使用频繁项集挖掘方法从所有评论人中挖掘出具有群体性活动特征的频繁项集,并将所述频繁项集覆盖的评论人确定为群体性虚假评论人;/n确定每个评论人的可信度;所述确定每个评论人的可信度包括:根据指定评论人对某一商家的评分与该商家的平均评分,确定其评论评分与商家整体评论评分间差异;根据指定评论人对某一商家的评分次数与不评分次数间的评分差异,确定其对同一商家评论评分相似性;根据指定评论人是否仅针对某一商家进行评分,确定其是否为单例评论人;根据指定评论人对某一商家的评分时间与该商家的注册时间,确定其早期评论倾向;根据指定评论人是否具有虚假评论历史,确定其逻辑回归类标签;根据所述评论评分与商家整体评论评分间差异、对同一商家评论评分相似性、是否为单例评论人、早期评论倾向与逻辑回归类标签,确定该评论人的可信度;依次指定每个评论人并分别确定所述每个评论人的可信度;/n确定每个商家的可信度;所述确定每个商家的可信度包括:根据指定商家的评论总数与其中由单例评论人发表的评论数,确定其单例评论比例;根据指定商家的评论总数与其中高峰期发表的评论数,确定其爆发评论比例;根据指定商家的评论相对于时间的发布密度,确定其密度差异系数;根据指定商家所有评论之间的差异度,确定其评分差异系数;根据指定商家的所有评分,确定其平均评分;根据指定商家是否具有虚假评论历史,确定其逻辑回归类标签;根据所述单例评论比例、爆发评论比例、密度差异系数、评分差异系数、平均评分与逻辑回归类标签,确定该商家的可信度;依次指定每个商家并分别确定所述每个商家的可信度;/n确定每条消费评论信息的独立可信度;所述确定每条消费评论信息的独立可信度包括:根据指定评论文本内容中的动词数量与标点符号数量,确定动词与标点符号的比例;根据指定评论的总体评分与其商家评论的总体评分平均分,确定评论评分与整体评分差异;根据指定评论的多个专项评分,确定专项评分的标准差;/n识别虚假评论信息。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610916472.0/,转载请声明来源钻瓜专利网。