[发明专利]一种网络水军的自动识别方法及系统有效
申请号: | 201710463010.2 | 申请日: | 2017-06-19 |
公开(公告)号: | CN109213858B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 梁棋;沙灜;李锐;邱泳钦;王斌 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/9536;G06Q50/00;H04L29/08 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邵可声 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 水军 自动识别 方法 系统 | ||
本发明提供一种网络水军的自动识别方法及系统,该方法步骤包括:1)采集社交网络中认证账号的消息信息以及每条消息下的评论信息;2)监测上述每条消息下的每条评论信息是否被删除,若是则读取该评论信息对应账号的历史被删评论数;3)若上述账号的历史被删评论数满足预设条件,则该账号为网络水军。该方法及系统不仅免去了人工标注工作及模型训练,而且能够快速有效的识别社交网络中的网络水军,即当一个账号的评论信息的历史被删评论数满足预设条件,则判定该账号为网络水军。同时该方法及系统适用于多个社交网络,并且能够跨平台运行。
技术领域
本发明涉及社交网络的网络水军识别领域,尤其涉及一种网络水军的自动识别方法及系统,以实现更加自动、精确地识别社交网络中的网络水军。
背景技术
随着社交网络相关应用的快速发展,人们越来越多地将活动转移到社交网络中。社交网络通常包括国外的Facebook、Google+、Twitter等和国内的新浪微博、腾讯微博、人人网等。但是目前社交网络存在大量的网络水军,社交网络的网络水军通常对网络信息传播推波助澜,或是恶意抨击一些社交网络账号。他们由政治利益、商业利益驱动,为达到如影响网络民意、扰乱网络环境等不正当目的,通过操纵软件机器人或水军账号在互联网中制造、传播虚假意见和垃圾信息。这些行为严重影响了社交网络用户体验,并且还带来了严重的安全问题。
现有的社交网络中网络水军识别方法主要是使用社交网络的消息内容。比较简单的基于内容的网络水军检测方法(K.Lee,J.Caverlee,and S.Webb.Uncovering socialspammers:social honeypots+machine learning.In Proceedings of SIGIR,2010)是将其作为一个监督学习问题。这些方法从社交网络的消息内容中提取有效的文本特征来建立一个分类器。给定一个新用户,分类器输出一个分类标签,以判断该新用户是否是网络水军。然而,这些方法通常需要大量的标注数据(这些数据通常都是人工标注),因而耗时耗力。并且人工标注的数据集规模较小,这就为社交网络中网络水军的检测带来了巨大的挑战。
发明内容
由于以往的社交网络的网络水军识别方法大多将其作为一个分类问题,需要利用大量的标注数据集。而标注数据需要耗费大量的人力,且标注数据集规模一般较小,训练出的模型泛化能力较弱。
基于此,本发明的目的是提供一种网络水军的自动识别方法及系统,该方法及系统不需要人工标注数据集,避免耗时耗力的标注工作,且不需要进行模型训练,同时能够快速有效的识别社交网络中的网络水军。
针对上述不足,本发明所采用的技术方案为:
一种网络水军的自动识别方法,其步骤包括:
1)采集社交网络中认证账号的消息信息以及每条消息下的评论信息;
2)监测上述每条消息下的每条评论信息是否被删除,若是则读取该评论信息对应账号的历史被删评论数;
3)若上述账号的历史被删评论数满足预设条件,则该账号为网络水军。
进一步地,步骤1)包括以下步骤:
1-1)社交网络用户模拟登录;
1-2)获取社交网络中认证账号列表,并采集每个认证账号的消息信息;
1-3)获取消息列表,并采集每条消息下的评论信息。
进一步地,步骤1)中所述认证账号是指被社交网络官方认证的的账号;且认证账号的类型包括政府机构账号、国际组织账号、新闻媒体账号、个人账号。
进一步地,步骤1)中所述消息信息包括但不限于消息url、消息内容、消息发布时间、消息评论数、消息转发数、消息点赞数;所述评论信息包括但不限于评论url、评论内容、评论时间、评论用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710463010.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种欺诈行为识别方法和装置
- 下一篇:一种文本检测方法、装置及系统