[发明专利]一种“网络马甲”的检测方法有效

申请号：	201310746568.3	申请日：	2013-12-31
公开（公告）号：	CN103778186A	公开（公告）日：	2014-05-07
发明（设计）人：	卜湛;伍之昂;曹杰;李秀怡;方昌健;刘英卓	申请（专利权）人：	南京财经大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	南京汇盛专利商标事务所(普通合伙) 32238	代理人：	陈扬
地址：	210023 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种网络马甲检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于Web挖掘领域，涉及一种虚拟空间“网络马甲”智能探测技术，具体的说是一种基于“相似观点”网络和文章作者鉴定技术的“网络马甲”的检测方法。

背景技术

网络社区中，一些用户使用多个用户名或将自己伪装成其他用户（通常被称为“网络马甲”）与其他用户沟通。一些网络社区的成员，为了迷惑大众，利用一些人造的“网络马甲”，伪装成不同的用户，对某个产品或某个人的工作大肆赞扬或否定。更有甚者，制造某个网络谣言，然后利用不同的网络“马甲”大肆传播。

长期以来，“网络马甲”检测技术的相关文献少之甚少，一些相关工作可以被应用于检测“网络马甲”。这些相关大多集中于文章作者身份鉴定技术和社会网络分析方法。

在传统的文章作者鉴定模型中，很多分析方法被采纳。其中两种最普遍的技术是基于统计学分析和基于机器学习方法。在20世纪，文章鉴定技术被应用于区别莎士比亚、马克.吐温以及培根文学大师的作品。在这些领域中，Mostteller和Wallace做出了最基本的研究工作。他们使用文章作者鉴定技术准确的将12篇有争议的联邦党文集进行了分类。最近几年，这一方法也被频繁应用于在线文集的作者鉴定。De Vel等人基于网络邮件作者的身份鉴定进行了大量实验分析。他们的研究为基于互联网媒体的文章作者身份鉴定提供了重要研究基础。Zheng等人将De Vel等人的工作进一步扩展，他们对英文和中文网络论坛消息的研究中，加入了多位空间的考量。

这些工作在某些应用中取得了一定的成果，但是它们主要集中于对一定数量文章的鉴定。现实的网络社区中充斥的着大量的网络用户和文本信息。基于一定数量的文章的传统的文章作者鉴定技术在这样的虚拟空间中可能不够适用。一些学者提出了采用社区划分算法来解决虚拟空间下的“网络马甲”检测。由于网络中同一个社区中的用户可能具备相同的兴趣、职业和爱好；因此他们的“网络马甲”应该出现在同一个网络“社区”中。Zeng等人的工作为这一领域的研究开辟了研究基础。Du等人提出了ComTector技术来发现大规模社交网络的网络社区。为了发现社交网络的讨论话题，McCallum等人提出了Author–Recipient-Topic模型。Tian等人提出了基于OLAP的归类策略来根据属性相似性对网络用户进行分类，这样处于统一社区的用户具备形似的属性。Zhao等人提出了一种基于话题的社区发现算法，其结合了社会对象聚类和边界分析技术。

上述基于社区发现算法的技术不能够被直接应用户“网络马甲”检测，这是因为他们混淆了“网络马甲”社区的实际含义。实际人，某个人的多个“网络马甲”彼此之间很少有交互，而是经常回复其他相同的ID。此外，相同个人的“网络马甲”应该具有相似的写作风格，并且对同一个话题应该具备相似的观点。为了更加直观的说明之一问题，首先看一个简单的网络社区用户交互实例（见图1（a））。图1（a）展示了一个深度为4的讨论主线的树形结构。方形区域的标识展示了发出有效评论的网络用户与其他用户的交互情况。可见，该帖子P首先吸引了三个用户（A、C和D）对其直接回复；在第二层，五个用户（A、B、D、E和G）一共发出了8条评论；在三层，又有五个用户（A、B、D、E和F）一共发出了7条评论；在最后一层，用户C给予了用户G最后一个条评论。在每个用户回复上，用+ or –分别表示支持/反对的态度。图1（b）表示基于传统用户交互模型（无向稠密网络）生成的交互网络，其包含7个节点和9条边。每条边界上的权值表示用户之间的交互次数。图1（c）表示基于次交互网络进行社区发现后的社区结构。尽管社区内的用户在论坛中交互频繁，但是他们的观点并不一致。在图1（c）左边的社区中，用户B同用户A的观点极为相左，这两个ID不太可能为来自同一个用户的“网络马甲”。图1.4（d）展示我们期望得到的社区划分结果。其中同一个社区中的ID对对待同一个话题具有相似的观点。在此基础上，再分析不同ID的写作风格，假设相同社区中的ID具有相似的写作风格，那么处于同一个社区的ID可被看为某个人的“网络马甲”。

图1中的简单例子，为准确发现“网络马甲”提供了一个很好的思路，在进一步讨论之前，需要首先回答下述几个问题：

1）网络模型。由于某个人的多个“网络马甲”彼此之间不会交流频繁，传统的网络模型（无向稠密网络）采用用户间的交互次数来衡量网络连接边的权值对于“网络马甲”检测算法可能并不适用，因此，我们需要提出一种更加准确的用户交互模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京财经大学，未经南京财经大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310746568.3/2.html，转载请声明来源钻瓜专利网。

上一篇：一种检测人热休克蛋白(Hsp90α)的生物芯片及其检测方法
下一篇：一种存储系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种“网络马甲”的检测方法有效

专利文献下载