[发明专利]网络水军的检测方法及装置有效
申请号: | 201410027720.7 | 申请日: | 2014-01-21 |
公开(公告)号: | CN103795592B | 公开(公告)日: | 2017-01-25 |
发明(设计)人: | 孙卫强;牛温佳;赵卫中;管洋洋;黄超;李倩;胡玥;刘萍;郭莉 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | H04L12/26 | 分类号: | H04L12/26 |
代理公司: | 北京轻创知识产权代理有限公司11212 | 代理人: | 杨立 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 水军 检测 方法 装置 | ||
1.一种网络水军的检测方法,其特征在于,包括:
步骤一,将原始的用户描述信息表示为归一化的用户描述向量,从所述用户描述向量中筛选出已分类数据,将该已分类数据的a%作为深度信念网络DBN模型的训练数据,将该已分类数据的b%作为DBN模型的检测数据,a大于b,且a与b之和等于100,所述用户描述信息的类型由用户预先选定,所述已分类用户数据指已经被标记为是否网络水军的用户数据;
步骤二,用所述训练数据训练DBN模型,输出训练得到的DBN模型,将该输出的DBN模型称为输出DBN模型;
步骤三,检验所述输出DBN模型的收敛性和判定准确率,根据检验结果调整所述步骤一和步骤二中的相关参数,直至所述输出DBN模型达到预设收敛条件或终止条件,其中,所述判定准确率通过采用所述检测数据检测所述输出DBN模型而得到;
步骤四,使用最终DBN模型对网络水军进行检测,所述最终DBN模型是指达到所述预设收敛条件或终止条件的输出DBN模型。
2.根据权利要求1所述的网络水军的检测方法,其特征在于,a的初始值为60。
3.根据权利要求2所述的网络水军的检测方法,其特征在于,依据步骤二所得到的DBN模型的收敛性和判定准确率是否达到预期要求调整a的值。
4.根据权利要求1所述的网络水军的检测方法,其特征在于,步骤二中,所述DBN模型的训练过程包括模型预训练过程和模型微调过程,所述模型预训练过程采用Downpour SGD算法进行并行RBM训练,所述模型微调过程采用MapReduce算法进行并行PSO-BP神经网络训练。
5.根据权利要求1所述的网络水军的检测方法,其特征在于,所述用户描述信息包括注册时长、登录频率、在线时长、用户名长度、密码长度、发帖比例、回帖比例、相对浏览帖子时间、相对发帖时间、粉丝数和关注数。
6.一种网络水军的检测装置,其特征在于,包括用户数据预处理模块、DBN模型训练模块、协同模块和检测模块,DBN模型训练模块分别与用户数据预处理模块、协同模块和检测模块相连,协同模块还与用户数据预处理模块相连,其中:
用户数据预处理模块,用于将原始的用户描述信息表示为归一化的用户描述向量,从所述用户描述向量中筛选出已分类数据,将该已分类数据的a%作为深度信念网络DBN模型的训练数据,将该已分类数据的b%作为DBN模型的检测数据,a大于b,且a与b之和等于100,所述用户描述信息的类型由用户预先选定,所述已分类用户数据指已经被标记为是否网络水军的用户数据;
DBN模型训练模块,用于用所述训练数据训练DBN模型,输出训练得到的DBN模型,将该输出的DBN模型称为输出DBN模型;
协同模块,用于检验所述输出DBN模型的收敛性和判定准确率,根据检验结果调整所述步骤一和步骤二中的相关参数,直至所述输出DBN模型达到预设收敛条件或终止条件,其中,所述判定准确率通过采用所述检测数据检测所述输出DBN模型而得到;
检测模块,用于使用最终DBN模型对网络水军进行检测,所述最终DBN模型是指达到所述预设收敛条件或终止条件的输出DBN模型。
7.根据权利要求6所述的网络水军的检测装置,其特征在于,a的初始值为60。
8.根据权利要求7所述的网络水军的检测装置,其特征在于,依据DBN模型训练模块所得到的DBN模型的收敛性和判定准确率是否达到预期要求调整a的值。
9.根据权利要求6所述的网络水军的检测装置,其特征在于,所述DBN模型的训练过程包括模型预训练过程和模型微调过程,所述DBN模型训练模块包括预训练单元和微调单元,所述预训练单元用于采用Downpour SGD算法进行并行RBM训练,所述微调单元用于采用MapReduce算法进行并行PSO-BP神经网络训练。
10.根据权利要求6所述的网络水军的检测装置,其特征在于,所述用户描述信息包括注册时长、登录频率、在线时长、用户名长度、密码长度、发帖比例、回帖比例、相对浏览帖子时间、相对发帖时间、粉丝数和关注数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410027720.7/1.html,转载请声明来源钻瓜专利网。