[发明专利]一种针对社交网络数据中有害信息监测的解决方法在审

申请号：	201611031105.9	申请日：	2016-11-17
公开（公告）号：	CN106776748A	公开（公告）日：	2017-05-31
发明（设计）人：	王宝亮;郭宁宁;常鹏	申请（专利权）人：	天津大学
主分类号：	G06F17/30	分类号：	G06F17/30;G06Q50/00
代理公司：	天津市北洋有限责任专利代理事务所12201	代理人：	程毓英
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种针对社交网络数据中有害信息监测的解决方法，包括下列步骤步骤1.获取社交网络数据；步骤2.基于融合链接和时间的估计算法，衡量用户之间发布链接目的的相似性；步骤3.提取备选联盟；步骤4.备选联盟分类。本发明可以很精确地提取潜在联盟,并准确区分备选联盟的真实目的。
搜索关键词：	一种针对社交网络数据有害信息监测解决方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种针对社交网络数据中有害信息监测的解决方法，包括下列步骤：步骤1.获取社交网络数据从公开的社交网络数据集中选择多个发布次数超过20次的URL用户，将用户、发布时间、发布内容存储在数据库中，随机选择其中的80％作为训练集，剩下的20％作为测试集。步骤2.计算两两账户之间发布行为的相似度对任一链接所包含的信息量计算公式如下：It(l)＝‑log(P(l))·e‑Δt (1)其中，是链接l出现的概率，#l是训练集中链接l出现次数，N是数据集中所有链接总数；‑Δt是包含链接l的所有微博消息平均发布的时间间隔，计算各个每个账户发布的所有链接的总信息量：Iut(i)=ΣI∈LiNumi(l)·It(l)---(2)]]>Numi(l)是链接i被该账户发布过的次数；It(l)是任一链接都包含的信息量，则两个账户之间发布链接行为包含的相同的信息的量如下公式：Iut(ij)=ΣI∈Li∩LJ(Numi(l)+Numj(j))·It(l)---(3)]]>设L代表该账户发布过的所有链接(l1,l2,...,ln)的集合；I∈Li∩LJ代表两个账户共同发布的URL，计算两两账户之间发布行为的相似度:Sij=Iut(ij)Iut(i)+Iut(j)---(4)]]>步骤3.提取备选联盟设定固定阈值，将相似度较高的账户连接起来构建一个账户图G，根据账户图G提取备选联盟，形成可能的推广或者作弊联盟；步骤4.备选联盟分类(1)根据备选联盟特征进行统计，统计数据包括平均发布时间间隔、联盟账户发布带链接的消息的平均数量、联盟账户发布带链接的消息出现频率、联盟账户平均发布的链接数量、联盟密度、域名数、有效链接数、文本相似度和黑名单数量；(2)用K最近邻分类算法构造分类器对备选联盟进行分类最终得到作弊联盟。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201611031105.9/，转载请声明来源钻瓜专利网。

上一篇：文件获取和传输的方法、装置及电子设备
下一篇：文件打开方式设置方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种针对社交网络数据中有害信息监测的解决方法在审

专利文献下载