[发明专利]一种针对社交网络数据中有害信息监测的解决方法在审

专利信息
申请号: 201611031105.9 申请日: 2016-11-17
公开(公告)号: CN106776748A 公开(公告)日: 2017-05-31
发明(设计)人: 王宝亮;郭宁宁;常鹏 申请(专利权)人: 天津大学
主分类号: G06F17/30 分类号: G06F17/30;G06Q50/00
代理公司: 天津市北洋有限责任专利代理事务所12201 代理人: 程毓英
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种针对社交网络数据中有害信息监测的解决方法,包括下列步骤步骤1.获取社交网络数据;步骤2.基于融合链接和时间的估计算法,衡量用户之间发布链接目的的相似性;步骤3.提取备选联盟;步骤4.备选联盟分类。本发明可以很精确地提取潜在联盟,并准确区分备选联盟的真实目的。
搜索关键词: 一种 针对 社交 网络 数据 有害信息 监测 解决方法
【主权项】:
一种针对社交网络数据中有害信息监测的解决方法,包括下列步骤:步骤1.获取社交网络数据从公开的社交网络数据集中选择多个发布次数超过20次的URL用户,将用户、发布时间、发布内容存储在数据库中,随机选择其中的80%作为训练集,剩下的20%作为测试集。步骤2.计算两两账户之间发布行为的相似度对任一链接所包含的信息量计算公式如下:It(l)=‑log(P(l))·e‑Δt  (1)其中,是链接l出现的概率,#l是训练集中链接l出现次数,N是数据集中所有链接总数;‑Δt是包含链接l的所有微博消息平均发布的时间间隔,计算各个每个账户发布的所有链接的总信息量:Iut(i)=ΣI∈LiNumi(l)·It(l)---(2)]]>Numi(l)是链接i被该账户发布过的次数;It(l)是任一链接都包含的信息量,则两个账户之间发布链接行为包含的相同的信息的量如下公式:Iut(ij)=ΣI∈Li∩LJ(Numi(l)+Numj(j))·It(l)---(3)]]>设L代表该账户发布过的所有链接(l1,l2,...,ln)的集合;I∈Li∩LJ代表两个账户共同发布的URL,计算两两账户之间发布行为的相似度:Sij=Iut(ij)Iut(i)+Iut(j)---(4)]]>步骤3.提取备选联盟设定固定阈值,将相似度较高的账户连接起来构建一个账户图G,根据账户图G提取备选联盟,形成可能的推广或者作弊联盟;步骤4.备选联盟分类(1)根据备选联盟特征进行统计,统计数据包括平均发布时间间隔、联盟账户发布带链接的消息的平均数量、联盟账户发布带链接的消息出现频率、联盟账户平均发布的链接数量、联盟密度、域名数、有效链接数、文本相似度和黑名单数量;(2)用K最近邻分类算法构造分类器对备选联盟进行分类最终得到作弊联盟。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201611031105.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top