[发明专利]一种基于转发网络层次分析的在线社交网络谣言预测方法在审

申请号：	201710573428.9	申请日：	2017-07-14
公开（公告）号：	CN107451923A	公开（公告）日：	2017-12-08
发明（设计）人：	赵子龙;李大庆;高佳利	申请（专利权）人：	北京航空航天大学
主分类号：	G06Q50/00	分类号：	G06Q50/00;G06Q10/04;G06F17/30
代理公司：	北京慧泉知识产权代理有限公司11232	代理人：	王顺荣,唐爱华
地址：	100191***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于转发网络层次分析的在线社交网络谣言预测方法，其步骤如下一、对在线社交网络进行收集并做预处理；二、针对单条在线社交网络上的信息，建立转发传播网络；三、求出直接转发发布者信息与间接转发发布者信息各自的转发次数，求解上述直间接转发之比，针对已知的谣言型在线社交网络信息与事实型在线社交网络信息，得到训练数据结果；四、对于未知是否为谣言的在线社交网络信息，求解其直间接转发之比，结合训练数据，给出该信息为谣言的概率；本发明在传统的语义分析之外，从信息转发传播的网络结构角度，对信息是否为谣言进行量化和评价，能够支持在线社交网络的舆情控制，对互联网与经济社会融合发展提供强有力的方法支撑。
搜索关键词：	一种基于转发网络层次分析在线社交谣言预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于转发网络层次分析的在线社交网络谣言预测方法，其特征在于：其步骤如下：步骤一、对在线社交网络进行收集并做预处理；本发明基于满足以下要求的谣言型和事实型的在线社交网络数据：(a)用户信息：参与在线社交网络的用户编号，每个编号唯一对应一个用户，一个用户可能参与多条在线社交网络中的信息，并额外记录信息的发布者的用户信息；(b)转发信息：被转发用户编号和转发用户编号，每个编号唯一对应一个用户，转发编号；现实采集到的数据往往是有缺失及有错误的，这时候需要运用数据补偿、数据筛选方法对数据进行预处理，保证每个参与用户、每次信息转发信息正确性和完整性；步骤二、针对单条在线社交网络上的信息，建立消息的转发网络G；将在线社交网络中的用户抽象为网络模型中的节点V，不同节点的编号为用户的编号；将某个消息的转发关系抽象为网络模型中的连边E，不同连边的编号为转发的编号；除此以外，连边两侧的节点信息同样被记录，边的方向为信息流的方向，即从信息源指向新的转发者；网络中的度是指与某个节点代表的用户直接相连的边数目；将顶点i的度定义为ki；由于信息传播转发网络是一个有向网络，所以每个定点的度分为两类：入度和出度；入度是连接到该节点代表的用户的入边数目，用来表示；出度则是连接到该节点代表的用户的出边数目，用来表示；一般来说，单个节点的度不甚重要，整个网络的度分布才更有意义；度分布常用概率生成函数来表示：如果网络中度为j的节点概率为pj，概率分布pj的生成函数是多项式g(z)=p0+p1z+p2z2+...=Σj=0∞pjzj]]>网络中的层数是对于一条边来说，从代表发布者的节点开始，经过几次转发才能传播到这条边；将边i的度定义为Li；边2是从发布者开始的第一次转发，所以它的层数L2＝1；同理，边3是从发布者开始的第二次转发，它也是基于边2的一次转发，所以它的层数L3＝2；步骤三、求出直接转发发布者信息与间接转发发布者信息各自的转发次数m，并求解上述间接与直接转发之比，针对已知的谣言型网络信息与事实型网络信息，得到训练数据结果；接下来，将转发关系分为两类：一类是直接转发发布者信息，从网络模型的角度上来讲，边的起点是发布者所代表的节点；另一类是间接转发发布者信息，边的起点不是发布者所代表的节点；第一类情况描述的实际上是发布用户所能直接影响的范围，而第二类情况描述的是在其他的用户的推动下，进而扩大其影响力，让更多的转发参与到该信息的传播中来；根据上述分类，分别统计间接转发发布者信息与直接转发发布者信息各自的转发次数m1和m2；但这一绝对的次数随着网络规模的增大而增大；由于现实生活中在线社交网络规模有大有小，所以绝对的次数不能作为衡量信息是否为谣言进行量化和评价指标，而为某层相对规模及层间规模之比；在在线社交网络当中，我们用间接转发发布者信息的转发次数除以直接转发发布者信息的转发次数得到一个相对的比值m1/m2，而已知的谣言型网络信息与事实型网络信息在这一比值上存在固有差异：事实型相比谣言型，往往拥有相对更小的间接与直接转发之比；原理是参与者更趋向于相信事实类信息的发布者，更愿意直接转发他们的微博；因此直接转发次数相对多，即拥有相对更小的间接与直接转发之比；而在谣言类信息中，参与者更趋向于仅仅相信自己的朋友，谣言类信息在在线社交网络中口耳相传；因此间接转发次数相对多，往往拥有相对更大的间接与直接转发之比；由于在这一比值上存在固有差异，所以这一比值能对信息是否为谣言进行量化和评价；步骤四、对于未知是否为谣言的在线社交网络信息，求解其间接与直接转发之比，结合训练数据，给出该信息为谣言的概率；针对未知类型的在线社交网络信息也是类似，分别统计直接转发发布者信息与间接转发发布者信息各自的转发次数，再用后者除以前者得到一个相对的比值；具体而言，分别统计间接转发发布者信息m1与直接转发发布者信息各自的转发次数m2，再用前者除以后者得到一个相对的比值m1/m2；结合已知的谣言型的分布在x＝m1/m2处的概率y1与事实型的分布在x处的概率y2，得到该信息为谣言的概率为y1/(y1+y2)；根据上述步骤，可以给出该信息为谣言的概率；通过以上步骤，本发明从网络结构角度结合转发网络层次分析方法，能够解决谣言传播控制等在线社交网络的舆情控制中的实际问题，从而有效地对在线社交网络中的信息是否为谣言进行量化和评价；本发明能对互联网与经济社会的融合发展提供强有力的方法支撑。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京航空航天大学，未经北京航空航天大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710573428.9/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q50-00 专门适用于特定经营部门的系统或方法，例如公用事业或旅游
G06Q50-02 .农业；渔业；矿业
G06Q50-04 .制造业
G06Q50-06 .电力、天然气或水供应
G06Q50-08 .建筑
G06Q50-10 .服务

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于转发网络层次分析的在线社交网络谣言预测方法在审

专利文献下载