[发明专利]一种社交网络拓扑结构的推断方法有效
申请号: | 201610365770.5 | 申请日: | 2016-05-27 |
公开(公告)号: | CN106022937B | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 宋国杰;窦芃;赵彤 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/95 | 分类号: | G06F16/95 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 苏爱华 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公布了一种社交网络拓扑结构的推断方法,针对存在缺失的级联数据,通过估计在网络中添加不同边所带来似然值的边际增益的大小,得到逐步添加边的顺序,每次添加似然值最大的边,直至所有边添加完成,由此补全所述社交网络拓扑结构;包括:初始化待推断网络G、进行循环迭代计算边际收益和取边际收益最大的边添加到Gi‑1中得到新的网络,完成迭代即得到推断出的网络拓扑结构。本发明方法适用性广,尤其可以应用于级联数据缺失情形;本发明技术方案在保持较高的时间效率基础上,显著提升了网络推断结果的准确率,可以成为真实世界中推断隐藏网络结构的有效手段。 | ||
搜索关键词: | 一种 社交 网络 拓扑 结构 推断 方法 | ||
【主权项】:
1.一种社交网络拓扑结构的推断方法,其特征是,针对存在缺失的级联数据,通过估计在所述网络中添加不同边所带来似然值的边际增益的大小,得到逐步添加边的顺序,每次添加似然值最大的边,直至所有边添加完成,由此补全所述社交网络拓扑结构;包括如下步骤:1)初始化社交网络为边集为空的待推断网络G,所述初始的待推断网络G中仅有节点,节点之间没有边相连;2)缺失级联数据集设为
包含多个独立的缺失级联数据
所述缺失级联数据
是完整级联数据的子集,其中缺失部分激活节点和节点时间信息;设定迭代次数为m次,将缺失级联数据集作为输入,进行循环迭代,每次迭代执行步骤3)~步骤4);3)计算边际收益,所述边际收益是网络Gi‑1中添加一条候选边ei变成网络Gi时,对缺失级联数据集
中的每个缺失级联数据所带来的概率值的边际增益;计算在网络Gi‑1中添加所有候选边的边际收益;所述计算边际收益的步骤如下:31)初始化:对于缺失级联数据集
的每个缺失级联数据
执行M次蒙塔卡罗模拟仿真,对缺失级联数据中的缺失值进行估计,得到估计值;每次蒙塔卡罗模拟仿真过程执行如下步骤32);32)对在
中被激活的每个激活节点u,在当前网络Gi中执行一次蒙塔卡罗传播模拟仿真,得到一棵仿真传播树T(u);将所有激活节点对应的传播树T(u)进行合并,构造得到最大级联传播合并树T*,T*中激活节点的集合为补全的级联数据t;由此得到缺失级联数据中的缺失值的估计值;33)通过式2计算补全级联数据t在合并树T*上的传播概率:
式2中,f(t;T*)为补全级联t在合并树T*上的传播概率;P(u,v)是节点u和v之间的传播概率,γ是设定的节点激活概率;34)用步骤33)所述补全级联数据t在T*上的传播概率代替补全级联数据t在当前网络Gi上的最大传播概率f(t;Gi‑1∪ei);35)对缺失级联数据集
的传播概率进行估计:通过对缺失级联数据
的M次仿真估计似然值取均值,作为补全缺失级联数据
的传播概率似然值的估计值;对缺失级联数据集
中的每个缺失级联数据执行步骤32),对级联数据
的缺失进行仿真估计,然后对每个级联的概率似然值求积,得到缺失级联数据集
的概率似然值
估计,表示为式4:
式4中,ti,j为
中第i个缺失级联
在第j次仿真中得到的补全级联;M为蒙塔卡罗模拟仿真算法执行次数;计算边际收益:将缺失级联数据集
在网络Gi‑1∪ei上的概率值减去
在网络Gi‑1上的概率值,作为本次添加候选边ei的边际收益;4)通过贪心算法加边,在第3)步计算结果中,取边际收益最大的边添加到Gi‑1中,得到网络Gi;5)完成循环迭代m次,得到包含m条边的网络结构,即得到推断出的网络拓扑结构。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610365770.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种LED显示单元的电器盒
- 下一篇:一种价格参数处理方法及系统