[发明专利]一种基于标签传播算法的社团发现方法及系统有效
申请号: | 201410657458.4 | 申请日: | 2014-11-18 |
公开(公告)号: | CN105677648B | 公开(公告)日: | 2018-08-28 |
发明(设计)人: | 吴海贵 | 申请(专利权)人: | 四三九九网络股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 席小东 |
地址: | 361008 福建省厦门市厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于标签传播算法的社团发现方法及系统,方法包括:获得源数据,初始化初始的关系网络图;以随机顺序排列关系网络图中的各个节点,按所排列的顺序遍历更新关系网络图中的所有节点的标签;其中,节点m更新方法为:判断节点m的所有邻接节点中出现次数最多的标签是否为一个,如果不是,则将出现次数最多的标签所对应的邻接节点组成邻接节点集M,从邻接节点集M中选取与节点m连接的向量的权重值最大的邻接节点作为选定节点,将选定节点的标签更新为节点m的新标签;当满足终止条件时,网络论坛的社团划分过程结束,具有相同标签的节点所对应的用户ID属于同一个社团。能够更准确的实现社团的划分,得到网络论坛的社团分布情况。 | ||
搜索关键词: | 一种 基于 标签 传播 算法 社团 发现 方法 系统 | ||
【主权项】:
1.一种基于标签传播算法的社团发现方法,其特征在于,包括以下步骤:S1,获得源数据:即,对于被分析的网络论坛,通过读取数据库,获得所述网络论坛中某一历史时刻T1至当前时刻T2之间的所有单向互动记录,其中,所述单向互动记录包括发起方的用户ID以及接收方的用户ID;S2,将所述网络论坛中某一历史时刻T1至当前时刻T2之间的参与单向互动的所有用户ID分别映射为关系拓扑网络图的节点;将单向互动关系映射为关系拓扑网络图中节点之间相互连接的向量,其中,向量的方向为:由代表单向互动发起方的节点指向代表单向互动接收方的节点;将在某一历史时刻T1至当前时刻T2之间通过向量连接的两个节点之间的单向互动次数作为连接所述两个节点的向量的权重值,由此得到初始的关系网络图;S3,初始化所述初始的关系网络图,即:为所述初始的关系网络图中的每个节点均赋予唯一的标签;S4,令迭代计数器t=1;S5,以随机顺序排列S3得到的关系网络图中的各个节点,按所排列的顺序遍历更新所述关系网络图中的所有节点的标签;其中,对于任意一个节点m,对所述节点m进行更新的方法为:首先获取节点m的所有邻接节点;其中,所述邻接节点指:与节点m发生互动,并且,相对于节点m,作为单向互动接收方的所有节点;然后,判断节点m的所有邻接节点中出现次数最多的标签是否为一个,如果是,则将所有邻接节点中出现次数最多的标签更新为节点m的新标签;如果不是,则将出现次数最多的标签所对应的邻接节点组成邻接节点集M,然后,从所述邻接节点集M中选取与所述节点m连接的向量的权重值最大的邻接节点作为选定节点,将所述选定节点的标签更新为节点m的新标签;S6,判断是否满足预设置的迭代终止条件,其中,所述迭代终止条件指:所述关系网络图中的任意节点m’的标签满足以下条件:如果节点m’的所有邻接节点中出现次数最多的标签为一个,则节点m’的标签等于其所有邻接节点中出现次数最多的标签;如果节点m’的所有邻接节点中出现次数最多的标签为两个以上,将出现次数最多的标签所对应的邻接节点组成邻接节点集M’,则节点m’的标签等于邻接节点集M’中与节点m’连接的向量的权重值最大的邻接节点的标签;如果未满足,则令t=t+1,反复迭代执行S5,直至满足预设置的终止条件;如果满足,则对所述网络论坛的社团划分过程结束,具有相同标签的节点所对应的用户ID属于同一个社团。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四三九九网络股份有限公司,未经四三九九网络股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410657458.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种采用旋流分离的雨水截污井
- 下一篇:一种卫生间排水盖板条