[发明专利]一种基于社区划分的在线社交网络海量数据存储方法有效

专利信息
申请号: 201410058324.0 申请日: 2014-02-21
公开(公告)号: CN103838831B 公开(公告)日: 2017-02-22
发明(设计)人: 蒋嶷川;陈昭娣 申请(专利权)人: 东南大学
主分类号: G06F17/30 分类号: G06F17/30;H04L29/06
代理公司: 南京苏高专利商标事务所(普通合伙)32204 代理人: 柏尚春
地址: 210018 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种基于社区划分的在线社交网络海量数据存储方法,从社交网络的图结构出发,首先根据节点度大小将网络分成名人用户层和普通用户层,再对每一层利用模块度优化的方法进行社区划分。设计一种小集团结伴策略对初始网络进行预处理,形成一个超网,采用边权重优先方案逐步合并超节点以提高模块度。社区划分完成之后,优先存储普通用户数据,将同一社区的用户数据存储在相同服务器节点上,对于名人用户数据优先考虑选择存放在粉丝最多的服务器,其次考虑存放在自身社区所在的服务器节点。设计名人用户数据多副本存储,以减少单台服务器的负载。利用社区划分方法存储社交网络数据,可以提高访问的局部性,减少通信耗费。
搜索关键词: 一种 基于 社区 划分 在线 社交 网络 海量 数据 存储 方法
【主权项】:
一种基于社区划分的在线社交网络海量数据存储方法,其特征在于包括以下步骤:(1)获取社交网络结构;(2)将步骤(1)中所得的社交网络结构分为名人用户网络层和普通用户网络层;(3)采用模块度优化方法对步骤(2)中所得普通用户网络层和名人用户网络层分别进行社区划分,具体方法如下:(31)假设初始网络有n个节点,编号为i,且i=1,2,...,n,每个节点的度分别为ki,依据节点度优先方法,优先让度大的节点选择h跳以内的好友为一个小集团,再从剩余的节点中找到节点度最大的节点,重复结伴操作,直至所有节点都被包含在一个小集团中,对每个小集团编号Ci,即初始的社区编号;(32)结伴操作完成后,将每个小集团封装成一个超节点,超节点与超节点之间边的权重设定为内部子节点之间的权重之和,形成超网G0,即初始的网络结构;(33)通过模块度优化的方法,将超节点合并,超节点之间连边的权重越大,则说明两个超节点内部的节点联系越紧密;设t时刻网络结构为Gt,邻接矩阵为At;根据公式计算此时模块度为Qt,公式中ki=∑iAij,m为网络中所有连边的权重之和,即ki是节点i连边的权重之和,kj=∑jAij,Ci表示节点i所在的社区编号,Cj表示节点j所在的社区编号,δ(Ci,Cj)是一个关于Ci和Cj的函数,当Ci=Cj时,δ(Ci,Cj)的值为1,反之为0,j为用户编号,取值1,2,3…,编号为j的节点的度分布为kj;Aij表示节点i指向节点j的边的权重;(34)t+1时刻的合并超节点操作中,采用权重优先策略,优先将权重大的边两端的超节点合并,计算合并后的模块度Qnew;如果Qnew≥Qt,则选择合并,Qt+1=Qnew,形成网络Gt+1;反之不合并,继续选择边权重次大的两个超节点合并;(35)重复步骤(33)及步骤(34)的过程,直至模块度的值稳定为止,稳定状态时相邻两个时刻的模块度的值相差不大于ε值,即Qt+1‑Qt≤ε;(4)按照社区大小进行数据存储;(5)将名人用户进行多副本存储。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410058324.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top