[发明专利]一种社交网络分析方法和装置有效

专利信息
申请号: 201110391293.7 申请日: 2011-11-30
公开(公告)号: CN103138981B 公开(公告)日: 2017-03-29
发明(设计)人: 邓超;高丹;江志雄;徐萌;罗治国;钱岭;孙少陵 申请(专利权)人: 中国移动通信集团公司
主分类号: H04L12/24 分类号: H04L12/24
代理公司: 北京中誉威圣知识产权代理有限公司11279 代理人: 郭振兴,张杏珍
地址: 100032 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 社交 网络分析 方法 装置
【说明书】:

技术领域

发明涉及一种业务支撑技术,尤其涉及一种社交网络分析方法和装置。

背景技术

社交网络(social network)是指社会个体成员之间因为互动而形成的相对稳定的关系体系,社交网络关注的是人们之间的互动和联系,社会互动会影响人们的社会行为。

社交网络分析(social network analysis)是从社交网络角度出发,对大规模数据进行全面的,多维度的分析。社交网络可看作是由图表示的异构多关系数据集,图中节点表示对象,边表示对象间联系或相互作用的链接

过去的几十年间,社交网络受到越来越多的关注。特别是移动电信网络和互联网的发展,产生了大量的,容易被计算机处理的社交网络数据。从这些海量数据中获取知识,从而理解商业行为,识别业务模式,分析用户行为,更好利用资源,提高服务质量,将成为运营商的核心竞争力之一。

电信社群网络是一种以用户为节点、用户之间的通话为边构造的网络,该网络既体现了电信用户之间的通信关联关系,又在一定程度上体现了社会中人与人之间的社交关系。利用通话数据的多维属性,如通话时间、通话时长、频率等,从多个视角对人们日常的通话行为进行了刻画,从而深刻揭示了人们交往行为的模式和内在特征。

相对于传统的基于属性向量的分析,社交网络分析(social network analysis)通过考虑对象间连接关系,可以获得如下新知识:根据对象的属性和连接,以及连接到它的对象的属性预测对象的类型;根据所涉及的对象的性质,预测二者间交往链接的类型或目的;预测对象间是否存在交往链接;根据对象的属性和链接,预测两个对象是否事实上相同;根据对象属性和链接结构,预测对象是否处于一个组或簇。

目前,对电信通信网络和互联网这样大规模的社交网络进行分析,是一个比较困难的问题。

一方面,电信领域的用户通话记录通常是以数据库表的方式存储,而传统的关系数据库和数据仓库没有专门的网络/图数据生成和计算能力。因此,在数据仓库上进行社交网络分析,首先需要采用SQL编程的方式生成网络数据,再进行计算,导致社交网络分析的能力非常有限。

目前,中国移动经营分析系统用于用户行为分析的客户流失预测中使用到社会交往圈信息,采用的技术方案是用类似“Select主叫号码,被叫号码,sum(时长)from详单表where条件Groupby主叫号码”的SQL语句,从数据仓库中查询得到客户间主叫与被叫、时长的记录表,代表网络上节点、节点间连接、权重信息。然后将这些信息用于客户流失预测应用中。

以一个拥有3000万用户的中等规模省公司为例,平均每个用户每月有100条通话记录,则每月的话单记录数为3000万*60%*100条/月=18亿条/月,目前即使只处理一个月的18亿条话单数据生成交往圈记录表,就需要2天的时间。实际分析应用中,为保证分析效果,通常需要3~6个月的详单进行分析,因此现有方案无法适应从大规模数据生成社交网络。另外,现有技术方案也仅对具有直接通过交往行为的用户之间生成了边表格式的单层网络拓扑结构,而对用户之间的间接交往行为基本无法分析,即无法得到网络整体拓扑特征值。

另一方面,针对大规模数据,即使生成了社交网络,传统的社交网络分析软件也往往是单机应用,很难扩展以支持电信级和互联网级大规模海量数据的分析。

社交网络中网络整体拓扑特征的分析,即图上各节点和边的各种特征值的计算,是各种社交网络分析应用的基础,也是决定社交网络分析系统效率的关键计算环节。这些特征值的计算,经常需要对整个网络上所有节点和边遍历求解,这也是制约现有社交网络分析系统无法适应大规模海量数据分析的关键因素。比如,社交网络中所有节点和边的pagerank值、单源和多源最短路径值求解,都需要对整个图进行遍历。如果是大规模网络,则基于单机的分析软件,可能会出现内存无法承受的情况;或者由于各特征值的求解方法通常是n3时间复杂度,导致系统无法响应大规模网络特征计算任务。

现有技术的主要缺点包括:

1、现有基于数据仓库/数据库的社交网络生成和分析应用,无法处理由大规模数据生成社交网络的任务,且网络分析只能针对网络的单层拓扑结构特征进行分析,对网络整体拓扑结构特征的分析基本无能为力。

2、现有社交网络分析软件是基于单机的应用,无法适应电信级和互联网级海量数据形成的大规模社交网络的分析任务,尤其是对网络整体拓扑特征值分析时,需要对全部节点和边在整个网络上遍历求解的情形,成为制约系统效率和处理能力的瓶颈。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110391293.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top