[发明专利]基于微博互动关系挖掘社交圈的方法及装置有效

专利信息
申请号: 201310418486.6 申请日: 2013-09-13
公开(公告)号: CN103593393B 公开(公告)日: 2017-01-04
发明(设计)人: 姜贵彬;张俊林;刘莹莹 申请(专利权)人: 微梦创科网络科技(中国)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京市京大律师事务所11321 代理人: 张璐,方晓明
地址: 100080 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 互动关系 挖掘 社交圈 方法 装置
【说明书】:

技术领域

发明涉及社交网络(SNS,Social NetWorking Services)及数据挖掘技术,尤其涉及一种基于微博互动关系挖掘社交圈的方法及装置。

背景技术

微型博客(微博)作为SNS应用的一部分,是一个基于微博用户关系的信息分享、传播以及获取平台,微博用户可以通过个人PC、移动电话等终端设备,通过微博消息或者微博图片来表达自己情感,与关注自己的微博用户分享,从而实现个人信息即时分享以及微博用户间互动,是目前发展最为迅猛的互联网业务。

在微博及SNS上,微博用户期望能够获取与自身有共同兴趣或业务需求的社交圈信息,从而提升微博体验,其中,一个社交圈中可以包括一个或多个微博用户。因而,需要通过一定的挖掘算法,获取与自身相关的社交圈信息。

GN(Girvan-Newman)算法是一种常用的挖掘社交圈信息的算法,最初由Girvan和Newman在2002年提出。GN算法的基本思想是:在由微博用户构成的微博网络中,每一微博用户对应微博网络中的一节点,如果节点与节点之间相关联,则通过边相连,定义微博网络中所有最短路径中经过边的路径的数目占最短路径总数的比例为边介数,用以反映相应的边在整个微博网络中的作用和影响力。这样,通过计算微博网络中每条边的介数,然后,从微博网络中,删除介数最大的边,如此不断循环,一直迭代删除当前介数最大的边,最终形成的由边及相应节点组成的社交圈即为挖掘出的社交圈。

但由于GN算法是一种单分类方法,也就是说,对于网络中的节点,通过GN算法,只能将微博用户分类到一个社交圈,不能将微博用户分类到多个社交圈。这与实际应用场景具有较大差异,即实际应用中,微博用户可以同时属于多个社交圈。

为了解决实际应用中微博用户可属于多个社交圈的技术问题,现有技术提出了采用最大团结构(max clique)获取微博用户所属社交圈信息的方法。最大团结构算法是一种能够进行多分类的社交圈挖掘算法,可以应用于网络中的节点同时属于多个社交圈的情况。最大团结构算法,通过对网络中节点的拓扑结构进行分析,获取满足最大团性质,例如,任意两个节点都有边连接的子图结构,也就是全联通子图,每一满足最大团性质的全联通子图为一个挖掘的社交圈。关于GN算法以及最大团结构算法的详细描述,具体可参见相关技术文献。

由上述可见,虽然最大团结构算法可以挖掘节点属于的多个社交圈,与GN算法的单分类方法相比,具有更多的实用性和应用场景。但最大团结构算法要求获取全联通子图,即获取的全联通子图中,任意两个节点都有边连接,具有非常强的约束,使得获取的全联通子图包含的微博用户数较少,微博用户从推荐的社交圈中获取所需的业务信息较难,使得推荐的全联通子图(社交圈)效率较低,从而不能满足微博用户的业务需求,降低了微博用户的业务体验。

发明内容

本发明的实施例提供一种基于微博互动关系挖掘社交圈的方法,可挖掘用户的社交圈和兴趣圈,为用户提供更优质的个性化服务。

本发明的实施例还提供一种基于微博互动关系挖掘社交圈的装置,可挖掘用户的社交圈和兴趣圈,为用户提供更优质的个性化服务。

为达到上述目的,本发明实施例提供的一种基于微博互动关系挖掘社交圈的方法,该方法包括:

A1,获取与目标微博用户具有互动行为的微博用户集合;

B1,依据互动行为关系,构造用户关系拓扑图,并基于构造的用户关系拓扑图挖掘得到全联通子图,计算挖掘得到的各全联通子图的效用值并分别存储;

C1,针对每一全联通子图,依据互动行为关系生成每一全联通子图对应的扩充微博用户集合;

D1,在扩充微博用户集合中,获取与微博用户集合中的任一微博用户具有互动行为、且不属于微博用户集合的微博用户,加入存储的扩充微博用户集合对应的全联通子图,形成社交圈候选集合;

E1,计算社交圈候选集合的效用值,确定社交圈候选集合的效用值大于或等于对应存储的效用值,更新对应存储的效用值以及全联通子图;

F1,判断加入社交圈候选集合中的微博用户是否为扩充微博用户集合中的最后一个微博用户,如果不是,遍历扩充微博用户集合,返回执行步骤D1,否则,形成社交圈集合。

其中,在所述形成社交圈集合的步骤之前,该方法进一步包括:

A11,在微博互动行为日志中,获取与微博用户集合中的任一微博用户具有互动行为、且不属于微博用户集合的微博用户,构建二级互动集合;

A12,将获取的微博用户加入存储的全联通子图,形成二级社交圈候选集合;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310418486.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top