[发明专利]一种基于局部相似度的社区挖掘方法有效

专利信息
申请号: 201410167205.9 申请日: 2014-04-24
公开(公告)号: CN103927371B 公开(公告)日: 2017-02-22
发明(设计)人: 翁伟;朱顺痣;曾志强;张念;肖蕾;马樱 申请(专利权)人: 厦门理工学院
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京科亿知识产权代理事务所(普通合伙)11350 代理人: 汤东凤
地址: 361024 福建省厦门市集美区*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 局部 相似 社区 挖掘 方法
【说明书】:

技术领域

发明涉及一种社区挖掘方法,具体地说,具体涉及一种基于局部相似度的社区挖掘方法。

背景技术

社会网络是由一些个人或组织以及它们之间的联系所构成的集合。20世纪90年代,随着网络技术的迅猛发展,特别是近几年SNS(socialnetworkingsystem)的涌现,越来越多的个人用户加入到由这些虚拟关系所构建的网络中,社会网络的研究得到了逐步加强。现今涌现出了大量的社会网络平台,包括网络论坛(如天涯社区,CSDN,小虫网等),聊天室(如新浪聊天室),校园BBS系统(如水木清华,一塌糊涂等),社会关系网站(如Facebook等),博客(如Myspace,Twitter),即时通讯网络(如MSN、QQ)等等,积累了海量的、不断更新的社会网络数据。这些社会网络是人们现实生活直接或间接的反应,并进一步影响了人们的社会行为,例如网站中互相评论、标记和连接日志的博友是现实生活中的好友,或者可能发展为现实生活中的好友,维基百科(Wikipedia)已经成为互联网上最大、最流行的参考书,IMDB论坛上的影片评论成为观众购票观影的指南。

社区是复杂的社会网络的基本特征之一。将社会网络抽象成图,将参与的对象表示成点,对象之间的关系表示成线,则社区为一个子图,该子图内部的关系比较紧密,子图与子图外部(其他子图)之间的关系相对稀疏。物理类聚,人以群分,认识网络中的社区结构,有助于理解复杂的网络结构中组织架构,进而能够理解对象之间关系的相互影响和组织功能。目前社区挖掘方法往往从某些角度定义一个描述社区优劣的定量指标,然后利用贪心算法,将初始网络看成一个社区不断拆分或将初始网络中每个结点看成是一个社区不断合并,最终使得这个指标尽可能达到最优。也有一些方法需要预定义参数(比如社区个数等阈值)和某种关系度量函数对网络结点进行分类得出社区结构。总而言之,这些方法事实上限制了社区形成的过程、形状和结构。

发明内容

为了克服现有技术中存在的缺陷,本发明提供一种基于局部相似度的社区挖掘方法,该方法通过网络结构本身联系的紧密与否发现关系紧密的局部区域,将这些局部区域视为社区的雏形赋予初始标签,然后根据投票原则采用标签传播的办法再扩展、调整这个区域形成社区。不需要任何人工参数,直接通过网络本身结点联系的紧密与否的结构性质得到社区结构。

为了叙述方便,先对基本概念进行形式化定义。设网络G=(V,E),其中V={v1,v2,......vn}为结点集合,E={e1,e2,......em}为边集,其中ei∈V×V。vi的邻居记为N(vi),即N(vi)={vj|wij>0},vi的星型邻域St(vi)={vi}∪N(vi)。记表示结点vi关联的边权值之和,定义为vi的度。

其技术方案如下:

一种基于局部相似度的社区挖掘方法,包括以下步骤:

(1)根据网络的邻接矩阵计算各结点对的相似度。

那么结点对(vi,vj)的相似度计算公式如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门理工学院,未经厦门理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410167205.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top