[发明专利]基于主题交互的社区发现方法有效
申请号: | 201510390683.0 | 申请日: | 2015-07-06 |
公开(公告)号: | CN105159911B | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 王柱;於志文;冯斌;郭斌 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00;G06K9/62 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 王鲜凯 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于主题交互的社区发现方法,用于解决现有社区发现方法对社区描述准确度差的技术问题。技术方案是提取某一时间段内网络中文本、照片等的主题信息,根据网络中的每一次交互建立超图模型。对于超图模型按照用户熵以及主题熵计算超边的权值,选取用户中的种子节点,并根据超边权值计算不同节点的子图贡献度。迭代计算不同节点的贡献度,得到密集子图。以层次聚类方法对密集子图进行不同程度的聚合,得到不同层次下的社区。由于以种子节点出发构建初始子图,并根据超边权值计算不同节点的子图贡献度,然后迭代计算不同节点的贡献度,得到密集子图,对密集子图进行不同程度的聚合,得到不同主题节点对社区的贡献值,准确地描述社区。 | ||
搜索关键词: | 贡献度 社区发现 超图模型 迭代计算 权值计算 种子节点 社区 聚合 层次聚类 主题节点 主题信息 准确度 时间段 构建 网络 中文 | ||
【主权项】:
1.一种基于主题交互的社区发现方法,其特征在于包括以下步骤:步骤一、采用LDA提取微博网络中文本的主题信息,根据微博网络中用户的每一次交互信息建立超图模型;超图模型中包括用户节点以及主题节点;每一次发布行为构成一条发布边u‑t,其中u表示用户,t表示主题,每一次转发行为构成一条转发边u1‑t1‑u2,暨用户u1从用户u2处转发了主题为t1的微博文本;步骤二、计算用户集合U中不同用户有关不同主题的用户熵,同时计算主题集合T中不同主题有关不同用户的主题熵;采用
计算发布边的权重,其中Cut表示u‑t边出现的次数,evu表示用户熵,evt表示主题熵;采用
表示发布边的权值大小;步骤三、在将网络映射为超图模型后,用
表示子图V'的密度,其中s表示子图中的所有边,ws表示边的权值,si表示边s的第i个相关节点;
表示si节点对整个子图的贡献程度;若子图V'是密集子图,则f(x)达到最大值;在超图中进行社区发现的问题采用以下公式表达:
其中w(v1,…vk)表示包含节点v1,…vk的边的权值,所有节点对社区的最大贡献为1/ε,暨ε用来控制社区的初始大小;计算网络中的每一个用户节点的邻居节点的数目|Nu|,其中Nu表示用户u的邻居节点集合,
表示用户u的邻居节点ui的邻居节点数,
表示用户u的所有邻居节点的平均邻居节点数;选取|Nu|>avg(Nu)的用户节点作为种子节点;从种子节点出发,选取与种子节点相关的节点构成初始子图;在初始子图中,根据节点所在超边的权重计算节点的权重比例p(i)=(∑w(1,…k‑1,i))/(∑w(1,…,k)),其中i表示节点,w(1,…,k)表示初始子图中的超边的权值,w(1,…k‑1,i)表示初始子图中包含节点i的超边的权值;设
暨对avg(Nu)向上取整;根据节点的权重比例,以及xi<ε计算不同节点对密集子图的初始贡献度xi;步骤四、采用拉格朗日公式
进行问题求解;同时,对节点进行分类Vu(x)={i|xi∈(0,ε]},Vd(x)={i|xi∈[0,ε)},
表示f(x)关于xi的偏导数;对公式进行推导,根据组合优化的KKT条件,根据公式
迭代的计算节点xm对密集子图的贡献程度,其中i表示Vu中gi(x)最大的节点,j表示Vd中gi(x)最小的节点,l表示迭代次数;
其中gij(x)表示x的两阶导;迭代终止条件为:节点贡献度不在变化或社区大小小于ε;得到社区的密集子图;步骤五、对于得到的密集子图,采用Jaccard系数作为相似度进行度量,以层次聚类的方式得到不同程度下的社区。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510390683.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种素材处理、编辑、回迁方法及装置
- 下一篇:用于存储和查询数据的方法和系统