[发明专利]一种统一化融合内容信息的半监督社团检测方法在审
申请号: | 202210104815.9 | 申请日: | 2022-01-28 |
公开(公告)号: | CN114491293A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 许伟忠;曹金鑫;张晓峰;丁卫平;鞠小林;鞠恒荣;黄嘉爽;程纯 | 申请(专利权)人: | 南通大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 王毅 |
地址: | 226019 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 统一化 融合 内容 信息 监督 社团 检测 方法 | ||
本发明属于复杂网络分析技术领域,具体涉及一种统一化融合内容信息的半监督社团检测方法。本发明的步骤为:形式化带有节点内容网络中的拓扑和内容信息;利用基于非负矩阵分解的生成框架实现基于标准NMF和SNMF的拓扑子模型,计算结构相似度构建must‑link先验信息以调整节点社团隶属度,借鉴pLSA主题模型思想,基于非负矩阵分解构建内容子模型;引入平衡因子统一化融合具有先验信息的拓扑子模型和内容子模型,进而构建统一化融合节点内容半监督社团检测模型,最后,利用梯度下降法学习模型参数,得到节点的社团隶属度矩阵,进行聚类以挖掘网络中社团结构,运用标准化互信息熵NMI和调整兰德系数ARI对模型性能进行评估。
技术领域
本发明属于复杂网络分析技术领域,具体涉及一种统一化融合内容信息的半监督社团检测方法。
背景技术
现实世界存在着大量的社交网络等网络化数据,可这些数据转化为复杂网络,分析复杂网络具有重要研究意义和广泛应用价值。挖掘网络中的由链接密切的节点所组成的社团是复杂网络分析领域的热门研究之一。研究发现,复杂网络同时蕴含网络拓扑和节点内容,节点内容有助于减缓拓扑中噪音以及链接缺失的影响,提高社团检测的准确率。同时,网络拓扑中存在不同的复杂结构,这些结构影响拓扑对社团结构表征能力。为了解决上述两个问题,如何有效地提高融合拓扑、先验信息与内容信息进行社团检测,以及半监督社团检测相关研究理论,亟需一种统一化融合网络拓扑、先验信息和节点内容信息的半监督社团检测新方法。
发明内容
本发明提供了一种统一化融合内容信息的半监督社团检测方法,主要是基于以下两个出发点:其一,拓扑信息所蕴含的must-link先验信息能够对网络拓扑起到增强效果,实现模型鲁棒性和性能的提升;其二,模型融入节点内容信息能够减缓由拓扑信息所存在噪音或链接缺失引发的负面影响,对拓扑信息起到一定的补充作用,从而增强模型的性能。本发明利用节点的拓扑信息计算节点的结构相似度以实现must-link先验信息的构建;利用基于非负矩阵分解的生成框架构建拓扑子模型和内容子模型;将拓扑信息、内容信息以及拓扑的先验信息进行统一化融合,实现模型鲁棒性和社团检测精度的提升。
本发明所采用的技术方案是:
一种统一化融合内容信息的半监督社团检测方法,包括以下步骤:
S1、带有节点内容信息的网络可描述为G=(V,E,F),其中V={v1,v2,…,vn}表示网络中节点的集合,E={e1,e2,…,em}表示网络中链接的集合,F={f1,f2,…,fl}表示网络中节点内容的集合;
S2、对网络G的拓扑信息和内容信息进行形式化;
S3、利用拓扑信息基于标准NMF和SNMF构建拓扑子模型,运用网络中节点拓扑信息构造must-link的先验信息,对节点社团隶属度调节以构建融合先验信息拓扑子模型,使用节点内容信息基于NMF构建内容子模型;
S4、运用生成框架将步骤S3中融合先验信息的拓扑子模型和内容子模型融合为一个统一化半监督社团检测模型,将该模型行于真实网络数据,并使用标准化互信息熵NMI和调整兰德系数ARI对同一框架下不同模型的性能进行量化评估。
作为本发明的优选技术方案:所述步骤S2具体过程如下:
S2.1、形式化拓扑信息的具体操作如下:使用邻接矩阵A={aij}∈Rn×n来表示网络拓扑信息,若节点vi和vj之间存在链接则aij=1,否则aij=0;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210104815.9/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置