[发明专利]一种统一化融合内容信息的半监督社团检测方法在审

专利信息
申请号: 202210104815.9 申请日: 2022-01-28
公开(公告)号: CN114491293A 公开(公告)日: 2022-05-13
发明(设计)人: 许伟忠;曹金鑫;张晓峰;丁卫平;鞠小林;鞠恒荣;黄嘉爽;程纯 申请(专利权)人: 南通大学
主分类号: G06F16/9536 分类号: G06F16/9536;G06Q50/00;G06K9/62
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 王毅
地址: 226019 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 统一化 融合 内容 信息 监督 社团 检测 方法
【说明书】:

发明属于复杂网络分析技术领域,具体涉及一种统一化融合内容信息的半监督社团检测方法。本发明的步骤为:形式化带有节点内容网络中的拓扑和内容信息;利用基于非负矩阵分解的生成框架实现基于标准NMF和SNMF的拓扑子模型,计算结构相似度构建must‑link先验信息以调整节点社团隶属度,借鉴pLSA主题模型思想,基于非负矩阵分解构建内容子模型;引入平衡因子统一化融合具有先验信息的拓扑子模型和内容子模型,进而构建统一化融合节点内容半监督社团检测模型,最后,利用梯度下降法学习模型参数,得到节点的社团隶属度矩阵,进行聚类以挖掘网络中社团结构,运用标准化互信息熵NMI和调整兰德系数ARI对模型性能进行评估。

技术领域

本发明属于复杂网络分析技术领域,具体涉及一种统一化融合内容信息的半监督社团检测方法。

背景技术

现实世界存在着大量的社交网络等网络化数据,可这些数据转化为复杂网络,分析复杂网络具有重要研究意义和广泛应用价值。挖掘网络中的由链接密切的节点所组成的社团是复杂网络分析领域的热门研究之一。研究发现,复杂网络同时蕴含网络拓扑和节点内容,节点内容有助于减缓拓扑中噪音以及链接缺失的影响,提高社团检测的准确率。同时,网络拓扑中存在不同的复杂结构,这些结构影响拓扑对社团结构表征能力。为了解决上述两个问题,如何有效地提高融合拓扑、先验信息与内容信息进行社团检测,以及半监督社团检测相关研究理论,亟需一种统一化融合网络拓扑、先验信息和节点内容信息的半监督社团检测新方法。

发明内容

本发明提供了一种统一化融合内容信息的半监督社团检测方法,主要是基于以下两个出发点:其一,拓扑信息所蕴含的must-link先验信息能够对网络拓扑起到增强效果,实现模型鲁棒性和性能的提升;其二,模型融入节点内容信息能够减缓由拓扑信息所存在噪音或链接缺失引发的负面影响,对拓扑信息起到一定的补充作用,从而增强模型的性能。本发明利用节点的拓扑信息计算节点的结构相似度以实现must-link先验信息的构建;利用基于非负矩阵分解的生成框架构建拓扑子模型和内容子模型;将拓扑信息、内容信息以及拓扑的先验信息进行统一化融合,实现模型鲁棒性和社团检测精度的提升。

本发明所采用的技术方案是:

一种统一化融合内容信息的半监督社团检测方法,包括以下步骤:

S1、带有节点内容信息的网络可描述为G=(V,E,F),其中V={v1,v2,…,vn}表示网络中节点的集合,E={e1,e2,…,em}表示网络中链接的集合,F={f1,f2,…,fl}表示网络中节点内容的集合;

S2、对网络G的拓扑信息和内容信息进行形式化;

S3、利用拓扑信息基于标准NMF和SNMF构建拓扑子模型,运用网络中节点拓扑信息构造must-link的先验信息,对节点社团隶属度调节以构建融合先验信息拓扑子模型,使用节点内容信息基于NMF构建内容子模型;

S4、运用生成框架将步骤S3中融合先验信息的拓扑子模型和内容子模型融合为一个统一化半监督社团检测模型,将该模型行于真实网络数据,并使用标准化互信息熵NMI和调整兰德系数ARI对同一框架下不同模型的性能进行量化评估。

作为本发明的优选技术方案:所述步骤S2具体过程如下:

S2.1、形式化拓扑信息的具体操作如下:使用邻接矩阵A={aij}∈Rn×n来表示网络拓扑信息,若节点vi和vj之间存在链接则aij=1,否则aij=0;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210104815.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top