[发明专利]一种具有社团结构的网络表示学习方法及装置在审
| 申请号: | 202010723330.9 | 申请日: | 2020-07-24 |
| 公开(公告)号: | CN111860866A | 公开(公告)日: | 2020-10-30 |
| 发明(设计)人: | 何嘉林 | 申请(专利权)人: | 西华师范大学 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 李朝虎 |
| 地址: | 637000 *** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 具有 社团 结构 网络 表示 学习方法 装置 | ||
本发明公开了一种具有社团结构的网络表示学习方法,包括以下步骤:步骤1:数据收集与处理阶段:使用一种密度函数,通过在网络G上使用随机游走策略,获得顶点序列样本S={s1,s2,...,sn};步骤2:数据表示学习阶段:优化Skip‑gram模型,使用Skip‑gram模型来训练顶点序列样本S={s1,s2,...,sn},得到每个顶点序列的向量表示;步骤3:数据计算阶段:对每个顶点序列的向量表示进行相似度计算,获得社团划分相似度。本发明方法不仅可以更好地捕获网络中的社团结构,并且可以在顶点分类任务中获得更高的准确率。
技术领域
本发明涉及计算机技术领域,具体涉及一种具有社团结构的网络表示学习方法及装置。
背景技术
许多复杂系统可以抽象成网络结构,而网络结构通常由图来表示,即由一组节点和一组连边组成。对于小规模网络,我们可以在它上面快速执行许多复杂任务,例如社团挖掘和多标签分类。然而,对于大规模网络(例如具有数十亿个顶点的网络),在它上面执行这些复杂任务是一个挑战。为了解决这个问题,我们必须找到另外一种简洁而有效的网络表示形式。网络嵌入就是解决该问题的一种有效策略,即学习网络中顶点的低维向量表示。对于每个顶点,我们将它们在网络中的结构特征映射到低维空间向量,然后再将这些向量应用于网络中的复杂任务。
在过去的几年中,有人提出了许多刻画网络局部结构的网络嵌入方法。DeepWalk方法通过使用截断的随机游走策略来刻画网络顶点的邻域结构。Node2vec方法证明DeepWalk并不能捕获网络中连接模式的多样性。它提出了一种偏向随机行走策略,该策略结合了BFS和DFS思想来探索顶点邻域信息。LINE方法主要应用于大规模网络嵌入学习。它保留了高阶的顶点邻域结构,并可以很容易地扩展到数百万个顶点。曹等人提出了一种深图表示模型,该模型采用随机冲浪策略来捕获图的结构信息。冯等人提出了“度惩罚”原则,该原则通过惩罚高度顶点之间的邻近性来保留无标度属性。王等人提出了一种半监督的深度模型,该模型能够通过优化多层非线性函数来捕获高度非线性的网络结构。Yanardag等人提出了捕获中层相似结构的通用框架。此外,他们还提出了一些用来保留全局网络结构的方法。王等人提出了一个模块化的非负矩阵分解模型,该模型保留了网络中的社团结构。涂等人提出了一种启发式的社团增强机制,该机制将社团结构信息映射到顶点向量表示中。陈等人提出了一种多层次的网络表示学习范式,它通过重新捕获初始网络的全局结构,逐步将初始网络合并为较小但结构相似的网络。
发明内容
本发明所要解决的技术问题是现有技术中刻画网络局部结构的三种网络嵌入方法不能更好地捕获网络中的社团结构,并且在顶点分类任务中不能获得更高的准确率,目的在于提供一种具有社团结构的网络表示学习方法及装置,解决上述问题。
本发明通过下述技术方案实现:
一种具有社团结构的网络表示学习方法,包括以下步骤:
步骤1:数据收集与处理阶段:使用一种密度函数,通过在网络G上使用随机游走策略,获得顶点序列样本S={s1,s2,...,sn};
步骤2:数据表示学习阶段:优化Skip-gram模型,使用Skip-gram模型来训练顶点序列样本S={s1,s2,...,sn},得到每个顶点序列的向量表示;
步骤3:数据计算阶段:对每个顶点序列的向量表示进行相似度计算,获得社团划分相似度。
进一步地,一种具有社团结构的网络表示学习方法,所述步骤1中,顶点序列样本S={s1,s2,...,sn}中顶点序列表示为s={v1,v2...,v|s|}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西华师范大学,未经西华师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010723330.9/2.html,转载请声明来源钻瓜专利网。





