[发明专利]一种具有社团结构的网络表示学习方法及装置在审
| 申请号: | 202010723330.9 | 申请日: | 2020-07-24 |
| 公开(公告)号: | CN111860866A | 公开(公告)日: | 2020-10-30 |
| 发明(设计)人: | 何嘉林 | 申请(专利权)人: | 西华师范大学 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 李朝虎 |
| 地址: | 637000 *** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 具有 社团 结构 网络 表示 学习方法 装置 | ||
1.一种具有社团结构的网络表示学习方法,其特征在于,包括以下步骤:
步骤1:数据收集与处理阶段:使用一种密度函数,通过在网络G上使用随机游走策略,获得顶点序列样本S={s1,s2,...,sn};
步骤2:数据表示学习阶段:优化Skip-gram模型,使用Skip-gram模型来训练顶点序列样本S={s1,s2,...,sn},得到每个顶点序列的向量表示;
步骤3:数据计算阶段:对每个顶点序列的向量表示进行相似度计算,获得社团划分相似度。
2.根据权利要求1所述的一种具有社团结构的网络表示学习方法,其特征在于,所述步骤1中,顶点序列样本S={s1,s2,...,sn}中顶点序列表示为s={v1,v2...,v|s|}。
3.根据权利要求2所述的一种具有社团结构的网络表示学习方法,其特征在于,
所述步骤1中的密度函数定义为:
其中和分别是顶点序列s中所有顶点的内部度之和与外部度之和,而α是分辨率参数,用于控制社团的大小;
所述密度函数还具有密度增益Δfvs,所述密度增益Δfvs应满足如下公式:
△fs=fs+{v}-fs
其中符号s+{v}表示将顶点v移到s后得到的新顶点序列。
4.根据权利要求3所述的一种具有社团结构的网络表示学习方法,其特征在于,所述步骤1中获得顶点序列样本的具体步骤为:
步骤11:从集合N′(v|s|)中随机选择一个顶点v|s|+1;
步骤12:根据公式△fs=fs+{v}-fs计算Δfsv|s|+1;
步骤13:如果Δfsv|s|+10,则从集合N′(v|s|)中删除v|s|+1,然后返回步骤11;
步骤14:如果Δfsv|s|+10,则将v|s|+1添加到集合s上,并将v|s|+1标记为当前顶点;
其中顶点v|s|是最后添加的顶点,令最后添加的顶点v|s|为当前顶点;N′(v|s|)表示当前顶点v|s|的所有不在s中的邻居顶点集合;重复步骤11~步骤14直到不能增加顶点序列s的密度为止。
5.根据权利要求2所述的一种具有社团结构的网络表示学习方法,其特征在于,所述步骤2中Skip-gram模型通过最小化以下目标函数来训练顶点序列样本:
其中t是窗口大小,vj是vi在窗口内的上下文网络中的顶点表示,以上公式中的概率p(vj|vi)定义为
其中Φ(s)表示s的嵌入向量,Φ′(s)表示上下文向量,s表示顶点序列集合。
6.根据权利要求1所述的一种具有社团结构的网络表示学习方法,其特征在于,所述步骤3中对每个顶点序列的向量表示进行相似度计算具体包括:对于网络中每个顶点序列的向量表示计算它与其他的顶点序列的向量表示的相似程度,具体使用NMI公式计算相似度。
7.一种具有社团结构的网络表示学习装置,其特征在于,包括:
数据收集与处理模块,用于读取顶点序列样本,获得顶点序列样本S={s1,s2,...,sn};
数据表示学习模块,用于优化Skip-gram模型,使用Skip-gram模型来训练顶点序列样本S={s1,s2,...,sn},得到每个顶点序列的向量表示;
相似度计算模块,用于对每个顶点序列的向量表示进行相似度计算,获得社团划分相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西华师范大学,未经西华师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010723330.9/1.html,转载请声明来源钻瓜专利网。





