[发明专利]为网络中节点确定向量表示形式的方法及装置有效
申请号: | 201710343881.0 | 申请日: | 2017-05-16 |
公开(公告)号: | CN108880846B | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 韩矞;刘志斌;唐杰;陈谦;刘潇;刘德兵;郑宇飞 | 申请(专利权)人: | 清华大学;腾讯科技(深圳)有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 朱雅男 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 节点 确定 向量 表示 形式 方法 装置 | ||
本发明公开了一种为网络中节点确定向量表示形式的方法及装置,属于网络技术领域。该方法包括:根据网络中的节点和节点信息,生成网络结构;获取每个节点的初始背景向量和初始目标向量;以每个节点为起点进行随机游走,得到节点序列,并确定每个节点的节点频数;对每个节点的背景向量和目标向量进行迭代计算,得到每个节点的向量表示形式。本发明通过生成包括原始节点和群组节点的网络结构,并通过对每个节点的背景向量和目标向量进行迭代计算,得到包括原始节点和群组节点在内的每个节点的向量表示形式。由于基于原始节点和群组节点的向量表示形式,不仅可度量原始节点间的相似度,而且度量原始节点和群组节点的相似度,因而应用范围较广。
技术领域
本发明涉及网络技术领域,特别涉及一种为网络中节点确定向量表示形式的方法及装置。
背景技术
近年来,随着网络技术的发展,在线社交网络、学术网络等网络已经深入到用户生活的方方面面,成为用户获取信息、传播信息、交友、学术研究的重要途径。如果将在线社交网络中的用户或学术网络中的文章称为原始节点,将用户或文章组成的群组称为群组节点,由于原始节点间、原始节点与群组节点的相似度,对国家信息安全、社会稳定及学术发展有重要影响,因此,为了更好地研究这些网络,需要为网络中节点确定向量表示形式,进而根据网络中节点向量的表示形式进行度量。
以采用DeepWalk方法为例,现有技术在为网络中节点确定向量表示形式时,可采用如下方式:根据原始节点和原始节点间链接信息,生成初始网络结构;以初始网络结构中的每个原始节点为起点,根据原始节点间的链接信息,沿着网络中原始节点之间的边进行随机游走,得到节点序列;基于skip-gram模型对节点序列进行训练,得到每个原始节点的向量表示形式。
由于现有技术仅确定了原始节点的向量表示形式,基于所确定的向量表示形式只能度量原始节点间的相似度,因此,现有的确定方法应用范围较窄,具有一定的局限性。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种为网络中节点确定向量表示形式的方法。所述技术方案如下:
一方面,提供了一种为网络中节点确定向量表示形式的方法,所述方法包括:
根据网络中的节点和节点信息,生成网络结构,所述节点包括原始节点和群组节点,所述节点信息包括原始节点间链接信息和原始节点与群组节点间链接信息;
获取每个节点的初始背景向量和初始目标向量;
以每个节点为起点进行随机游走,得到节点序列;
根据所述节点序列,确定每个节点的节点频数;
根据每个节点的初始背景向量和初始目标向量、所述节点序列以及每个节点的节点频数,确定每个节点的向量表示形式。
另一方面,提供了一种为网络中节点确定向量表示形式的装置,所述装置包括:
网络结构生成模块,用于根据网络中的节点和节点信息,生成网络结构,所述节点包括原始节点和群组节点,所述节点信息包括原始节点间链接信息和原始节点与群组节点间链接信息;
初始向量获取模块,用于获取每个节点的初始背景向量和初始目标向量;
随机游走模块,用于以每个节点为起点进行随机游走,得到节点序列;
节点频数确定模块,用于根据所述节点序列,确定每个节点的节点频数;
确定模块,用于根据每个节点的初始背景向量和初始目标向量、所述节点序列以及每个节点的节点频数,确定每个节点的向量表示形式。
本发明实施例提供的技术方案带来的有益效果是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;腾讯科技(深圳)有限公司,未经清华大学;腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710343881.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息提示的方法以及相关装置
- 下一篇:一种定位故障的方法及装置