[发明专利]一种基于元结构的无监督异质网络表示学习方法有效

专利信息
申请号: 201911327882.1 申请日: 2019-12-20
公开(公告)号: CN111091005B 公开(公告)日: 2022-05-13
发明(设计)人: 冯春燕;楚云霏;郭彩丽;贺同泽 申请(专利权)人: 北京邮电大学
主分类号: G06F40/295 分类号: G06F40/295;G06F40/30;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 结构 监督 网络 表示 学习方法
【说明书】:

发明公开了一种基于元结构的无监督异质网络表示学习方法,属于人工智能领域。首先给出事件数据的定义,并构建针对事件数据的异质网络模型;采用元结构来描述事件数据中基于事件的关联关系类型,并基于给定的元结构进行邻居节点采样;提出基于元结构邻近度的网络表示学习模型,以捕捉单视角下基于事件语义的关联关系;提出融合多视角关联关系的网络表示学习模型,以捕捉多视角下基于事件语义的关联关系;最后用随机梯度下降法进行训练,得到各节点的特征向量表示。本发明提出用元结构描述复杂的事件语义关系,设计网络表示学习模型解决了事件数据缺乏标签、异质、关联多视角的挑战,提供了低复杂度的训练算法。

技术领域

本发明属于人工智能领域,涉及网络表示学习,具体是一种基于元结构的无监督异质网络表示学习方法,该方法可以捕捉异质网络节点间的事件语义。

背景技术

互联网的普及以及社交媒体的井喷式发展,促使大量实体产生相互关联关系,组成了网络。独立同分布的假设在这种网络数据不再成立,使得传统的机器学习方法不再适用。

网络表示学习将相互关联的实体节点投射到低维稠密向量空间并保证尽可能多的蕴含原网络的信息,自动学习到网络中节点的特征表示,使得现成的机器学习算法可以直接运用于所学的节点表示上以实现节点分类、聚类、链接预测、数据可视化等数据挖掘任务,成为了人工智能领域面向网络数据挖掘的一种极具潜力的技术,受到学术界和工业界广泛关注。

在真实世界中,实体往往通过参与事件而产生关联,产生大量事件数据。相比于同类型的简单关联关系,如人与人之间的好友关系、文档中词语间的共现关系、互联网中页面的超链接关系等,事件数据中的关联关系更加复杂,具有以下四种特性。首先参与事件的实体往往为不同类型的,即这种关联关系为异质的,现成异质网络;其次,这种关联关系能反映出基于事件的语义信息;最后,实体参与的事件类型多样,形成了多视角的关联关系。除此之外,现实情况下,实体往往缺乏标签信息作为监督。

这些特性使得现有的网络表示学习方法难以适用。现有的网络表示学习方法按是否考虑节点类型可以分为同质网络表示学习和异质网络表示学习。同质网络表示学习方法忽略了节点的类型信息,同等对待不同类型的节点,导致语义信息捕捉不足。为解决这一问题,异质网络表示学习方法陆续提出,他们大多利用元路径结构,即由节点类型组成的序列结构来捕捉节点间关联的语义。然而复杂语义关系通常为子图结构,难以用路径结构捕捉,因此此类基于元路径的异质网络表示学习方法在捕捉复杂事件语义上受限。因此本发明研究一种可捕捉复杂事件关联关系的无监督异质网络表示学习方法以解决上述问题。

发明内容

本发明为了解决上述问题,提供了一种基于元结构的无监督异质网络表示学习方法,通过捕捉事件数据中的实体节点之间语义关系以解决缺乏标签信息的问题,将事件数据中的异质实体节点用异质网络描述以解决异质问题,提出采用元结构来捕捉节点间交互的事件语义,并采用联合训练的方式以整合多视角的关联关系。

具体步骤包括:

步骤一、构建针对事件数据的异质网络模型;

首先,将事件数据定义为实体通过参与事件产生的数据,用事件的集合ε={e}表示,其中e表示事件,ε表示事件集合;每个事件e都有自己的事件类型,且描述了参与其中的实体节点的关联关系,定义为e={Ve,Re},其中Ve为节点集合,Re为关系集合。

然后,给定事件数据ε,构建异质网络Gε={V,E}来建模节点间关联,其中V=∪e∈εVe表示节点集合,R=∪e∈εRe表示关系集合。节点和关系有各自的类型映射函数和以指明节点和关系的类型。

步骤二、基于元结构的邻居节点采样;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911327882.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top