[发明专利]一种保留类型序列信息的异构信息网络表示学习方法和系统在审
申请号: | 201910022868.4 | 申请日: | 2019-01-10 |
公开(公告)号: | CN111428744A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 陈郁馨;王腾蛟;陈薇;李强;杨旭升;邱镇 | 申请(专利权)人: | 北京大学;国网信息通信产业集团有限公司;国家电网有限公司;国网浙江省电力有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 保留 类型 序列 信息 信息网络 表示 学习方法 系统 | ||
1.一种保留类型序列信息的异构信息网络表示学习方法,其特征在于,包括以下步骤:
1)为异构信息网络中的每个节点生成其对应的类型序列集合;
2)异构信息网络中的每个节点通过编码器中的类型感知GRU结合节点的类型向量来学习隐藏状态,作为节点的表示结果,由此将当前节点映射到一个低维向量表示结果;
3)将编码器得到的隐藏状态作为输入,利用解码器中的类型感知GRU结合先前的节点类型和关系类型信息来预测类型序列的当前元素,由此为每个节点重建其类型序列;
4)利用衰减函数将将每个时间步的类型感知GRU组合起来,采用最近优先策略保留有代表性的类型序列信息;
5)通过不断迭代计算步骤2)~4)对编码器、解码器中的参数进行优化,从而得到异构信息网络表示学习模型;
6)输入待学习的异构信息网络,通过步骤5)的异构信息网络表示学习模型得到待学习的异构信息网络中的每个节点的表示结果,即每个节点的编码器输出的隐藏状态。
2.根据权利要求1所述的方法,其特征在于,所述编码器和解码器是以类型感知GRU为门控单元的RNN网络。
3.根据权利要求1所述的方法,其特征在于,所述类型感知GRU将类型和序列信息融合到隐藏状态,所述类型感知GRU引入矩阵和T作为类型向量的参数,从而结合类型信息对更新门、重置门和隐藏状态进行计算;所述类型感知GRU的定义如下:
其中,为第l步的重置门,为第l步的更新门,为第l步的隐藏状态,σ表示sigmoid函数;表示在更新门、重置门和隐藏状态计算时对应的节点向量的参数;表示在更新门、重置门和隐藏状态计算时对应的前一步长隐藏状态的参数;表示类型序列的第l-1个元素的节点向量;表示类型序列的第l-1个元素的类型向量;表示第l-1个时间步长的隐藏状态。
4.根据权利要求1所述的方法,其特征在于,所述最近优先策略是指:类型序列中的元素越接近当前节点,则其拥有更高的权重;所述衰减函数引入关于跳数计数距离的衰减因子α,并将每个时间步长的条件概率与衰减函数相结合,第i个节点vi的类型序列的条件概率定义为:
其中e-α(l-1)为衰减函数,为节点类型序列的第l个元素,L为类型序列中的元素个数,为编码器最终的隐藏状态。
5.根据权利要求4所述的方法,其特征在于,步骤1)以异构信息网络中每个节点作为起始点在异构信息网络中进行多次随机游走,得到多条以当前节点为起始点长度为l的路径,作为类型序列集合。
6.根据权利要求5所述的方法,其特征在于,步骤1)从长度为l的路径中生成以第个节点为起始点、长度为的子路径,该子路径作为该子路径起始节点的类型序列,由此得到节点的类型序列集合。
7.根据权利要求1所述的方法,其特征在于,步骤2)的异构信息网络中的每个节点通过编码器中的word2vec方法映射到一个节点向量和一个类型向量。
8.根据权利要求1所述的方法,其特征在于,步骤3)由解码器中的第一个类型感知GRU将编码器输出的隐藏状态作为输入,计算得到解码器的第一个隐藏状态,此后解码器的第l步的隐藏状态由对应类型序列元素的节点向量和类型向量以及前一时间步长的隐藏状态计算得到。
9.根据权利要求1所述的方法,其特征在于,步骤4)利用衰减函数将每个时间步长的条件概率结合起来,最小化损失函数,使得预测出的类型序列与其真实的类型序列的差距最小;步骤5)不断迭代计算步骤2)-4)中的参数,从而得到异构信息网络表示学习模型。
10.一种采用权利要求1所述方法的异构信息网络表示学习系统,其特征在于,包括编码器模块和解码器模块,所述编码器模块和所述解码器模块中均含有类型感知GRU;
所述编码器中的类型感知GRU结合节点的类型向量来学习隐藏状态,作为节点的表示结果,由此将当前节点映射到一个低维向量表示结果;
所述解码器中的类型感知GRU结合先前的节点类型和关系类型信息来预测类型序列的当前元素,由此为每个节点重建其类型序列;
所述解码器利用衰减函数将将每个时间步的类型感知GRU组合起来,采用最近优先策略保留有代表性的类型序列信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;国网信息通信产业集团有限公司;国家电网有限公司;国网浙江省电力有限公司,未经北京大学;国网信息通信产业集团有限公司;国家电网有限公司;国网浙江省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910022868.4/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置