[发明专利]基于自编码器的跨网络数据任意维度融合方法和装置有效
| 申请号: | 201910389140.5 | 申请日: | 2019-05-10 |
| 公开(公告)号: | CN110119779B | 公开(公告)日: | 2022-03-04 |
| 发明(设计)人: | 王铮;崔健;胡长军 | 申请(专利权)人: | 北京科技大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
| 地址: | 100083*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 编码器 网络 数据 任意 维度 融合 方法 装置 | ||
1.一种基于自编码器的跨网络数据任意维度融合方法,其特征在于,包括:
步骤1、获取不同类型网络中的n个节点的嵌入表示数据信息u和节点属性信息a:其中,所述网络指的是信息网络,所述信息网络包括但不限于社交网络、电子商务网络、万维网;
u表示为节点的嵌入表示数据信息,n代表嵌入表示节点的个数,d代表嵌入表示节点维度,其中a为属性信息,且其中包括低维表示的缺失节点属性信息,pn,p代表属性信息所包含节点的个数,m代表属性信息的维度;
步骤2、将所述n个节点的嵌入表示数据信息u与节点属性信息a生成该n个节点的输入数据{x1,x2,……xn};对所述输入数据通过以下的函数进行拼接:
其中fenc()是编码函数,用于将输入数据转化为中间隐层表示数据,fdec()是解码函数,用于将中间隐层表示数据转化为最终的输出数据,θ表示这编码函数与解码函数待训练的参数;
通过fenc(xi)返回学习到的表示数据xi;
步骤3、根据拼接后的数据,构建深度自编码模型;
步骤4、对构造的深度自编码模型的目标函数进行优化,得到模型输出后的融合数据特征;
其中,所述步骤3具体包括:
步骤31、对属性信息有残缺的节点进行属性随机初始化;
步骤32、获取完整的节点属性信息和节点的嵌入表示数据信息,即完整节点信息其中ui为第i个节点的嵌入表示数据信息,ai为第i个节点的节点属性信息,表示拼接;
其中,所述步骤4具体包括:
步骤41、对构造的深度自编码模型的目标函数进行优化,得到模型输出后的融合数据特征;其中数据拼接之后优化目标函数为:
其中ψi表示为i行的二进制矩阵,矩阵n为矩阵中所包含节点的个数,在存在有属性的位置处ψi,d+1:d+m=1,在没有属性位置处则为0;阿达玛积与二进制矩阵ψ使得缺失属性的节点在重构属性的部分对重构损失函数没有影响;
步骤42、设zi为融合后的数据,即完整节点信息的编码后输出结果;n为节点个数,则目标函数重写为:
步骤43、根据该目标函数对缺失属性的节点通过解码器来预测即:
ai=[fdec(zi)]d+1:d+m,i=l+1,…,n;
其中,所述步骤4具体包括:
对于多任务学习,优化目标函数表示为:
ai=[fdec(zi)]d+1:d+m,i=l+1,…,n
在优化参数模型过程中,网络参数θ和节点属性的缺失部分Al+1:n,采用的优化方法是采用交替优化模式,迭代更新一个变量,其余变量不变的方式;其中θ采用反向传播算法更新其参数,Al+1:n经过该模型训练不断更新,最终经过不断训练可以输出任意维度融合数据z。
2.一种基于自编码器的跨网络数据任意维度融合装置,其特征在于,包括:
获取模块,被配置为用于获取不同类型网络中的n个节点的嵌入表示数据信息u和节点属性信息a:其中,所述网络指的是信息网络,所述信息网络包括但不限于社交网络、电子商务网络、万维网;
u表示为节点的嵌入表示数据信息,n代表嵌入表示节点的个数,d代表嵌入表示节点维度,其中a为属性信息,且其中包括低维表示的缺失节点属性信息,p<n,p代表属性信息所包含节点的个数,m代表属性信息的维度;
拼接模块,被配置为用于将所述n个节点的嵌入表示数据信息u与节点属性信息a生成该n个节点的输入数据{x1,x2,......xn};对所述输入数据通过以下的函数进行拼接:
其中fenc()是编码函数,用于将输入数据转化为中间隐层表示数据,fdec()是解码函数,用于将中间隐层表示数据转化为最终的输出数据,θ表示这编码函数与解码函数待训练的参数;
通过fenc(xi)返回学习到的表示数据xi;
构建模块,被配置为用于根据拼接后的数据,构建深度自编码模型;
融合模块,被配置为用于对构造的深度自编码模型的目标函数进行优化,得到模型输出后的融合数据特征;
其中,所述构建模块被配置为用于执行以下操作:
对属性信息有残缺的节点进行属性随机初始化;
获取完整的节点属性信息和节点的嵌入表示数据信息,即完整节点信息其中ui为第i个节点的嵌入表示数据信息,ai为第i个节点的节点属性信息,表示拼接;
其中,所述融合模块被配置为执行以下操作:
对构造的深度自编码模型的目标函数进行优化,得到模型输出后的融合数据特征;其中数据拼接之后优化目标函数为:
其中ψi表示为i行的二进制矩阵,矩阵n为节点个数,在存在有属性的位置处ψi,d+1:d+m=1,在没有属性位置处则为0;阿达玛积与二进制矩阵ψ使得缺失属性的节点在重构属性的部分对重构损失函数没有影响;
设zi为融合后的数据,即完整节点信息的编码后输出结果;则目标函数重写为:
根据该目标函数对缺失属性的节点通过解码器来预测即:
ai=[fdec(zi)]d+1:d+m,i=l+1,…,n;
其中,所述融合模块被配置为执行以下操作:
对于多任务学习,优化目标函数表示为:
ai=[fdec(zi)]d+1:d+m,i=l+1,…,n
在优化参数模型过程中,网络参数θ和节点属性的缺失部分Al+1:n,采用的优化方法是采用交替优化模式,迭代更新一个变量,其余变量不变的方式;其中θ采用反向传播算法更新其参数,Al+1:n经过该模型训练不断更新,最终经过不断训练可以输出任意维度融合数据z。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910389140.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





