[发明专利]基于自编码器的跨网络数据任意维度融合方法和装置有效

专利信息
申请号: 201910389140.5 申请日: 2019-05-10
公开(公告)号: CN110119779B 公开(公告)日: 2022-03-04
发明(设计)人: 王铮;崔健;胡长军 申请(专利权)人: 北京科技大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京市广友专利事务所有限责任公司 11237 代理人: 张仲波
地址: 100083*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 编码器 网络 数据 任意 维度 融合 方法 装置
【权利要求书】:

1.一种基于自编码器的跨网络数据任意维度融合方法,其特征在于,包括:

步骤1、获取不同类型网络中的n个节点的嵌入表示数据信息u和节点属性信息a:其中,所述网络指的是信息网络,所述信息网络包括但不限于社交网络、电子商务网络、万维网;

u表示为节点的嵌入表示数据信息,n代表嵌入表示节点的个数,d代表嵌入表示节点维度,其中a为属性信息,且其中包括低维表示的缺失节点属性信息,pn,p代表属性信息所包含节点的个数,m代表属性信息的维度;

步骤2、将所述n个节点的嵌入表示数据信息u与节点属性信息a生成该n个节点的输入数据{x1,x2,……xn};对所述输入数据通过以下的函数进行拼接:

其中fenc()是编码函数,用于将输入数据转化为中间隐层表示数据,fdec()是解码函数,用于将中间隐层表示数据转化为最终的输出数据,θ表示这编码函数与解码函数待训练的参数;

通过fenc(xi)返回学习到的表示数据xi

步骤3、根据拼接后的数据,构建深度自编码模型;

步骤4、对构造的深度自编码模型的目标函数进行优化,得到模型输出后的融合数据特征;

其中,所述步骤3具体包括:

步骤31、对属性信息有残缺的节点进行属性随机初始化;

步骤32、获取完整的节点属性信息和节点的嵌入表示数据信息,即完整节点信息其中ui为第i个节点的嵌入表示数据信息,ai为第i个节点的节点属性信息,表示拼接;

其中,所述步骤4具体包括:

步骤41、对构造的深度自编码模型的目标函数进行优化,得到模型输出后的融合数据特征;其中数据拼接之后优化目标函数为:

其中ψi表示为i行的二进制矩阵,矩阵n为矩阵中所包含节点的个数,在存在有属性的位置处ψi,d+1:d+m=1,在没有属性位置处则为0;阿达玛积与二进制矩阵ψ使得缺失属性的节点在重构属性的部分对重构损失函数没有影响;

步骤42、设zi为融合后的数据,即完整节点信息的编码后输出结果;n为节点个数,则目标函数重写为:

步骤43、根据该目标函数对缺失属性的节点通过解码器来预测即:

ai=[fdec(zi)]d+1:d+m,i=l+1,…,n;

其中,所述步骤4具体包括:

对于多任务学习,优化目标函数表示为:

ai=[fdec(zi)]d+1:d+m,i=l+1,…,n

在优化参数模型过程中,网络参数θ和节点属性的缺失部分Al+1:n,采用的优化方法是采用交替优化模式,迭代更新一个变量,其余变量不变的方式;其中θ采用反向传播算法更新其参数,Al+1:n经过该模型训练不断更新,最终经过不断训练可以输出任意维度融合数据z。

2.一种基于自编码器的跨网络数据任意维度融合装置,其特征在于,包括:

获取模块,被配置为用于获取不同类型网络中的n个节点的嵌入表示数据信息u和节点属性信息a:其中,所述网络指的是信息网络,所述信息网络包括但不限于社交网络、电子商务网络、万维网;

u表示为节点的嵌入表示数据信息,n代表嵌入表示节点的个数,d代表嵌入表示节点维度,其中a为属性信息,且其中包括低维表示的缺失节点属性信息,p<n,p代表属性信息所包含节点的个数,m代表属性信息的维度;

拼接模块,被配置为用于将所述n个节点的嵌入表示数据信息u与节点属性信息a生成该n个节点的输入数据{x1,x2,......xn};对所述输入数据通过以下的函数进行拼接:

其中fenc()是编码函数,用于将输入数据转化为中间隐层表示数据,fdec()是解码函数,用于将中间隐层表示数据转化为最终的输出数据,θ表示这编码函数与解码函数待训练的参数;

通过fenc(xi)返回学习到的表示数据xi

构建模块,被配置为用于根据拼接后的数据,构建深度自编码模型;

融合模块,被配置为用于对构造的深度自编码模型的目标函数进行优化,得到模型输出后的融合数据特征;

其中,所述构建模块被配置为用于执行以下操作:

对属性信息有残缺的节点进行属性随机初始化;

获取完整的节点属性信息和节点的嵌入表示数据信息,即完整节点信息其中ui为第i个节点的嵌入表示数据信息,ai为第i个节点的节点属性信息,表示拼接;

其中,所述融合模块被配置为执行以下操作:

对构造的深度自编码模型的目标函数进行优化,得到模型输出后的融合数据特征;其中数据拼接之后优化目标函数为:

其中ψi表示为i行的二进制矩阵,矩阵n为节点个数,在存在有属性的位置处ψi,d+1:d+m=1,在没有属性位置处则为0;阿达玛积与二进制矩阵ψ使得缺失属性的节点在重构属性的部分对重构损失函数没有影响;

设zi为融合后的数据,即完整节点信息的编码后输出结果;则目标函数重写为:

根据该目标函数对缺失属性的节点通过解码器来预测即:

ai=[fdec(zi)]d+1:d+m,i=l+1,…,n;

其中,所述融合模块被配置为执行以下操作:

对于多任务学习,优化目标函数表示为:

ai=[fdec(zi)]d+1:d+m,i=l+1,…,n

在优化参数模型过程中,网络参数θ和节点属性的缺失部分Al+1:n,采用的优化方法是采用交替优化模式,迭代更新一个变量,其余变量不变的方式;其中θ采用反向传播算法更新其参数,Al+1:n经过该模型训练不断更新,最终经过不断训练可以输出任意维度融合数据z。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910389140.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top