[发明专利]一种基于相关双自编码器在零次学习上的运用方法有效
| 申请号: | 201910629751.2 | 申请日: | 2019-07-12 |
| 公开(公告)号: | CN110517328B | 公开(公告)日: | 2020-08-25 |
| 发明(设计)人: | 姜明;刘志勇;张旻;汤景凡;吴俊磊 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06T9/00 | 分类号: | G06T9/00;G06K9/46;G06K9/62 |
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 相关 编码器 学习 运用 方法 | ||
1.一种基于相关双自编码器在零次学习上的运用方法,其特征在于包括如下步骤:
步骤(1)获取编码后的视觉特征;
步骤(2)获取优化后的语义特征;
步骤(3)将优化后的语义特征映射到视觉特征;
其中步骤(2)通过如下过程实现:
步骤A对语义特征建立自编码器,将步骤(1)中得到的编码后的视觉特征加到编码后的语义特征上,然后再对这个相加后的语义特征进行解码;步骤B将这个解码后得到的语义特征与原语义特征相加获得更好更完整的语义特征;
步骤(1)具体实现如下:
通过一个自编码器对视觉特征进行处理,得到编码后的特征Ve;公式表达为:
Ve=σ(VW1+b1)
其中,Ve表示的是视觉特征编码后的特征,V表示的是原始视觉特征,σ表示的是Relu激活函数;W1是模型需要训练的参数矩阵;b1是模型需要训练的偏置参数;
解码过程用下面的公式来表示:
Vd=σ(VeW2+b2)
其中,Vd表示的是Ve解码重建后的视觉特征,W2是模型需要训练的参数矩阵;b2是模型需要训练的偏置参数;
步骤A具体为:
先对语义特征进行编码:
Ae=σ(AW3+b3)
Ae表示的是语义特征编码后的属性特征,A表示的是原始的语义特征,σ表示的是Relu激活函数;W3是模型需要训练的参数矩阵;b3是模型需要训练的偏置参数;
然后将得到的编码后的视觉特征Ve进行映射得到Vae,Vae的维度与编码后的属性特征Ae的维度一样;映射过程中使用两个由全连接层+Relu激活函数层组成的结构,用公式表示如下:
B=σ(VeW4+b4)
Vae=σ(BW5+b5)
其中B是Ve第一个Relu+FC块得到的值,Vae是Ve映射得到的最终值;W4和W5和是模型需要训练的参数矩阵;b4和b5是模型需要训练的偏置参数;然后将得到的Vae与编码后的属性特征Ae相加,得到一个新的属性特征A′e,这个新的属性特征A′e受到了视觉特征的影响,包含更多的信息;σ表示的是Relu激活函数;
A′e=Ae+Vae
解码的过程用下面的公式来表示:
Ad=σ(A′eW6+b6)
其中Aa表示的是重建后的属性特征,W6是模型需要训练的参数矩阵;b6是模型需要训练的偏置参数;
步骤B具体为:将原始的语义特征与解码后的语义特征相加得到了优化后的语义特征;
Aall=A+Ad
Aall表示优化后的语义特征;
步骤(3)具体为:将步骤(2)得到的优化后的语义特征通过两个由全连接层+Relu激活函数层组成的结构映射到视觉特征空间,映射关系公式表示如下:
C=σ(AallW7+b7)
Vall=σ(CW8+b8)
其中,C是Aall第一个Relu+FC块得到的值,Vall是Aall映射得到的最终值;
W7和W8是模型需要训练的参数矩阵;b7和b8是模型需要训练的偏置参数;
模型存在着三个约束条件:首先需要建立两个关于这两个自编码器的约束条件;即:
min||V-Vd||2
min||A-Ad||2
最后一个约束条件就是最终得到的优化后的语义特征映射到初始的视觉特征;即:
min||Vall-V||2
整个模型的参数在这三个约束条件的作用下建立损失函数,不断训练得到最优的训练结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910629751.2/1.html,转载请声明来源钻瓜专利网。





