[发明专利]一种基于相关双自编码器在零次学习上的运用方法有效
| 申请号: | 201910629751.2 | 申请日: | 2019-07-12 |
| 公开(公告)号: | CN110517328B | 公开(公告)日: | 2020-08-25 |
| 发明(设计)人: | 姜明;刘志勇;张旻;汤景凡;吴俊磊 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06T9/00 | 分类号: | G06T9/00;G06K9/46;G06K9/62 |
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 相关 编码器 学习 运用 方法 | ||
本发明公开了一种基于相关双自编码器在零次学习上的运用方法。本发明对视觉特征和语义特征分别建立了自编码器。但这两个自编码器不是独立的,它们是有联系的,我们将视觉特征编码后得到的特征加到编码后的语义特征上,然后再对这个相加后的语义特征进行解码。最后将这个解码后得到的语义特征与原语义特征相加获得更好更完整的语义特征。将这个优化后的语义特征再映射到视觉特征上做分类识别。本发明利用相关双自编码器模型对语义特征进行优化,获得更有区分度,更细粒度的语义特征。这样得到的优化后的语义特征再映射到视觉特征空间上,能取得更好的分类识别准确率。
技术领域
本发明在零次学习上使用了相关双自编码器,属于零次学习技术领域,具体涉及一种基于相关双自编码器在零次学习上的运用方法。
背景技术
现有的有关零次学习的研究中,注意力更多的放在了图像的视觉特征与每个类的语义特征之间的映射关系上。然而,特征本身也会对最终的分类识别有重要的影响。特别是语义特征,有些相似的类别,它们的特征表示非常接近,类别之间的区分度不大。除此之外,如果类别跨度比较大,还会出现特征冗余的情况。因此,构造更有区分度,更细粒度的语义特征有很重要的意义。
发明内容
本发明为了构造更有区分度,更细粒度的语义特征,提出了一种基于相关双自编码器在零次学习上的运用方法,一种基于相关双自编码器的模型架构来优化语义特征的方法。
为实现以上的技术目的,本发明将采取以下的技术方案包括如下步骤:
1.一种基于相关双自编码器在零次学习上的运用方法,其特征在于包括如下步骤:
步骤(1)获取编码后的视觉特征;
步骤(2)获取优化后的语义特征;
步骤(3)将优化后的语义特征映射到视觉特征;
其中步骤(2)通过如下过程实现:
步骤A对语义特征建立自编码器,将步骤(1)中得到的编码后的视觉特征加到编码后的语义特征上,然后再对这个相加后的语义特征进行解码;步骤B将这个解码后得到的语义特征与原语义特征相加获得更好更完整的语义特征。
步骤(1)具体实现如下:
通过一个自编码器对视觉特征进行处理,得到编码后的特征Ve;公式表达为:
Ve=σ(VW1+b1)
其中,Ve表示的是视觉特征编码后的特征,V表示的是原始视觉特征,σ表示的是Relu激活函数;W1是模型需要训练的参数矩阵;b1是模型需要训练的偏置参数;
解码过程用下面的公式来表示:
Vd=σ(VeW2+b2)
其中,Vd表示的是Ve解码重建后的视觉特征,W2是模型需要训练的参数矩阵;b2是模型需要训练的偏置参数。
步骤A具体为:
先对语义特征进行编码:
Ae=σ(AW3+b3)
Ae表示的是语义特征编码后的属性特,A表示的是原始的语义特征,σ表示的是Relu激活函数;W3是模型需要训练的参数矩阵;b3是模型需要训练的偏置参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910629751.2/2.html,转载请声明来源钻瓜专利网。





