[发明专利]一种基于多通道高斯GAN的引导零样本识别方法有效
| 申请号: | 202010988164.5 | 申请日: | 2020-09-18 |
| 公开(公告)号: | CN112101470B | 公开(公告)日: | 2023-04-11 |
| 发明(设计)人: | 邵洁;李晓瑞 | 申请(专利权)人: | 上海电力大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/74;G06V10/82;G06N3/0475;G06N3/094;G06N3/045 |
| 代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 李照禄 |
| 地址: | 200090 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 通道 gan 引导 样本 识别 方法 | ||
1.一种基于多通道高斯GAN的引导零样本识别方法,其特征在于:包括,
将图片样本输入至Imagenet预训练resnet101网络中进行提取,得到可见类别的视觉特征;
将所述视觉特征输入至多通道GAN网络模型进行训练,得到可见类别的整合特征;
利用所述视觉特征及所述整合特征训练生成softmax分类器;
对训练好的所述softmax分类器进行识别测试,得到识别结果;
所述多通道GAN网络模型包括,
LM=minLcv+γLrs
其中,LM表示在Lcv和Lrs的辅助下,共同训练LM的损失函数,γ表示Lrs的影响程度;
所述多通道GAN网络模型具体包括,
其中,Lcv表示分类器损失函数,通过将可见类别的分类,使得网络M可以保留可见类别之间的差异性,Ns表示可见类别样本的个数,表示第i个样本的标签,表示第i个样本的视觉特征;
还包括,
其中,Lrs表示关系网络的损失函数,即空间上视觉特征和语意特征的空间角度关系,使得同一类别的视觉特征和对应的语意特征在空间上角度接近,最后训练出来的网络M可以保留类别特征之间的相似性。
2.根据权利要求1所述的基于多通道高斯GAN的引导零样本识别方法,其特征在于:预训练所述resnet101网络包括,
将所述resnet101应用在所述Imagenet数据库上训练,得到所述resnet101对应的网络参数,完成预训练。
3.根据权利要求1或2所述的基于多通道高斯GAN的引导零样本识别方法,其特征在于:包括,所述图片样本经过处理之后转变为2048个所述视觉特征。
4.根据权利要求3所述的基于多通道高斯GAN的引导零样本识别方法,其特征在于:构建所述多通道GAN网络模型包括,一个网络M和一个对抗神经网络;
所述网络M包括第一层全连接层和第二层全连接层,所述对抗神经网络包括网络GM和网络D。
5.根据权利要求4所述的基于多通道高斯GAN的引导零样本识别方法,其特征在于:还包括,
所述第一层全连接层大小为2048,连接残差网络输出的视觉特征;
所述第二层全连接层大小为1024,对所述视觉特征进行重新整合;
所述网络GM将特定的语义特征转换为所述视觉特征;
所述网络D比较所述网络GM产生的特征和指定的特征。
6.根据权利要求5所述的基于多通道高斯GAN的引导零样本识别方法,其特征在于:包括,
其中,D表示GAN网络中的分辨器网络D,α是梯度惩罚因素,其表示对抗神经网络的训练损失函数。
7.根据权利要求6所述的基于多通道高斯GAN的引导零样本识别方法,其特征在于:所述训练包括,
利用所述分类器和所述关系网络辅助训练所述网络M,保存类别之前的相似性和差异性;
利用多通道GAN网络结构训练所述对抗神经网络GAN,将语义特征转化为所述视觉特征;
利用所述视觉特征训练所述softmax分类器并根据GZSL标准进行测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电力大学,未经上海电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010988164.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种控制应用启动的方法、装置及存储介质
- 下一篇:一种防堵塞的自流箱





