[发明专利]一种基于循环一致性的零样本识别方法及系统有效
申请号: | 202110679972.8 | 申请日: | 2021-06-18 |
公开(公告)号: | CN113269274B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 张桂梅;黄军阳;龙邦耀;徐可 | 申请(专利权)人: | 南昌航空大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 王爱涛 |
地址: | 330063 江*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 循环 一致性 样本 识别 方法 系统 | ||
1.一种基于循环一致性的零样本识别方法,其特征在于,所述方法包括:
采集训练数据集;
构建待训练循环一致性生成对抗网络模型,利用所述训练数据集训练所述待训练循环一致性生成对抗网络模型,得到循环一致性生成对抗网络模型;
将所述循环一致性生成对抗网络模型应用于未知数据集的识别;所述训练数据集与所述未知数据集不存在交集;
所述利用所述训练数据集训练所述待训练循环一致性生成对抗网络模型,得到循环一致性生成对抗网络模型包括:
构建多目标损失函数,依据所述多目标损失函数的收敛情况利用所述训练数据集对所述待训练循环一致性生成对抗网络模型的参数进行更新,得到循环一致性生成对抗网络模型;
所述构建多目标损失函数包括:
分别构建视觉特征生成器损失函数、视觉特征判别器损失函数、语义特征生成器损失函数、语义特征判别器损失函数和循环一致性损失函数;
所述视觉特征生成器损失函数包括:
其中,表示去冗余后的伪视觉特征的Wasserstein距离,Lcls1(M(G1(y,z,θ)))表示伪视觉特征的分类损失,λrLr(M,c)表示去冗余的约束损失,θ和ω表示视觉特征生成器G1和视觉特征判别器D1的超参数,λr表示去冗余约束损失的超参数,Lr(M,c)表示去冗余约束损失,y表示真实语义特征,py表示y的联合分布;z表示噪声;M表示去冗余模块;c表示类别的聚类中心;
所述视觉特征判别器损失函数包括:
其中,是视觉特征的分类损失,λ1LGP1是Lipschitz梯度惩罚项,是去冗余伪视觉特征和真实视觉特征x之间的Wasserstein距离;λ1表示梯度惩罚系数,y表示真实语义特征,x表示真实视觉特征,pdata表示数据的联合分布,θ和ω表示视觉特征生成器G1和视觉特征判别器D1的超参数,z表示噪声;
所述语义特征生成器的损失函数为:
其中,表示伪语义特征的Wasserstein距离,表示伪语义特征的分类损失;δ和ζ表示语义特征生成器G2和语义特征判别器D2的超参数,z为噪声,pz为z的联合分布;
所述语义特征判别器的损失函数为:
其中,表示语义特征分类损失,λ2LGP2是梯度惩罚项,是生成的伪语义特征和真实语义特征之间的Wasserstein距离;λ2表示梯度惩罚系数;
所述循环一致性损失函数包括:
其中,Lcyc表示循环一致性损失,λ是循环一致性损失的权重超参数,B表示批尺寸的值,G2(M(G1(y,z,θ)))表示语义特征生成器G2的输出,δ表示语义特征生成器G2的超参数,y表示真实语义特征,z表示噪声,θ表示生成器G1的超参数,M表示去冗余模块。
2.根据权利要求1所述的一种基于循环一致性的零样本识别方法,其特征在于,所述训练数据集与所述未知数据集对应的领域相同。
3.根据权利要求1所述的一种基于循环一致性的零样本识别方法,其特征在于,所述构建待训练循环一致性生成对抗网络模型包括:
构建生成器网络:构建视觉特征生成器和语义特征生成器,所述视觉特征生成器包括依次连接的第一卷积模块、第二卷积模块、第一全连接模块、第二全连接模块和第一激活函数层,所述语义特征生成器包括依次连接的第三全连接模块、第四全连接模块、第一全连接层和第二激活函数层;
构建判别器网络:构建视觉特征判别器和语义特征判别器;所述视觉特征判决器包括第五全连接模块和与所述第五全连接模块相连的第一分支与第二分支;所述第一分支包括2路的第二全连接层,所述第二分支包括n路的第三全连接层,其中n2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌航空大学,未经南昌航空大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110679972.8/1.html,转载请声明来源钻瓜专利网。