[发明专利]基于CAE与HL-CNN的小样本SAR目标识别方法有效
申请号: | 201911029117.1 | 申请日: | 2019-10-28 |
公开(公告)号: | CN110766084B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 傅雄军;秦锐;郎平;常家云;蒋文;赵聪霞 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 王民盛 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 cae hl cnn 样本 sar 目标 识别 方法 | ||
1.基于CAE与HL-CNN的小样本SAR目标识别方法,其特征在于:包含两个网络的构建与训练,分别为CAE特征表示学习网络与HL-CNN分类网络;
其中,CAE,即卷积自编码器,全称为ConvolutionalAuto-encoder;HL-CNN,全称为hinge loss CNN;CNN,即卷积神经网络,全称为Convolutional Neural Network;SAR,即合成孔径雷达,全称为Synthetic Aperture Radar;
CAE特征表示学习网络通过重构训练集中的图像自动学习图像的特征,得到一个完备的特征表示,防止使用非贪婪的分类网络时因特征提取不足而导致分类性能下降的问题;
HL-CNN分类网络采用一种基于最大类间间距准则的非贪婪分类器对CAE特征表示学习网络学习到的特征表示微调并得到分类网络,能有效防止过拟合现象的发生;
其中,CAE特征表示学习网络重构图像自动学习图像的特征即通过优化目标hw(x)≈(x)学习x的特征表示,式中,h表示重构函数,x为给定的一个输入图像,下标w表示网络的权值;
所述方法,包括网络构建与训练阶段以及识别阶段;
其中,网络构建与训练阶段又包括构建训练样本集及标记样本、构建CAE特征表示学习网络、训练CAE特征表示学习网络、构建HL-CNN分类网络、特征表示迁移、训练HL-CNN分类网络,具体分为如下步骤:
步骤1.1:构建训练样本集及标记样本;
其中,训练样本集包括增广训练样本集以及原始训练样本集;
采用随机裁剪固定尺寸切片的方法对训练样本进行增广,构建增广训练样本集;裁剪训练样本中心固定尺寸的切片,构建原始训练样本集;使用one-hot编码对样本进行标记;
步骤1.2:构建CAE特征表示学习网络,具体包括编码器构建以及解码器构建;
其中,构建的编码器包括多个卷积层、池化层以及激活函数的连接与参数设置;
其中,卷积层包括补零操作和卷积操作,补零操作对卷积层的输出尺寸进行约束,卷积操作使用卷积核对输入图像进行滑窗并做卷积,得到该层的输出图像;
其中,池化层包括池化操作,具体实施时使用最大值池化;
编码器的输出即为特征表示,记做pw1(x),其中,下标w1表示编码器的隐含层中的权值,x表示编码器的输入;
解码器构建包括多个去卷积层、上池化层以及激活函数的连接与参数设置;
其中,去卷积层等同于卷积层;上池化层为池化层的逆操作;激活函数根据具体实例选取;
其中,解码器的输入为编码器的输出,即pw1(x),它将特征表示pw1(x)还原成x,表示为qw2(pw1(x))=x,其中下标w2表示解码器的隐含层的权值;
步骤1.3:训练CAE特征表示学习网络,具体使用增广训练样本集训练步骤1.2所构建的CAE特征表示学习网络,具体包括如下子步骤:
步骤1.3.1:网络参数初始化,将卷积层的卷积核及每一层的权重值初始化,并设置合理的学习率;
步骤1.3.2:使用带Momentum参数的小批量随机梯度下降方法对网络进行训练;
步骤1.4:构建HL-CNN分类网络,具体为:
步骤1.4.1:构建与步骤1.2中CAE特征表示学习网络的编码器部分完全相同的结构;
步骤1.4.2:在步骤1.4.1所述结构后添加全连接层;
步骤1.4.3:将最后一层全连接层的激活函数设置为linear函数,并使用Multiclasshinge loss作为HL-CNN分类网络的损失,然后连接到预测标签,至此,HL-CNN分类网络构建完成;
其中,HL-CNN分类网络的损失表示为(1):
其中,xn是网络的第n个输入,n=1,…,N,N表示所有训练样本数量,yn表示xn的实际标签,wc表示网络输出标签中第c类位置对应的权值,c表示类别,c=1,…,C,C是总类别数,表示网络输出标签中第yn类位置对应的权值,T表示矩阵转置操作符,△为阈值;
步骤1.5:特征表示迁移,具体为:将CAE特征表示学习网络训练得到的特征表示,即步骤1.3输出的训练后的编码器参数,加载到步骤1.4的HL-CNN分类网络中与编码器相同的部分;
步骤1.6:使用原始训练样本集训练HL-CNN分类网络,具体为:
步骤1.6.1:为步骤1.5加载参数后的HL-CNN分类网络初始化全连接层参数并设置网络的学习率;
步骤1.6.2:使用带momentum参数的小批量随机梯度下降方法对该网络进行训练,得到训练好的CAE-HL-CNN分类模型;
至此,从步骤1.1到步骤1.6,完成了CAE-HL-CNN的训练阶段;
识别阶段,包含测试样本集构建以及CAE-HL-CNN识别,具体包括如下步骤:
步骤2.1:测试样本集构建,具体如下:
裁剪测试样本中心固定尺寸的切片,构建测试样本集,切片尺寸与训练样本集切片尺寸相同;使用one-hot编码对样本进行标记;
步骤2.2:CAE-HL-CNN识别,将测试样本集中的测试样本输入到训练好的CAE-HL-CNN分类模型,输出识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911029117.1/1.html,转载请声明来源钻瓜专利网。