[发明专利]基于深层特征学习和分水岭的SAR图像分类方法有效
申请号: | 201510254220.1 | 申请日: | 2015-05-19 |
公开(公告)号: | CN104915676B | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 侯彪;焦李成;刘贺;姚若玉;马晶晶;马文萍;张涛;刘闯 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度特征学习和分水岭的SAR图像分类方法,它属于图像处理技术领域,主要解决中低层特征应用于SAR图像分类易产生场景错分,区域一致性性差,边界有毛刺的问题。其分类过程为:对输入的SAR图像计算分水岭过分割类标L;计算输入的SAR图像伽马(Gabor)特征F1;对F1采样后输入到奇异值分解(KSVD)算法得到训练字典D;将F1与D进行卷积与最大值池化,得到卷积特征F2;然后将F2输入到稀疏自编码器中获到深层特征F3;将F3输入到SVM中分类,获得分类结果R1;在分水岭分割结果L的每个子块位置对R1进行投票统计,获得最终分类结果。本发明具有运算速度快,边缘分类精确,区域一致性好的优点,可用于SAR目标识别。 1 | ||
搜索关键词: | 分类 分类结果 卷积 图像处理技术 毛刺 分水岭分割 奇异值分解 运算速度快 边缘分类 分类过程 目标识别 深度特征 特征学习 特征应用 投票统计 训练字典 一致性好 子块位置 编码器 中低层 采样 池化 可用 类标 算法 稀疏 伽马 场景 分割 学习 | ||
1)对输入的SAR图像进行分水岭过分割,得到分割类标L={L1,L2,...,LM},其中M值为分水岭分割的总块数,Lm为第m个子块类标,m∈[1,M],包括:
1a)对输入的SAR图像进行伽马(Gamma)滤波,得到平滑后的图像I;
1b)计算I的边缘检测经典算子(prewitt)算子的梯度图G1;
1c)对梯度图G1进行重构得到梯度图G2,重构规则为G1中设置阈值t用于约束极大值区域;
1d)对梯度图G2进行分水岭过分割,得到分割类标L={L1,L2,...,LM};
2)对输入的SAR图像进行加窗傅里叶(Gabor)变换得到低层特征F1=[I1;I2;...;IN],其中N表示输入的SAR图像中的像素个数,In表示每个像素点提取的特征向量,n∈[1,N];
3)分别对输入的SAR图像中每类场景中的像素点的Gabor特征向量进行随机采样,得到训练样本Y=[Y1;Y2;...;YC],然后对Y进行奇异值分解(KSVD),得到的聚类中心作为字典D=[D1,D2,...,DK],其中Yc为采样得到的第c类场景的Gabor特征,Dk表示对Y进行KSVD聚类后得到的第k个聚类中心,C表示输入的SAR图像中的场景类别数,K表示KSVD中的聚类中心数,K的取值远大于图像中的场景类别数C,c∈[1,C],k∈[1,K];
4)将Gabor变换得到低层特征中每个像素点提取的特征向量In与字典D中每个聚类中心Dk进行卷积,然后再应用最大值池化进行降维,得到的卷积特征F2作为中层特征;
5)将卷积特征F2输入到稀疏自编码器中,得到编码系数W1=[S1,S2,...,SH],然后将卷积特征F2与编码系数W1相乘,得到深层特征F3,其中Sh为每个隐藏层结点训练得到的系数,H为隐藏层结点个数,h∈[1,H],包括:
5a)首先对输入的卷积特征F2进行编码,编码函数f(x)为一个线性映射和非线性激活函数g(x):
αi=f(x)=g(W1xi+b1) (1)
g(x)=(1+exp(‑x))‑1 (2)
其中αi表示隐藏层神经元i的激活度,W1表示输入层与隐藏层之间的权值系数,b1为隐藏层偏置,i∈[1,H];
5b)对隐藏层输出进行解码,解码函数为zi:
其中W2为隐藏层到输出层的权值系数,b2为输出层偏置;
5c)调整网络中的层与层之间的权值系数W1、W2,偏置b1、b2,使得解码后的重构误差最小,该过程通过优化损失函数J来调整参数
xi,zi分别为稀疏自编码器的输入和输出,m为输入层和隐藏层的节点数,λ为惩罚系数,W为需要调整的权值系数;
稀疏编码器通过约束隐藏层神经元之间的稀疏性,使得大部分隐藏层神经元未被激活,其状态为0,即对输入没有响应,从而学习到最感兴趣的目标特征,该约束为:
β为另一惩罚系数,ρ是稀疏性系数,通常是一个接近于0的较小值,表示隐藏层神经元在训练集上的平均激活度,
5d)将卷积特征F2与优化后的编码系数W1相乘,得到深层特征F3;
6)将深层特征F3输入到支持矢量机(SVM)中进行分类,获得分类结果R1,共分为C类场景;
7)在分水岭过分割结果的分割类标L的每个子块类标Lm位置对R1进行投票,统计R1在Lm位置出现次数最多的场景值c,并将Lm位置全部更新为该场景值c,从而得到最终分类结果R。
2.根据权利要求1所述的图像分类方法,阈值t的取值20。3.根据权利要求1所述的图像分类方法,λ的取值0.0001。4.根据权利要求1所述的图像分类方法,ρ的取值0.01。5.根据权利要求1所述的图像分类方法,β的取值3。该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510254220.1/,转载请声明来源钻瓜专利网。