[发明专利]一种基于欧式距离和深度学习的高光谱开放集分类方法有效
申请号: | 202011150400.2 | 申请日: | 2020-10-24 |
公开(公告)号: | CN112149758B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 江天;刘煜;侯静;彭元喜;周侗 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06K9/62 |
代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 王文惠 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 欧式 距离 深度 学习 光谱 开放 分类 方法 | ||
1.一种基于欧式距离和深度学习的高光谱开放集分类方法,其特征在于,具体包括下述步骤:
步骤S1:构造各已知类的类别中心;
在N维特征空间,第i个已知类的类别中心为ci,表示为ci=λei,其中ei代表第i个已知类在N维特征空间的基底向量,λ是调节类别中心幅度的参数,i=1,…,N,N为已知类的类别个数;对于所有已知类,将类别中心的集合表示为:
C=(c1,c2,…,cN)=λ(e1,e2,…,eN)
e1=(1,0,...,0)T,eN=(0,0,...,1)T
步骤S2:构造基于欧式距离的类别预测函数,代替SoftMax分类器函数进行类别预测;
输入数据经深度学习网络特征提取后,得到的N维特征矢量z,表示为:
z=f(x,θ)
式中,f代表深度学习网络的模型函数,x,θ分别代表输入数据和深度学习网络的参数;计算特征矢量z与各已知类的类别中心C之间的欧式距离d(z,C),根据相对于各已知类的类别中心的距离的远近实现深度学习模型的类别预测,表示为:
y′=arg min(d(z,C))
d(z,C)=||z-C||2=(d1,...,dN)=(||z-c1||2,...,||z-cN||2)
式中y′代表预测类别,||·||2代表欧式范数,di为特征矢量z相对于第i个已知类的类别中心ci的欧式距离,i=1,…,N,N为已知类的类别个数;
步骤S3:构造基于欧式距离的损失函数,损失函数由两部分构成:一部分是相对于类别中心的损失函数,另一部分是修正的Tuplet损失函数;
(3a)构造相对于类别中心的损失函数
输入数据x经过深度学习网络输出的特征为z,所有已知类的类别中心为C=(c1,c2,…,cN),相对于类别中心的损失函数为:
LA(x,y)=dy=||z-cy||2
其中y代表输入数据x的类别属性,y=1,…,N,N为已知类的类别个数,cy为第y类已知类的类别中心;
(3b)构造修正的Tuplet损失函数LT(x,y)
输入数据x经过深度学习网络输出的特征为z,所有已知类的类别中心为C=(c1,c2,…,cN),特征矢量z与各已知类的类别中心C之间的欧式距离为d(x,C);N为已知类的类别个数,y代表输入数据x的类别属性,j代表第j类已知类的类别属性,j=1,…,N但j≠y;
(3c)构造基于欧式距离的损失函数
基于欧式距离的损失函数是由相对于类别中心的损失函数LA(x,y)和修正的Tuplet损失函数LT(x,y)通过加权求和的形式构造的,具体表达式为:
L(x,y)=α×LA(x,y)+β×LT(x,y)
其中,α和β分别为相对于类别中心的损失函数和Tuplet损失函数的权值;使用基于欧式距离的损失函数替换传统深度学习网络的softmax交叉熵损失函数,对深度学习网络进行优化训练;
步骤S4:对输入的高光谱图像进行预处理;
预处理分为四个步骤,依次为高光谱数据标注、最小最大值归一化、引导滤波器滤波、最小最大值归一化;
(4a)高光谱数据标注:基于先验信息,赋予各个已知类标签信息:1,2,…,N,N为已知类的类别个数;然后对高光谱数据中属于各个已知类的像素进行标注;
(4b)进行最小最大值归一化,归一化公式为:
式中xijc和分别代表归一化处理前后的高光谱影像数据;(i,j)代表高光谱影像像素的空间位置坐标;c代表高光谱影像的第c个波段;xmax和xmin分别代表三维高光谱影像数据中的最大值和最小值;a和b均为常数,为使得归一化后的数值在[0,255]范围内,令a=255,b=0,得到高光谱数据Snorm;
(4c)引导滤波器滤波
对归一化后的高光谱数据进行主成分分析,得到第一主成分对应的图像I1,将I1最小最大归一化到[0,255]范围内,得到图Iguide,然后将Iguide作为导向图对归一化后的高光谱数据Snorm进行引导滤波:对高光谱数据Snorm所有波段处的图像使用引导滤波器进行滤波,通过改变滤波器滤波窗口的直径调节滤波效果,有助于提高高光谱的分类精度;
(4d)进行最小最大值归一化,为使得高光谱数据归一化后的数值在[0,1]范围内,令a=1,b=0;
步骤S5:数据分割;具体分为三步进行操作:
(5a)对高光谱影像空间域的边沿进行扩充,扩充的宽度为使其维度由(H,W,L)扩展成为边沿扩展层的数值均为0;
(5b)以待分类像素为中心,以m×m×L邻域范围内的数据块Hm×m×L作为中心像素的样本数据,逐个像素地遍历高光谱数据,生成大量维度为m×m×L的数据块;
(5c)对中心像素属于已知类的数据块,以中心像素所属标签为该数据块的标签;
其中,(H,W,L)分别代表高光谱影像空间域的长、宽值和光谱域的光谱通道数;m代表数据块在空间域的长宽值;
步骤S6:生成训练数据集和测试数据集;
从步骤S5提取出来的带有标签的数据块中随机抽取一定比例的数据块作为分类模型的训练数据集,其余的数据块作为测试数据集;测试数据集包括剩余的带有标签的数据块和所有没有标签的数据块;
步骤S7:利用训练数据集训练深度学习网络模型,具体步骤如下:
利用步骤S6得到的训练数据集、步骤S1构造的各已知类的类别中心、步骤S2构造的构造基于欧式距离的类别预测函数和步骤S3构造的基于欧式距离的损失函数,对深度学习网络模型进行训练;训练过程中,每次随机不重复地从训练集里抽取32个样本为一批训练数据,采用随机梯度下降方法更新网络参数,直至网络收敛;训练过程遍历整个训练集一次为一轮训练;
步骤S8:使用箱线图方法对得到正确分类的训练数据进行异常值数据捕获,得到各已知类的异常值判断阈值和异常点的个数,然后根据异常点的个数选择判别未知类的方式;具体如下:
(8a)对于属于同一类且分类正确的训练数据,统计其通过深度学习网络输出的特征到该已知类的类别中心的距离,构建箱线图,使用箱线图上边缘(Q3+1.5×IQR)作为异常值判断阈值,其中Q3为75%分位数,IQR为四分位数全距,得到各已知类的异常值判断阈值t∈[t1,t2,…,tN],各已知类的异常点的个数m∈[m1,m2,…,mN];其中ti,mi分别是第i类已知类的异常值判断阈值和异常点的个数,i=1,2,…,N,N为已知类的类别个数;
(8b)对于第i个已知类,如果其异常点的个数mi<δ,则使用ti作为该已知类的拒绝阈值;如果mi≥δ,则将mi作为拟合极值分布Weibull分布模型所需要的异常点的个数,再利用这些异常点所对应的距离,拟合得到该已知类Weibull分布模型的比例参数,形状参数和位置参数;其中,δ是正整数,代表点的个数;Weibull分布的概率密度函数为:
式中λi为比例参数,κi为形状参数,τi为位置参数;di是输入数据通过深度学习网络输出的特征到该第i个已知类的类别中心的距离;
步骤S9:将测试数据输入训练好的深度学习网络模型,得到测试数据的特征矢量ztest,计算ztest相对于各个已知类的类别中心C的距离dtest,则argmin(dtest)为该测试数据的预测类别;使用步骤(8b)得到的各已知类的未知类判别方式实现开放集分类,具体如下:
如果argmin(dtest)对应的已知类是采用箱线图上边缘的方式进行未知类判别,则使用targmin(dtest)作为该已知类的未知类识别阈值;进一步地,若min(dtest)大于targmin(dtest),则该测试数据为未知类,即第(N+1)类,否则为已知类argmin(dtest),公式为:
式中为开放集分类结果;
如果argmin(dtest)对应的已知类具有Weibull分布模型,则使用Weibull分布模型进行未知类判别:将min(dtest)输入已知类argmin(dtest)的Weibull分布模型,计算得到概率值p(min(dtest)),公式如下:
式中λargmin(dtest),κargmin(dtest)和τargmin(dtest)分别为已知类argmin(dtest)的Weibull分布模型的比例参数,形状参数和位置参数;对于p(min(dtest)),若p(min(dtest))ζ,则该测试数据为未知类,即第(N+1)类,否则为已知类argmin(dtest),公式为:
其中,ζ为阈值参数,0ζ1;为开放集分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011150400.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种医疗儿科护理用负压洗胃装置
- 下一篇:根据面部朝向提供照明的台灯