[发明专利]一种基于改进型层次聚类的高光谱遥感数据降维方法无效
申请号: | 201210379469.1 | 申请日: | 2012-10-09 |
公开(公告)号: | CN102903114A | 公开(公告)日: | 2013-01-30 |
发明(设计)人: | 苏红军;李茜楠 | 申请(专利权)人: | 河海大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 夏雪 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进型 层次 光谱 遥感 数据 方法 | ||
技术领域
本发明属于高光谱遥感图像处理技术领域,具体涉及一种基于改进型层次聚类的高光谱遥感数据降维方法。
背景技术
高光谱遥感(Hyperspectral Remote Sensing)是指利用很多窄的电磁波波段获取物体有关数据的技术,它是20世纪最后20年人类在对地观测方面取得的重大技术突破之一,也是当前及今后几十年内的遥感前沿技术。与常规多光谱遥感相比,高光谱数据具有数据量大、波段很多很窄、波段相关性强、信息冗余多、图谱一体化等特征。但正是其海量数据和高维特征给高光谱数据的传输和存储都带来了较大的困难,同时也对传统的遥感图像数据处理技术提出了新的挑战。所以,对高光谱数据的快速处理和充分挖掘一直是困扰人们的一个问题。面对高光谱数十、数百个波段的数据,在提高数据处理效率的同时;如何有效利用、提取、分析感兴趣的最大信息,已成为有待研究的新课题。
针对高光谱的高维、海量信息,必须对其进行“降维”操作,以提高数据处理效率、有效利用高光谱的最大信息。高光谱“降维”为高光谱影像分析提供了减少数据量、降低空间复杂度的方法,主要有两种方法:即波段选择和特征提取。波段选择即从众多波段中选择感兴趣的若干波段,或选择信息量大、相关性小的若干波段,方法较好地保留了原始图像数据的信息,然而由于剔除了大部分波段,不可避免地损失了部分高光谱数据及细节信息;特征提取则采取一个线性或者非线性的特征提取器或者转换方程,将高维的空间投影到一个低维的空间,与波段选择相比,特征提取建立在各光谱波段间的重新组合和优化的基础之上,使类别间的可分性更大。特征提取和选择的关键就是要在最少维的特征空间中使目标的识别精度最高,即当特征空间维数减少到某个数量时仍能够达到最佳的分类精度。
聚类分析实质上是特征提取的一种算法,它根据数据本身的特性将相似的数据归类;因此,该类算法在处理遥感数据时,也可以把数据分成若干个聚类,其中有些聚类包含了数据的重要特征。层次聚类算法,特别是凝聚式算法在计算上简单、可伸缩性,而且能够得到相近的最终结果,所以层次聚类算法的应用较为广泛。凝聚式层次聚类是自底向上的策略:首先将每个对象作为一个类,然后合并这些原子类为越来越大的类,直到所有的对象都在一个类中,或者某个终结条件被满足;分裂的层次聚类是种自顶向下的策略与凝聚的层次聚类相反,它首先将所有对象置于一个类中,然后逐渐细分为越来越小的类,直到每个对象自成一类,或者达到了某个终结条件,例如达到了某个希望的类数目,或者两个最近的类之间的距离超过了某个闽值。绝大多数聚类方法属于这一类,它们只是在簇间相似度的定义有所不同。
然而凝聚式层次聚类算法却存在以下问题:1)初始相似性距离问题。不同的目标因为特点不同,其距离的计算方式应该不同,不同的初始距离计算方法可能导致不同的结果;2)聚类个数问题。需要预先指定聚类的个数k,当无法获得数据的先验知识时,无法预测该值的具体大小;3)聚类的数据计算问题。针对海量的高光谱遥感数据时,简单使用所有数据可能导致计算复杂度极度上升。
发明内容
发明目的:针对上述现有技术存在的问题和不足,本发明的目的是提供一种基于改进型层次聚类的高光谱遥感数据降维方法(简称为WaLuSID,Ward’s Linkage strategy Using Spectral Information Divergence),能够提高降维效率,减少现有高光谱影像数据降维方法导致的数据信息损失。
技术方案:为实现上述发明目的,本发明采用的技术方案为一种基于改进型层次聚类的高光谱遥感数据降维方法,包括如下步骤:
步骤1,选择需进行分析的高光谱遥感影像数据,所述高光谱遥感影像数据含有L个波段;
步骤2,利用光谱信息散度(Spectral information divergence,SID)算法计算每两个波段之间的光谱距离,得到一个光谱距离矩阵
步骤3,设定要提取的聚类中心和要选择的波段的个数k;
步骤4,基于相似性距离矩阵,采用层次聚类方法对影像数据进行聚类分析;
步骤5,得到k个聚类中心数据,完成特征提取过程;
步骤6,在每个聚类中心中选择一个最具代表性的波段,得到k个波段,完成特征选择过程。
进一步地,所述SID算法采用以下公式:
SID(x,y)=D(x||y)+D(y||x)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210379469.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:制造碳化硅晶须增强型耐火组合物的方法
- 下一篇:用于制备膨胀微球的方法和装置