[发明专利]一种基于EMD特征提取和稀疏表示的细胞分类方法有效

专利信息
申请号: 201610461512.7 申请日: 2016-06-22
公开(公告)号: CN106096571B 公开(公告)日: 2018-11-16
发明(设计)人: 李伟;张秋实 申请(专利权)人: 北京化工大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32;G06K9/46;G06K9/62;G06T7/00
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 沈波
地址: 100029 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于EMD特征提取和稀疏表示的细胞分类方法,本方法采用了一种基于EMD的细胞特征提取方法。首先利用正交子空间投影OSP方法对医学高光谱图像进行波段选择,降低维数,减少数据冗余。然后用二维EMD方法对降维后的数据进行特征提取,将数据分解为一系列频率由高到低排列的IMF分量。采用基于稀疏表示的分类器SRC对数据进行分类,通过比较残差来对样本分类,计算得到的残差越小,则将该样本归为到这一类中。基于EMD特征提取和稀疏表示的细胞分类方法中,EMD表现出来很好的时频特性,在高光谱数据特征提取上具有明显的潜力和优势。同时利用基于稀疏表示的分类器SRC,更大大的保证了分类的精度。
搜索关键词: 一种 基于 emd 特征 提取 稀疏 表示 细胞 分类 方法
【主权项】:
1.一种基于EMD特征提取和稀疏表示的细胞分类方法,S1对医学血细胞的高光谱数据用OSP进行波段选择;从血细胞图像所有波段中选择起主要作用的波段子集,剔除部分高冗余的波段;不仅能大大降低医学血细胞图像的数据维数,而且能比较完整地保留有用的信息,提高分类精度;S2采用EMD分解的方法提取血细胞高光谱图像特征;EMD能够自适应地从高频到低频提取信号的本质特征,EMD对血细胞的高光谱图像进行分解,通过多次的筛分过程,一方面消除信号中的骑行波,另一方面平滑高低不平的振幅,得到一系列的从高频到低频的IMF,然后从IMF中提取合适的特征,进行分类;S3利用SRC分类器进行分类;SRC用训练样本稀疏线性地表示测试样本,并根据类别线性重构误差最小化分类;其特征在于:该方法的实施步骤如下,步骤1、血细胞的高光谱数据量大,但是各波段间往往具有相关性,这造成数据的冗余,也就是常说的维数灾难;为了提高运算精度和节省运算时间先对数据用OSP方法对血细胞数据进行波段选择;波段选择的原则是:信息含量多、相关性小、光谱差异大、可分性好的波段就是应该选择的最佳波段;具体算法如下:定义B1和B2是血细胞光谱数据φ中的两个波段,每个波段有N个像素点;用B1和B2来估算第三个波段B3;为了找到一个波段使它和B1和B2最不相似,一个关于B1和B2的正交子空间P被构造为:P=I‑Z(ZTZ)‑1ZT式中,I是一个N阶单位矩阵,Z是一个N×2矩阵,Z的第一列包含B1的所有像素,Z的第二列包含B2的所有像素;计算出y0=PTy,y包含B的所有像素,y0是B1和B2的正交子空间中的B的分量;产生最大正交分量||y0||的波段被认为是与B1和B2最不相似的波段,被选为B3;步骤2、利用EMD方法进行特征描述,提取血细胞的特征;EMD经验模式分解将复杂的信号分解为适宜于Hilbert变换的IMF函数分量,由于本征模函数IMF的本质是信号在不同频率范围内原信号的本质特征,原信号噪声的集合表示为残差形式,所以提取信号的本质特征通过保留每个IMF分量和丢弃残余量来实现,IMF必须满足下列基本条件:1)整个信号长度上的极大值点数、极小值点数与过零点的数目相等或相差为1;2)在任意时刻,由包络线定义的极大值和极小值的平均值为0;第一个条件很明显,它和传统的窄带的稳定高斯过程的要求一样;第二个条件是必要的,以此保证瞬时频率不会出现不期望的波动而诱导不对称的波形;EMD分解实质是对一个时间序列信号进行平稳化的处理过程,它将信号分解为一系列频率由高到低排列的IMF分量和一个余量之和,IMF的获得是一个不断循环迭代的过程,最后筛选出满足条件的IMF;该过程不断的从大尺度信号中剔除均值包络线,直到满足停止条件,筛选结束;对一个信号S(t)进行EMD分解的具体步骤如下:(1)外部初始化,令血细胞图像为r0(m,n)=f(m,n),j=1(2)提取第j个IMF函数:a)内部初始化hj,0(m,n)=rj‑1(m,n),k=1;b)利用形态学算法或8邻域像素,找出hj,k‑1(m,n)中的局部极大值和局部极小值点集;c)使用合适的二维曲面插值方法,分别对极大值点和极小值点进行包络拟合,插值计算出hj,k‑1(m,n)的上包络面umax,k‑1(m,n)和下包络面umin,k‑1(m,n);d)确定上下包络的均值:meank‑1(m,n)=[umax,k‑1(m,n)+umin,k‑1(m,n)]/2;e)从图像中减去均值,得到:hj,k(m,n)=hj,k‑1(m,n)‑meank‑1(m,n);f)计算终止条件,若满足IMF条件则有cj(m,n)=hj,k(m,n)否则令k=k+1,转到步骤b;(3)求残余量rj(m,n)=rj‑1(m,n)‑cj(m,n)若rj中仍有不少于两个的极值点或者分解所得的IMF数目未达到要求,则将rj看做新的数据,并继续从步骤2中的步骤(2)进行分解,j=j+1;(4)最后得到的二维EMD分解的结果是:二维EMD中IMF筛选停止的SD计算公式如下:二维EMD的标准偏差SD的阈值η的经验值通常设在0.1‑0.3之间;步骤3、将血细胞光谱数据贴好标签后,选取部分数据作为训练数据,所有数据作为测试数据,利用SRC分类器对细胞进行分类;SRC的算法如下:SRC算法可用较少的数据捕获感兴趣目标的重要信息,即在样本数充足的情况下,每一类训练样本数据形 成一个完备子空间,当该类样本中其他数据输入时,由该完备空间的数据线性表示出来;SRC对数据缺损不敏感,当所求系数足够稀疏时,特征空间的选取变得不再重要;这些优势使得SRC成为一种非常优秀的分类算法;其主要思想是:对给定的训练样本集的每个字典原子进行归一化;其次求解最小l1‑范数问题:α1=argαmin|α1,其中α满足y=Aα或|y‑Aα|2≤ε,ε>0是一个可选误差;然后对测试样本计算每一类的残差i=1,2,3,……,c,c为对象类;式中δi(α1)s为特征函数,该特征函数的元素选择与α1中第i类相关的系数;最后对y进行分类:I(y)=argiminri(y),这里I(y)表示估计y的类别标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京化工大学,未经北京化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610461512.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top