[发明专利]一种基于L1范数的概率线性判别分析的图像分类方法在审
申请号: | 201710178667.4 | 申请日: | 2017-03-23 |
公开(公告)号: | CN107038456A | 公开(公告)日: | 2017-08-11 |
发明(设计)人: | 丁文鹏;胡向杰;孙艳丰;胡永利 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 l1 范数 概率 线性 判别分析 图像 分类 方法 | ||
技术领域
本发明属于机器学习技术领域,尤其涉及一种基于L1范数的概率线性判别分析的图像分类方法,特别是适用于图像中带有异常值的图像分类。
背景技术
在对图像处理中,往往是将图像向量化成一个高维的数据。然而,高维数据往往是均匀分布在一个低维空间或流行空间上。所以,寻找高维数据到低维空间中的映射关系已成为对图像分类的一个重要问题。近几十年,数据降维的算法已得到深入研究。对线性判别分析(LDA)是一种广泛应用于图像分类的降维方法。LDA是利用投影矩阵将高维数据映射到低维空间,使得映射后的类间距与类内距的比值最大。LDA是一种基于代数的方法,代数求解方法只依赖原始数据,没有假设任何参数,一般对模型的信任度缺乏灵活性。
为了克服代数的缺陷,2007年提出了概率线性判别分析(PLDA)方法。在这个模型中,图像数据表示成一维向量,假设噪声是服从零均值,协方差为单位矩阵的高斯分布。PLDA是应用概率的理论对数据降维,求解降维矩阵。在噪声是高斯分布的假设下,算法取得了较好的分类结果。
在实际处理图像时,噪声的分布往往是复杂的,不一定都服从高斯分布,当图像中存在异常值时,上面的方法在对图像进行分类时,准确率就会受到影响。因为无论是LDA,还是PLDA,算法都是基于L2-范数的,L2-范数的方法存在一个明显的缺陷:L2-范数会将图像中的异常值无限放大,在将图像投影到低维空间时,用算法求解出的投影矩阵就会偏离真正的主方向。
发明内容
本发明要解决的技术问题是,提供一种基于L1范数的概率线性判别分析的图像分类方法,能够解决图像中存在异常值的问题。与传统的PLDA不同的是,本方法用拉普拉斯分布描述噪声,拉普拉斯是基于L1-范数的概率密度函数,它不会放大误差的值。通过引入隐变量,使用变分最大期望求解模型中的参数,以及降维矩阵。将降维后的矩阵看作是样本的特征,在这个模型中本发明用的是L1-范数描述误差,这样求解的降维矩阵更接近主方向,可以提升图像分类效果。
为实现上述目的,本发明采用如下的技术方案:
一种基于L1范数的概率线性判别分析的图像分类方法,包括以下步骤:
步骤1、对获取的图像建立概率线性判别分析模型(PLDA)
令是一组独立同分布的图像集,其中有I类,每类Ji个图像样本,且J1+...Ji+...+JI=N,每个样本是一个列向量且大小为RD,D为图像向量化后的行数,PLDA的模型可表示为:
xij=μ+Fhi+Gwij+εij(1)
其中,向量xij表示样本集中第i类第j个图像;μ(μ∈RD)是图像集X的均值;εij为误差项,F(F∈RD×d)和G(G∈RD×d)分别是类间和类内的降维矩阵,d≤D是降维后的列数;hi(hi∈Rd)和wij(wij∈Rd)为xij的隐变量核,即系数向量,Rd是降维后的图像特征向量,hi代表身份变量,对于第i类,代表了同类图像的共性,对于wij,表示类内变量代表了同类图像中的个性;
步骤2、建立L1-PLDA模型
在异常值存在的条件下,对样本降维,在将样本中心化后,PLDA模型可以表示成:
其中,将类间和类内降维矩阵合并,即,B=[F,G](B∈RD×2d);降维矩阵的系数合并,记为表示第i类第j个样本的隐变量;误差项εij服从L1-范数的拉普拉斯分布,它与样本数据有相同的维度(RD);假设噪声向量中的每一个元素都是独立同分布的拉普拉斯分布,其概率密度函数为:
其中,误差向量中每个元素的绝对值之和,σ是误差项εij的尺度参数,
对于噪声项,给参数σ一个先验分布,设其服从伽马分布,令ρ=1/σ2,则ρ的分布为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710178667.4/2.html,转载请声明来源钻瓜专利网。