[发明专利]基于测地映射分析的核稀疏描述人脸识别方法有效
| 申请号: | 201810469578.X | 申请日: | 2018-05-16 |
| 公开(公告)号: | CN108664941B | 公开(公告)日: | 2019-12-27 |
| 发明(设计)人: | 熊欣;栗科峰;张婉 | 申请(专利权)人: | 河南工程学院 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
| 代理公司: | 41121 郑州金成知识产权事务所(普通合伙) | 代理人: | 郭增欣 |
| 地址: | 451191 河*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 映射 稀疏 人脸识别 测地线 像素点 切向 人脸 表情 高维特征空间 人脸识别系统 非线性映射 分类特征 复杂条件 控制环境 黎曼流形 曲面结构 人脸图像 识别性能 数据向量 稀疏特征 优化问题 遮挡条件 核函数 鲁棒性 求解 范数 建模 算法 遮挡 连通 投影 辨别 测量 分析 分类 引入 转换 | ||
1.一种基于测地映射分析的核稀疏描述人脸识别方法,其步骤是:1)、把人脸图像分成无数个像素点和无数条弧线,并在无数条弧线围成的区域内选择任意两个像素点,且其中一个作为参考点;
2)、连通黎曼流形的两点之间的距离是连接两点的曲线长度的最小值,实现最小值的曲线即为测地线;
3)、通过对数和指数映射将通过参考点的测地线变换成切向空间上的直线,保持与曲线相似的距离,通过主要测地分析,获得用于人脸识别的GMA分类特征;
4)、使用非线性模型进行稀疏描述,通过非线性映射将切向空间中的数据向量转换为较高维特征空间;
5)、使用内核技巧在GMA特征空间实现稀疏建模;
主要测地分析是欧几里德空间主成分分析的泛化和扩展;设φ是从输入空间TμM到特征空间F的任意非线性映射,即φ:TμM→F。
2.根据权利要求1所述的基于测地映射分析的核稀疏描述人脸识别方法,其特征是:步骤3)中:根据微分方程理论,通过参考点x,x∈M,必然存在一条最短的测地弧,即是测地线,其切线向量为TXM为切向空间;将切线向量映射到测地线从x到流形上的点的函数称为指数映射,如下式所示:
Expx:TXM→M (1)
其中Υ(l)为测地线,将TXM的原点映射到x点,即Expx(0)=x;对于每个像素点x∈M,在TXM到邻域间存在指数映射的逆运算Logx=Expx-1,被称为对数映射。
3.根据权利要求1所述的基于测地映射分析的核稀疏描述人脸识别方法,其特征是:步骤3)中:主要测地分析是欧几里德空间主成分分析的泛化和扩展,像素点集合的平均值为μ,由最小化平方距离函数之和给出:
其中,为均值向量,xi为集合M中的像素点,d(x,y)=||logx(y)||表示黎曼度量:
通过梯度下降算法来计算平均值:
4.根据权利要求1所述的基于测地映射分析的核稀疏描述人脸识别方法,其特征是:步骤3)中:流形中的测地曲线是线性空间中直线的泛化,像素点x在测地子流形H上的投影是黎曼度量上最接近于x的点,由式(5)给出:
πH(x)=arg miny∈Hd(x,y)2 (5)
给定一组像素点x1,x2,x3,…xn∈M,找到一个测地子流形,使得数据的投影方差最大化,其通过获取跨越切向空间TXM的切向量正交基ζ1,ζ2,...,ζd实现。
5.根据权利要求4所述的基于测地映射分析的核稀疏描述人脸识别方法,其特征是:步骤3)中:训练集的协方差描述符表示为计算点的平均值μ,特征被映射到切向空间获得计算主要测地线分量以获得ζ1,ζ2,...,ζd,从而生成新的主投影特征:
其中,系数λi,k计算如下:
将样本i的GMA特征vi定义为:
将测试数据投影到测地子流形H上以获得用于人脸识别的GMA分类特征,其使用以下度量:
其中,为主投影特征,pt为协方差矩阵,令ki为和pt的广义特征值,得:
其中,d为广义特征值的ki数量。
6.根据权利要求1所述的基于测地映射分析的核稀疏描述人脸识别方法,其特征是:步骤4)和步骤5)中:实现基于测地映射分析GMA有效特征提取,是以测地距离为度量依据,通过对数和指数映射将测试数据投影到切向空间,从而获取更具辨别力的分类特征;设φ是从输入空间TμM到特征空间F的任意非线性映射,即φ:TμM→F;c是类的数量,vj,k是第k个训练样本图像的第j个GMA特征,ni是样本i的图像数量,n=n1+n2+n3+…+nc是总的图像数量,l是测试图像的GMA特征,训练图像的GMA特征变换矩阵为ψ=[φ(v1,1),φ(v2,1),φ(vn1,1)…φ(vnc,c)],能够将变换后的测试向量φ(l)表示为:
φ(l)=ψα (16)
其中,ψ为GMA特征变换矩阵,α为样本的稀疏表示,由于式(16)是超定的,维数很高,能够利用核降维技术转化为欠定问题,有利于高效地执行高维度的计算:
RTφ(l)=RTψα (17)
其中R是切向空间TXM降维后的矩阵,T表示矩阵的转置,令Cφ为特征空间的协方差矩阵:
其中vi为GMA特征向量,前d个最大特征值表示为u1,u2,...,ud,将对应于非零特征值的所有特征向量转换训练样本的线性组合:
其中,列向量[βk,1…βk,n]T是第k个特征向量描述,可得:
对于式(20)两边都乘以φ(vr)T能够简化为以下矩阵形式:
其中,λ为正则化参数,K为核格拉姆矩阵Ki,j=φ(vi)T,则:
Kβ=nλβ (25)
则核降维投影矩阵为R=[u1u2…ud],其中第k个特征向量为因此式(17)能够转化为:
[u1u2...ud]Tφ(l)=[u1u2...ud]Tψα (26)
上式能够简化为:
Rβω=RβKα (29)
其中ω=[φ(v1)Tφ(l)......φ(vn)Tφ(l)]T,Rβ为核降维矩阵;
如果α的解足够稀疏,求解L0范数的最小化就等价于求解如下L1范数的优化问题:
满足RβKα=Rβω (30)
其中,根据噪声对稀疏模型的影响,进一步修改优化问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南工程学院,未经河南工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810469578.X/1.html,转载请声明来源钻瓜专利网。





