[发明专利]基于特征谱正则化的格拉斯曼流形判别分析图像识别方法有效
| 申请号: | 201910943071.8 | 申请日: | 2019-09-30 |
| 公开(公告)号: | CN110781766B | 公开(公告)日: | 2023-05-19 |
| 发明(设计)人: | 谭恒良;高鹰;杜娇;杨朔 | 申请(专利权)人: | 广州大学 |
| 主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/774;G06V10/74;G06V10/77;G06V10/764;G06F17/16 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 肖宇扬;江银会 |
| 地址: | 510006 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 特征 正则 格拉斯曼 流形 判别分析 图像 识别 方法 | ||
本发明公开了基于特征谱正则化的格拉斯曼流形判别分析图像识别方法,包括:将标准正交基集合组成的格拉斯曼流形映射到希尔伯特空间得到向量组;依据图嵌入理论框架建立局部保持矩阵并通过权重框架函数执行正则化操作得到变换矩阵,通过变换矩阵对向量组投影得到新的样本空间;对新的样本空间结合权重邻接矩阵求解方程得到降维投影矩阵,根据变换矩阵与其组合得到的最终矩阵提取训练视频图像集合与待识别视频图像集合的降维特征并进行相似度比较得到识别结果。本发明利用特征谱正则化技术解决了GDA方法在判别分析中因类内散度矩阵奇异而导致求逆不稳定、泛化能力差的问题;且加入图嵌入理论框架使得算法能更好地保持局部信息以获得更好的识别结果。
技术领域
本发明涉及图像识别技术领域,尤其涉及一种基于特征谱正则化的格拉斯曼流形判别分析图像识别方法。
背景技术
图像识别是人工智能的分支,属于模式识别范畴,且图像识别的相关研究已经广泛应用于人脸识别、车牌识别、文字识别等方面并取得了巨大的成功,但是在复杂光照、低分辨率、图像模糊等复杂情况下,图像识别仍然面临着巨大的挑战。随着计算机技术、视频监控技术、网络技术的快速发展,以及电子商务、社交网络、网络视频的普及,目前常常可以获得同一个物体的多幅图像组成的图像集合或视频,利用图像集合或视频进行图像识别能够有效获得更多的可判别信息,相较于传统单幅图像识别方法有较强的优势。单幅图像识别方法普遍以单幅图像作为分析研究对象,其显著特点在于识别阶段只采单幅图像的信息去进行图像匹配,而使用图像集合或视频的图像识别方法,无论在训练过程或者识别过程中都以图像集合或一段视频为单位进行匹配,其中,基于视频的图像识别方法(简称“视频图像识别方法”)也可以称之为图像集识别方法。
目前,大部分视频图像识别方法一般都是建立在欧氏空间中,例如:概率模型、线性子空间、稀疏表示、尺度学习、仿射/凸包模型等方法。其中,基于线性子空间进行图像匹配的视频图像识别方法(Mutual Subspace Method,MSM)是使用最为广泛的一种,其利用了两个线性子空间之间的相似度度量规则——典型相关角(canonical angles),进行相似度的度量,如图1所示,视频人脸图像帧可以组成不同的图像集合,X1和X2代表不同人的一个视频图像集合,然后分别将其各自表达成不同的线性子空间,通过它们之间的典型相关角θ可得到两个视频图像集合之间的相似性,从而进行识别。然而,大量相关研究表明,许多视觉特征(如图像的线性子空间、协方差矩阵、形状特征等)常常并不处于我们所熟知的欧氏空间中,而是存在于具有一定性质的扭曲的拓扑空间——黎曼流形(Riemannianmanifold)上,黎曼流形是局部具有欧氏空间性质的拓扑空间,从几何上看,其拓扑结构是一个扭曲的拓扑空间,且目前已经有大量方法使用图像的线性子空间、协方差矩阵、形状特征等视觉特征作为黎曼流形上的元素,并成功应用于视频图像识别任务。图像集合的线性子空间实际上属于视觉统计特征,研究认为,这些视觉统计特征可能存在于非欧空间格拉斯曼(Grassmann)流形上,格拉斯曼流形在视频图像识别上已经得到了广泛的应用,其被定义为一组子空间的集合,是黎曼流形的一种特殊形式,通过定义格拉斯曼流形上的距离即可实现图像集合与图像集合之间的相似度度量,如流形的测地距离,且除了流形的测地距离,也可根据典型相关角定义多种格拉斯曼流形距离。格拉斯曼流形判别分析(GrassmannDiscriminant Analysis,GDA)利用格拉斯曼核函数将流形上的视觉统计特征重新映射到欧氏空间中,并在此映射的空间中使用线性判别分析(Linear Discriminant Analysis,LDA)方法。众所周知,传统的线性判别分析(LDA)方法在求解最优投影矩阵的过程中,通常需要求类内散度矩阵的逆。但是实践发现,常常由于训练样本数量有限且特征维度较高,从而导致类内散度矩阵是奇异的,进而导致类内散度矩阵的逆并不存在的情况。可见,当前的GDA方法存在因类内散度矩阵奇异而导致的求逆不稳定及泛化能力差的问题。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910943071.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人体姿态识别方法、装置、设备及存储介质
- 下一篇:指纹识别模组及电子设备





