[发明专利]一种优化词袋模型的图像分类方法有效
| 申请号: | 202111087243.X | 申请日: | 2021-09-16 |
| 公开(公告)号: | CN113902930B | 公开(公告)日: | 2023-10-27 |
| 发明(设计)人: | 李海滨;张秀菊 | 申请(专利权)人: | 燕山大学 |
| 主分类号: | G06V10/46 | 分类号: | G06V10/46;G06V10/762;G06V10/74;G06V10/764;G06N20/10 |
| 代理公司: | 石家庄众志华清知识产权事务所(特殊普通合伙) 13123 | 代理人: | 张建 |
| 地址: | 066004 河北*** | 国省代码: | 河北;13 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 优化 模型 图像 分类 方法 | ||
本发明公开一种优化词袋模型的图像分类方法,所述方法包括:提取图像局部特征;对局部特征聚类生成视觉字典;计算视觉单词显著性生成显著性字典;根据显著性字典对图像局部特征进行加权局部约束线性编码;对编码系数矩阵进行空间金字塔池化生成图像向量表示;将得到的图像向量表示输入到HIK交叉核函数SVM分类器中进行分类。本发明提出的显著性字典考虑了视觉单词之间的内在关系,减少了视觉字典中的冗余信息,提升了视觉字典的显著性和判别力。另外提出的加权局部约束线性编码,在将局部特征用视觉单词表示的过程中,考虑了K近邻单词之间的位置关系,为单词设置了权重,减小了重构误差,提升了分类性能。
技术领域
本发明涉及图像处理技术,尤其是一种优化词袋模型的图像分类方法,属于计算机视觉领域。
背景技术
图像分类,即根据图像的语义信息将图像区分开来,越来越成为计算机视觉领域的研究热点。随着人工智能和大数据的不断发展,图像分类技术在智能安防和智能交通等领域具有广泛的应用,逐渐成为机器视觉领域中的关键环节。面对产生的海量数字图像,仅仅依靠人工对其进行分类和标注已经远远无法满足需求,因此图像自动分类方法的研究显得十分必要。
图像分类问题的关键是如何更加有效的对图像的语义信息进行表示。空间金字塔模型因其简单高效迅速发展成为当前使用最为广泛的图像表示方法之一。该模型首先从图像中提取SIFT特征点作为局部特征描述符,并对训练图像的局部特征描述符进行k-means聚类生成视觉字典,然后将每幅图像的局部特征描述符进行编码,最后将图像分层划分为1*1、2*2、4*4的子图像块,统计各子图像块中视觉单词的出现频次构成直方图表示,并将直方图表示按照一定权重串联,构成最终的图像表示。特征编码即将局部特征描述符用视觉字典中的视觉单词来表示,是生成图像表示的关键步骤。最常用的特征编码方法是VQ编码,将局部特征描述符通过最近邻的视觉单词来表示,由于VQ编码仅由一个视觉单词来表示局部特征描述符,这可能造成相似的局部特征描述符的编码不相似;SC编码为了弥补VQ编码的缺陷,将局部特征描述符通过K个视觉单词的稀疏线性组合来表示,但稀疏性可能使局部特征描述符选择多个差异较大的视觉单词来表示;LLC编码在SC编码的基础上进一步考虑了局部性,将局部特征描述符通过K个近邻的视觉单词的线性组合来表示。
综上所述,传统的视觉金字塔模型的缺陷有:第一,通过k-means聚类生成视觉字典,忽略了视觉字典中不同视觉单词之间的内在关系,导致视觉字典空间信息的丢失;第二,在特征编码过程中,将局部特征描述符用视觉单词表示时,将K个近邻单词视为同等重要,并未考虑视觉单词的权重问题,导致较大的量化误差。因此,基于上述问题亟需提出一种更加高效的图像分类方法。
发明内容
本发明需要解决的技术问题是提供一种优化词袋模型的图像分类方法,提高图像分类准确率,避免视觉字典空间信息的丢失,减少量化误差。
为解决上述技术问题,本发明所采用的技术方案是:
一种优化词袋模型的图像分类方法,包括以下步骤:
步骤1:提取局部特征描述符;
对训练图像和测试图像提取密集SIFT特征并生成128维的局部特征描述符;
步骤2:生成视觉字典;
对训练图像中的局部特征描述符进行k-means聚类生成视觉字典;
步骤3:生成显著性字典;
考虑视觉字典中视觉单词之间的内在关系,通过计算视觉单词之间的相似度,为每个视觉单词赋予一个权重,来突出显著性单词,弱化相似性单词,进而提高视觉字典整体的显著性和判别力;
步骤4:加权局部约束线性编码;
将局部特征描述符分配给最近邻的K个视觉单词并考虑局部特征描述符与近邻单词的位置关系,根据位置关系为近邻单词设置不同的加权系数,从而生成局部特征描述符通过视觉单词表示的编码系数向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111087243.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





