[发明专利]一种优化词袋模型的图像分类方法有效
| 申请号: | 202111087243.X | 申请日: | 2021-09-16 |
| 公开(公告)号: | CN113902930B | 公开(公告)日: | 2023-10-27 |
| 发明(设计)人: | 李海滨;张秀菊 | 申请(专利权)人: | 燕山大学 |
| 主分类号: | G06V10/46 | 分类号: | G06V10/46;G06V10/762;G06V10/74;G06V10/764;G06N20/10 |
| 代理公司: | 石家庄众志华清知识产权事务所(特殊普通合伙) 13123 | 代理人: | 张建 |
| 地址: | 066004 河北*** | 国省代码: | 河北;13 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 优化 模型 图像 分类 方法 | ||
1.一种优化词袋模型的图像分类方法,其特征在于:包括以下步骤:
步骤1:提取局部特征描述符;
对训练图像和测试图像提取密集SIFT特征并生成128维的局部特征描述符;
步骤2:生成视觉字典;
对训练图像中的局部特征描述符进行k-means聚类生成视觉字典;
步骤3:生成显著性字典;
考虑视觉字典中视觉单词之间的内在关系,通过计算视觉单词之间的相似度,为每个视觉单词赋予一个权重,来突出显著性单词,弱化相似性单词,进而提高视觉字典整体的显著性和判别力;
步骤4:加权局部约束线性编码;
将局部特征描述符分配给最近邻的K个视觉单词并考虑局部特征描述符与近邻单词的位置关系,根据位置关系为近邻单词设置不同的加权系数,从而生成局部特征描述符通过视觉单词表示的编码系数向量;
步骤5:空间金字塔池化;
将图像分层划分成1*1、2*2、4*4的子图像块,分别统计各子图像块中视觉单词的分布情况,并按照一定的权重聚合构成图像的向量表示;
步骤6:SVM分类;
将待分类图像的向量表示输入到HIK交叉核函数的线性SVM分类器中,对图像进行分类。
2.根据权利要求1所述的一种优化词袋模型的图像分类方法,其特征在于:所述步骤3包括:
步骤3.1:对生成的视觉字典B∈R128×M每列计算均值得到向量C∈R1×M,其中任意一个元素ci表示一个视觉单词的均值;
步骤3.2:用视觉字典B∈R128×M的每一列减去视觉单词均值向量C∈R1×M,得到视觉字典的差值矩阵D∈R128×M;
步骤3.3:通过计算E=D·DT得到视觉字典B∈R128×M的相关性矩阵E∈RM×M,其中每一个元素eij表示视觉字典中视觉单词xi与视觉单词xj的相关性;
步骤3.4:令F=ones(M)-E,并对F∈RM×M每列求和得到G∈RM×1,再通过S=G./mean(G)对G∈RM×1进行归一化,得到视觉字典的显著性表示S∈RM×1,其中si表示视觉单词bi的显著性;
步骤3.5:通过计算视觉单词与视觉单词显著性相乘,得到显著性字典A=[s1b1,...,sibi,...,sMbM]∈R128×M。
3.根据权利要求1所述的一种优化词袋模型的图像分类方法,其特征在于:所述步骤4包括:步骤4.1:计算局部特征描述符与视觉单词的欧式距离,寻找局部特征最近邻的K个视觉单词;
步骤4.2:通过计算K个近邻单词的位置关系,在编码过程中为每个近邻单词设置不同的权重;
步骤4.3:通过求解加权局部约束线性编码目标函数,获得图像的编码系数表示Z=[z1,...,zi,...,zN]∈RM×N。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111087243.X/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





