[发明专利]一种优化词袋模型的图像分类方法有效

专利信息
申请号: 202111087243.X 申请日: 2021-09-16
公开(公告)号: CN113902930B 公开(公告)日: 2023-10-27
发明(设计)人: 李海滨;张秀菊 申请(专利权)人: 燕山大学
主分类号: G06V10/46 分类号: G06V10/46;G06V10/762;G06V10/74;G06V10/764;G06N20/10
代理公司: 石家庄众志华清知识产权事务所(特殊普通合伙) 13123 代理人: 张建
地址: 066004 河北*** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 优化 模型 图像 分类 方法
【权利要求书】:

1.一种优化词袋模型的图像分类方法,其特征在于:包括以下步骤:

步骤1:提取局部特征描述符;

对训练图像和测试图像提取密集SIFT特征并生成128维的局部特征描述符;

步骤2:生成视觉字典;

对训练图像中的局部特征描述符进行k-means聚类生成视觉字典;

步骤3:生成显著性字典;

考虑视觉字典中视觉单词之间的内在关系,通过计算视觉单词之间的相似度,为每个视觉单词赋予一个权重,来突出显著性单词,弱化相似性单词,进而提高视觉字典整体的显著性和判别力;

步骤4:加权局部约束线性编码;

将局部特征描述符分配给最近邻的K个视觉单词并考虑局部特征描述符与近邻单词的位置关系,根据位置关系为近邻单词设置不同的加权系数,从而生成局部特征描述符通过视觉单词表示的编码系数向量;

步骤5:空间金字塔池化;

将图像分层划分成1*1、2*2、4*4的子图像块,分别统计各子图像块中视觉单词的分布情况,并按照一定的权重聚合构成图像的向量表示;

步骤6:SVM分类;

将待分类图像的向量表示输入到HIK交叉核函数的线性SVM分类器中,对图像进行分类。

2.根据权利要求1所述的一种优化词袋模型的图像分类方法,其特征在于:所述步骤3包括:

步骤3.1:对生成的视觉字典B∈R128×M每列计算均值得到向量C∈R1×M,其中任意一个元素ci表示一个视觉单词的均值;

步骤3.2:用视觉字典B∈R128×M的每一列减去视觉单词均值向量C∈R1×M,得到视觉字典的差值矩阵D∈R128×M

步骤3.3:通过计算E=D·DT得到视觉字典B∈R128×M的相关性矩阵E∈RM×M,其中每一个元素eij表示视觉字典中视觉单词xi与视觉单词xj的相关性;

步骤3.4:令F=ones(M)-E,并对F∈RM×M每列求和得到G∈RM×1,再通过S=G./mean(G)对G∈RM×1进行归一化,得到视觉字典的显著性表示S∈RM×1,其中si表示视觉单词bi的显著性;

步骤3.5:通过计算视觉单词与视觉单词显著性相乘,得到显著性字典A=[s1b1,...,sibi,...,sMbM]∈R128×M

3.根据权利要求1所述的一种优化词袋模型的图像分类方法,其特征在于:所述步骤4包括:步骤4.1:计算局部特征描述符与视觉单词的欧式距离,寻找局部特征最近邻的K个视觉单词;

步骤4.2:通过计算K个近邻单词的位置关系,在编码过程中为每个近邻单词设置不同的权重;

步骤4.3:通过求解加权局部约束线性编码目标函数,获得图像的编码系数表示Z=[z1,...,zi,...,zN]∈RM×N

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111087243.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top