[发明专利]基于SURF特征的图像物体识别方法有效
| 申请号: | 201510785408.9 | 申请日: | 2015-11-16 |
| 公开(公告)号: | CN105389593B | 公开(公告)日: | 2019-01-11 |
| 发明(设计)人: | 蒋兴浩;孙锬锋;许可;姜华;郑辉 | 申请(专利权)人: | 上海交通大学;上海神州数码有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 surf 特征 图像 物体 识别 方法 | ||
1.一种基于SURF特征的图像物体识别方法,其特征在于,包括如下步骤:
步骤a:对图像进行预处理,提取预处理后图像的局部兴趣点特征,将局部兴趣点特征进行聚类,根据聚类中心的结果建立词袋模型,通过词袋模型建立视觉词汇直方图得到图像的视觉词汇直方图特征;
步骤1:对每个训练样本进行类标签的标记,通过对带有类标签的所述训练样本执行步骤a的操作后得到所述训练样本的视觉词汇直方图特征,利用所述训练样本的视觉词汇直方图特征训练支持向量机SVM分类器,通过核函数将词汇直方图特征映射到特征空间,并在该核函数映射的特征空间中得到最优分类超平面;
步骤2:对待测样本执行步骤a的操作后得到所述待测样本的视觉词汇直方图特征,利用核函数将视觉词汇直方图特征映射到特征空间,在该特征空间中判断该待测样本的视觉词汇直方图特征位于训练完成的SVM分类器的最优分类超平面的哪一侧,统计待测样本属于某个类别的概率,确定所述待测样本所属的类别;
步骤3:对SVM分类器的分类结果进行矫正;
其中,所述步骤1包括:
步骤1.1:将需要分类的n种训练样本类别按照两两组合分成 个分类器;
步骤1.2:每个训练样本进行步骤a的处理后得到对应训练样本的视觉词汇直方图特征,将训练样本的视觉词汇直方图特征和所述训练样本的类标签进行关联;
步骤1.3:选择高斯核函数进行非线性可分特征的映射分类,调整支持向量机SVM分类器和核函数的参数,利用所述训练样本的视觉词汇直方图特征训练支持向量机SVM分类器,通过高斯核函数将词汇直方图特征映射到特征空间,并在该高斯核函数映射的特征空间中得到最优分类超平面,该最优分类超平面将不同类标签的训练样本区分开来;其中,选择的高斯核函数如下:
式中:K(x,y)表示内积函数,x表示高维空间中的一个向量,y表示高维空间中的另一个向量,σ表示尺度参数。
2.根据权利要求1所述的基于SURF特征的图像物体识别方法,其特征在于,所述步骤a包括:
步骤a1:对图像进行预处理,即使用3*3的高斯卷积模板对图像进行高斯滤波,将图像尺寸归一化为512*512,并将图像做中心裁剪裁掉边缘的12*12像素;
步骤a2:使用OpenCV开源库函数中的类SurfFeatureDetector中的detect方法检测图像中的SURF快速鲁棒特征兴趣点,和类SurfDescriptorExtractor中的compute方法计算每个兴趣点的SURF描述特征矢量;
步骤a3:对特征矢量进行PCA主成分分析及白化处理,消除特征矢量之间的相关性,并对白化后的特征矢量进行降维处理;
步骤a4:使用Kmeans聚类方法对降维过的兴趣点特征进行聚类,设置K个聚类中心,聚类后使用这K个聚类中心作为视觉词汇建立词袋模型BOVW,即所述词袋模型BOVW中包含了K个视觉词汇;计算图像中的每个兴趣点与词袋模型中词汇的欧氏距离,确定兴趣点属于哪一类视觉词汇,并统计图像中每类视觉词汇出现的次数,建立图像的视觉词汇直方图作为整幅图像的内容表征。
3.根据权利要求1所述的基于SURF特征的图像物体识别方法,其特征在于,所述步骤2包括:
步骤2.1:对待测样本执行步骤a的操作后得到所述待测样本的视觉词汇直方图特征,利用核函数将视觉词汇直方图特征映射到特征空间;
步骤2.2:在所述特征空间中判断该待测样本特征位于训练完成的SVM分类器的最优分类超平面的哪一侧;i类、j类训练样本构成的分类器记为SVMi,j,其中i,j∈(1,n),i、j分别表示两种不同类别的训练样本,n表示训练样本的种类数;若分类器的分类结果为i,则测试样本属于i类,i类投票加1;若分类器的分类结果为j,则测试样本属于j类,j类投票加1;
步骤2.3:统计待测样本属于某个类别的概率,确定所述待测样本所属的类别。
4.根据权利要求1所述的基于SURF特征的图像物体识别方法,其特征在于,所述步骤3包括:当待测样本属于各个类别的概率均不超过0.5时,将该待测样本定义为无法判别的类别,用于对SVM分类器的分类结果进行矫正。
5.根据权利要求3所述的基于SURF特征的图像物体识别方法,其特征在于,所述步骤2.2中的在特征空间中判断该待测样本特征位于训练完成的SVM分类器的最优分类超平面的哪一侧的判定公式如下:
式中:S(Fj)表示第j个待测样本的判定结果,sgn(·)表示符号函数运算,αi表示第i个训练样本的拉格朗日乘子,b为最优分类超平面的参数,K(Fi,Fj)表示高斯核函数,Fi表示样本空间中第i个训练样本的直方图特征,Fj表示第j个待测样本的直方图特征,N为样本空间中的样本总数;S(Fj)为+1时,表示第j个待测样本属于正样本类,S(Fj)为-1时,则表示第j个待测样本属于负样本类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;上海神州数码有限公司,未经上海交通大学;上海神州数码有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510785408.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





