[发明专利]基于SURF特征的图像物体识别方法有效

申请号：	201510785408.9	申请日：	2015-11-16
公开（公告）号：	CN105389593B	公开（公告）日：	2019-01-11
发明（设计）人：	蒋兴浩;孙锬锋;许可;姜华;郑辉	申请（专利权）人：	上海交通大学;上海神州数码有限公司
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	上海汉声知识产权代理有限公司 31236	代理人：	郭国中
地址：	200240 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 surf 特征图像物体识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于SURF特征的图像物体识别方法，其特征在于，包括如下步骤：

步骤a：对图像进行预处理，提取预处理后图像的局部兴趣点特征，将局部兴趣点特征进行聚类，根据聚类中心的结果建立词袋模型，通过词袋模型建立视觉词汇直方图得到图像的视觉词汇直方图特征；

步骤1：对每个训练样本进行类标签的标记，通过对带有类标签的所述训练样本执行步骤a的操作后得到所述训练样本的视觉词汇直方图特征，利用所述训练样本的视觉词汇直方图特征训练支持向量机SVM分类器，通过核函数将词汇直方图特征映射到特征空间，并在该核函数映射的特征空间中得到最优分类超平面；

步骤2：对待测样本执行步骤a的操作后得到所述待测样本的视觉词汇直方图特征，利用核函数将视觉词汇直方图特征映射到特征空间，在该特征空间中判断该待测样本的视觉词汇直方图特征位于训练完成的SVM分类器的最优分类超平面的哪一侧，统计待测样本属于某个类别的概率，确定所述待测样本所属的类别；

步骤3：对SVM分类器的分类结果进行矫正；

其中，所述步骤1包括：

步骤1.1：将需要分类的n种训练样本类别按照两两组合分成个分类器；

步骤1.2：每个训练样本进行步骤a的处理后得到对应训练样本的视觉词汇直方图特征，将训练样本的视觉词汇直方图特征和所述训练样本的类标签进行关联；

步骤1.3：选择高斯核函数进行非线性可分特征的映射分类，调整支持向量机SVM分类器和核函数的参数，利用所述训练样本的视觉词汇直方图特征训练支持向量机SVM分类器，通过高斯核函数将词汇直方图特征映射到特征空间，并在该高斯核函数映射的特征空间中得到最优分类超平面，该最优分类超平面将不同类标签的训练样本区分开来；其中，选择的高斯核函数如下：

式中：K(x,y)表示内积函数，x表示高维空间中的一个向量，y表示高维空间中的另一个向量，σ表示尺度参数。

2.根据权利要求1所述的基于SURF特征的图像物体识别方法，其特征在于，所述步骤a包括：

步骤a1：对图像进行预处理，即使用3*3的高斯卷积模板对图像进行高斯滤波，将图像尺寸归一化为512*512，并将图像做中心裁剪裁掉边缘的12*12像素；

步骤a2：使用OpenCV开源库函数中的类SurfFeatureDetector中的detect方法检测图像中的SURF快速鲁棒特征兴趣点，和类SurfDescriptorExtractor中的compute方法计算每个兴趣点的SURF描述特征矢量；

步骤a3：对特征矢量进行PCA主成分分析及白化处理，消除特征矢量之间的相关性，并对白化后的特征矢量进行降维处理；

步骤a4：使用Kmeans聚类方法对降维过的兴趣点特征进行聚类，设置K个聚类中心，聚类后使用这K个聚类中心作为视觉词汇建立词袋模型BOVW，即所述词袋模型BOVW中包含了K个视觉词汇；计算图像中的每个兴趣点与词袋模型中词汇的欧氏距离，确定兴趣点属于哪一类视觉词汇，并统计图像中每类视觉词汇出现的次数，建立图像的视觉词汇直方图作为整幅图像的内容表征。

3.根据权利要求1所述的基于SURF特征的图像物体识别方法，其特征在于，所述步骤2包括：

步骤2.1：对待测样本执行步骤a的操作后得到所述待测样本的视觉词汇直方图特征，利用核函数将视觉词汇直方图特征映射到特征空间；

步骤2.2：在所述特征空间中判断该待测样本特征位于训练完成的SVM分类器的最优分类超平面的哪一侧；i类、j类训练样本构成的分类器记为SVM_i,j，其中i,j∈(1,n)，i、j分别表示两种不同类别的训练样本，n表示训练样本的种类数；若分类器的分类结果为i，则测试样本属于i类，i类投票加1；若分类器的分类结果为j，则测试样本属于j类，j类投票加1；

步骤2.3：统计待测样本属于某个类别的概率，确定所述待测样本所属的类别。

4.根据权利要求1所述的基于SURF特征的图像物体识别方法，其特征在于，所述步骤3包括：当待测样本属于各个类别的概率均不超过0.5时，将该待测样本定义为无法判别的类别，用于对SVM分类器的分类结果进行矫正。

5.根据权利要求3所述的基于SURF特征的图像物体识别方法，其特征在于，所述步骤2.2中的在特征空间中判断该待测样本特征位于训练完成的SVM分类器的最优分类超平面的哪一侧的判定公式如下：

式中：S(F_j)表示第j个待测样本的判定结果，sgn(·)表示符号函数运算，α_i表示第i个训练样本的拉格朗日乘子，b为最优分类超平面的参数，K(F_i,F_j)表示高斯核函数，F_i表示样本空间中第i个训练样本的直方图特征，F_j表示第j个待测样本的直方图特征，N为样本空间中的样本总数；S(F_j)为+1时，表示第j个待测样本属于正样本类，S(F_j)为-1时，则表示第j个待测样本属于负样本类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海交通大学;上海神州数码有限公司，未经上海交通大学;上海神州数码有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510785408.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种神经网络自更新过程的实现方法
下一篇：一种基于计算机视觉自动检测虾体完整性的方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于SURF特征的图像物体识别方法有效

专利文献下载