[发明专利]一种基于局部特征学习的快速物体检测方法有效
申请号: | 201510927756.5 | 申请日: | 2015-12-14 |
公开(公告)号: | CN105574527B | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 杨金福;陈浩;张珊珊;张强 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于局部特征学习的快速物体检测方法,在测试阶段采用窗口遍历测试样本进行分类从而检测出物体的位置以及类别。由于需要遍历,因此传统物体检测方法的计算代价较大。本发明提出一种基于局部特征学习快速的物体检测方法:在训练阶段,以范例支撑向量机为学习框架,利用线性支撑向量机训练范例模板。在检测阶段,首先利用快速物体粗检测,提取出可能存在物体的区域,再利用训练得到的范例模板进行物体细检测。本发明方法不仅可以有效提高物体检测准确率,而且能够有效提高物体检测的速度。 | ||
搜索关键词: | 一种 基于 局部 特征 学习 快速 物体 检测 方法 | ||
【主权项】:
1.一种基于局部特征学习的快速物体检测方法,其特征在于:该方法包括如下步骤,步骤1:训练范例模板步骤1.1:训练集图像的获取利用安装在移动机器人平台上的摄像机,采集物体图像,并根据训练集中的标签信息确定需要训练的物体模版的正样本集P以及负样本集N,其中含有特定物体的样本称为正样本,反之称为负样本,训练集中的每一个正样本都需要单独与全部的负样本一起训练,步骤1.2:模板训练对每个正样本和全部的负样本,利用支持向量机进行训练,得到每个正样本相对应的范例模板,其中支持向量机的优化函数为:
其中,C1,C2为惩罚项,h(x)为损失函数,ω表示使分类间隔最大的划分直线的法向量,ωT表示ω的转置运算,b表示偏移量,xE表示某个正样本,x表示负样本,N表示负样本集,当||ω||2取得最小值时,ΩE(ω,b)即表示最佳分类面,步骤1.3:模板标定由于不同的支持向量机分类器的得分不能直接进行比较,需要对不同的支持向量机分类器进行标定:使用拟合的sigmoid函数将分类器输出统一到[0,1],即可得到对应的概率,Sigmoid映射函数如下:
其中,αE,βE是sigmoid函数的参数,通过最大似然估计得到;步骤2:物体的粗检测步骤2.1:物体模板ωEX的建立步骤2.1.1:在低像素的条件下,虽然不容易分清图像中具体包含的物体,但是人们却容易分辨出是否含有物体,基于这种思想,将训练数据集中的图像缩放成36种不同的尺寸的图像,构成图像集合{(W0,H0)},其中W0,H0∈{10,20,40,80,160,320},利用下式表示:l=(i,x,y)其中l表示含有物体的窗口,i是表示图像的大小,(x,y)表示位置,步骤2.1.2:计算图像的梯度范数(Normed Gradients,NG)特征,即图像中某区域的梯度范数值,在一个8*8区域内,可以根据梯度算子计算得到一个64维的梯度范数特征,具体计算方法是:利用一个一维梯度算子[‑1,0,1]来计算图像中水平和垂直方向上的梯度gx和gy,并通过计算min{|gx|+|gy|,255}得到图像的梯度范数特征,这样计算的优势在于可以将这一特征归一化到[0,255]之间,进而可以转换为8位二进制数,便于后面的二值化处理,步骤2.1.3:利用线性支持向量机训练物体模板ωEX:以已标注物体的窗口的梯度范数特征作为正样本,随机抽取背景窗口的梯度范数特征作为负样本,利用线性支持向量机训练得到物体模板ωEX,依据公式(3),并利用ωEX和在36种尺寸图像上滑动扫描得到每个窗口的得分:sl=<ωEX,gl> (3)其中gl是每个窗口的梯度范数特征,步骤2.1.4:利用窗口大小、匹配得分以及最终窗口是否含有目标三者之间的关系进行建模,利用公式(4)计算得到最终匹配的得分,并在每种窗口尺寸大小选择M个得分最高的作为目标输出:Ol=vi·sl+ti (4)上式中的vi,ti为线性模型的参数,ti为误差项,这两个参数可用线性支持向量机学习得到,即用36种不同尺寸图像中在位置l处的二值化梯度范数与模板匹配得分作为训练样本,利用线性支持向量机的方法训练得到vi,ti,步骤2.2:物体模板ωEX的二值化为了进一步加速运算,利用公式(5)对ωEX进行二值化:
其中,αj表示基向量,βj表示相应的系数,Nω为基向量的个数,进一步将每个αj表示成:
其中,
则一个二进制的向量b满足下式:
由于一个十进制数可以由其二进制数的最高几位来近似,则二值化64维的梯度范数特征近似表示为:
其中Ng为十进制数所对应的二进制数高位个数,k表示二进制的位数,bk,l表示位置l处位数k对应的二进制向量;由公式(5)、(6)和(7)得到位置l处的二值化梯度范数与模板匹配得分最终可表示为:
其中,
为简化起见,用Cj,k表示,步骤2.3物体的粗检测利用步骤2.1训练得到的物体模板ωEX,在36种不同尺寸下的测试图像滑动扫描并计算每个窗口存在物体可能性的得分,然后排序,将得分靠前的区域坐标作为物体粗检测的结果,步骤2.4优化粗检测结果物体粗检测得到的结果中往往含有较多冗余项,需要对粗检测结果进行优化,以去除冗余:1)根据真实物体外观形状的先验知识,在粗检测结果中滤掉尺寸较小的近似物体区域和细长的近似物体区域;2)计算剩余近似物体区域内像素点的梯度,并设定阈值,将梯度值较小的区域剔除,进一步缩小物体检测范围;3)对剩余近似物体区域图像块进行聚类,计算聚类中心几何坐标,并以本聚类近似物体区域的最外侧作为边界,确定可能存在物体的显著区域,步骤3;基于范例模版的物体检测步骤3.1:基于HOG特征滑动窗口的物体检测以步骤2检测得到的可能存在物体区域作为范例模板物体检测器的输入,采用固定大小的滑动窗口的方法,提取每个滑动窗口的HOG特征,并根据步骤1训练得到的模板,计算输入图像区域的得分,定义权值a,表示区域内像素点到聚类中心点平均距离的倒数,将每个输入图像区域的得分乘以权值a作积,作为该区域的最终得分,步骤3.2:基于共生矩阵互信息的优化由于滑动窗口搜索是一种过搜索策略,会导致冗余检测区域,一般的对策是采用非极大值抑制,非极大值抑制是一种贪心算法,即先将所有的候选目标区域依据其得分从大到小排序,然后,依次选择得分最高的区域保留下来,同时将重合面积的候选目标区域删掉,本方法同样利用非极大值抑制,但是不同点在于:没有直接使用范例分类器的得分,而是先综合各个范例模板的得分以及互信息之后得到新的得分,再进行非极大值抑制,具体的实现方式是:对于某类物体的范例模板ei,由于另一个与其存在互信息的范例模板ej对于同一片区域Ri的检测影响,因此对于ei检测到的区域Ri其新的得分可以通过下式得到:
其中,fj(Ri)=[f1,f2,...fj...,fN],fj为范例模板ei与范例模板ej的互信息特征,mei表示同时检测正确的概率,
表示mei的转置运算,mei通过直接统计训练集得到,i=1,2,...,N,M=[me1,me2,...,meN]是一个N*N矩阵,即为共生矩阵,它表示不同的范例模板如ei和ej检测到共同区域的可能程度,是通过直接统计训练集得到的。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510927756.5/,转载请声明来源钻瓜专利网。