[发明专利]一种广义图像目标检测方法无效
申请号: | 201210297337.4 | 申请日: | 2012-08-20 |
公开(公告)号: | CN102855486A | 公开(公告)日: | 2013-01-02 |
发明(设计)人: | 赵三元;李凤霞;李仲军;陈宇峰;王清云;孙晨升 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06T7/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种广义图像目标检测方法,属于图像分析处理技术领域。本发明方法结合图像特征提取与学习过程中的样例方法和多实例方法的优势,在此基础上扩展成为多核多实例相似度特征(MKMIS),能够为同一类中具有不同外观的目标进行很好的描述,并能接受一定范围内的配准误差;其次,针对MKMIS特征的弱势,即图像特征维度过高、计算量大的情况,在分类器学习过程中,使用推广的前向特征选择方法,使其能够满足任意条件的损失和约束函数,使分类器可以选择到少量并且有效的图像特征,当进行在线目标检测时,只计算和使用这些特征即可,从而加快目标检测的速度。 | ||
搜索关键词: | 一种 广义 图像 目标 检测 方法 | ||
【主权项】:
1.一种广义图像目标检测方法,其特征在于包括以下步骤:步骤一、读取训练集图像和样例集图像,提取出它们的低层图像特征,具体如下:所述训练图像和样例图像,具有统一的图像尺寸,目标在图像中所占的比例应保持尺度相当;特征提取是基于统一大小的固定网格进行的,图像被网格划分为M个矩形块,每个矩形块对应于一个图像特征通道,M为正整数;首先,定义每个矩形块的位置为一个锚点,锚点邻域内的若干矩形块为该锚点的支撑集,锚点的支撑集对应于多实例学习方法中的实例包;然后,根据已设置的M个锚点处的矩形块,对训练集图像提取低层多实例图像特征;每一个图像采样sampi的低层特征向量是
其中i表示训练图像的序号,为正整数;
分别表示第i个图像上1至M个矩形块上的图像特征向量,其中
m∈{1,2,...,M},Im表示锚点m处的支撑集,j表示支撑集Im中的实例序号;之后,根据已设置的锚点位置,对样例集图像提取低层图像特征
其中,xe表示样例图像的特征向量,k表示样例图像的序号;步骤二、对经步骤一提取出的训练集图像与样例集图像的低层特征进行相似度比较,获取训练集图像的MKMIS特征;具体如下:令训练集特征
和样例特征
的相似度特征表示为S(xek,xi);首先按矩形区域进行分块比较,然后计算多核相似度
所述训练图像与样例图像在锚点m处的多核相似度特征,是通过不同相似度函数计算得到的特征连接起来构成的多核相似度:
其中,
是P种不同的相似度函数,P取正整数;T是转置符号;之后,计算多实例相似度
训练图像锚点m的支撑集Im与样例集图像对应锚点m处矩形块的相似度比较结果的集合为
由于存在配准误差,目标部件与样例集中的最好配准将会出现在该锚点支撑集中;理想的情况是,正样例与正锚点支撑集中至少有一个长方形块具有很高的相似度值,与负样例的锚点支撑集具有很低的相似度值;负样例与负锚点支撑集中至少一个长方形块具有很高的相似度值,与正标记锚点支撑集具有很低的相似度;多实例学习通过取锚点支撑集中的最大值作为该锚点的相似度值:
以上的形式不是对称的;若相似度函数是半正定的,则设计一个匹配核k:
k这个核函数忽略较小的配准误差,只要误差在支持集的范围之内;最后,构成MKMIS特征:对于训练集的一幅图像,将它所有锚点处计算得到的相似度值
连接起来,构成整个相似度特征向量:
其中,T是转置符号;步骤三、使用经步骤二得到的MKMIS特征,训练基于前向特征选择的SVM分类器,实现过程如下:首先,初始化每个训练样本的权重βi为1;之后,迭代如下过程,直到分类器性能符合要求:(1)根据当前样本权重βi,对特征d=1,...,D,D是一个特征向量的维度,计算
的值,其中R是二次约束或者一次约束,根据实际情况自由设定;ωd是第d维特征的权值,初始化为0,SVM将为每个维度的特征学习到其权重值;λ是求解线性SVM问题时在规范项跟经验损失之间做平衡的数值,根据经验结果选定,通常跟训练样本大小和用的kernel类型都有关系,具体选择时可按照一个指数的序列进行选择,找到使分类效果最好的作为λ;xi,d表示第i个样本的第d维的特征值;N是样本总数目;将令此值最大的一个或若干个特征加入到选中的特征集中,训练线性SVM,得到到新的样本权重βi;(2)当训练完分类器后,利用梯度下降法,优化码书中的码字,即迭代如下步骤:首先,计算损失函数对每个样例的梯度:
其中f是SVM的计分函数,
sik表示第i个图像和第k个样例图像的相似度,xek第k个样例图像的特征;然后,更新样例:
其中σ为在梯度方向上的步长,通过如下的线性搜索方法确定步长:取步长σ为序列
中的每一个值,计算(LOld-LNew)/gσ,其中g为梯度
的大小,LOld为使用原样例xek的损失函数大小,LNew为使用了更新的样例
的损失函数大小;取令(LOld-LNew)/gσ值大于某一预设的阈值的第一个σ;步骤四、利用训练好的分类器,使用滑动窗口检测图像中的目标;对于一幅任意大小的测试图像,提取图像上滑动窗口内的低层特征,计算与选中的样例集的MKMIS特征;使用步骤三中训练好的分类器进行分类决策。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210297337.4/,转载请声明来源钻瓜专利网。
- 上一篇:带温度计的多功能鱼缸
- 下一篇:生物传感器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序