[发明专利]基于多层次特征提取和上下文模型的目标检测有效
申请号: | 201610056601.3 | 申请日: | 2016-01-27 |
公开(公告)号: | CN105740891B | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 刘波;马增妍 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多层次 特征 提取 上下文 模型 目标 检测 | ||
基于多层次特征提取和上下文模型的目标检测,本发明所构造的模型主要是统计了真实图片中图像之间的空间位置关系,从而可以提高目标检测的正确率。无论图像是同类别还是不同类,都会有一些特定的空间位置关系。首先对一副图片进行选择搜索,产生大量region proposals,然后对每一幅图片的所有region proposals进行特征提取,采用的是7层的卷积神经网络,最后用支持向量机进行分类。本发明给出一种新的找到最佳物体检测位置的方法。主要解决的技术问题是提供一种新的上下文模型,代替原有的非极大值抑制方法,用来获得更好的目标检测正确率。
技术领域
本发明属于计算机机器学习领域,具体是把机器学习算法应用到图像处理中的目标检测上,即定位图片中目标位置的一种算法。
背景技术
目标检测是定位图像中目标位置的一种算法,它将目标的分割和识别合二为一。总结2010—2012年间,在标准的视觉检测PASCAL VOC数据集上训练的各种算法的平均查准率后,不难发现,算法进步缓慢,几乎都是集成系统或者在已有算法上的一点点改进。直到2012年,Alex Krizhevsky应用卷积神经网络(Convolutional Neural Networks)在图像分类上并取得很大的进步,在Alex Krizhevsky的基础上,Ross Girshick提出了在PASCALVOC数据集上应用卷积神经网络(Convolutional Neural Networks)提取图像的特征,并用线性的支持向量机(Support Vector Machine)进行分类,从而判断图像的所属类别即实现目标检测。
Ross Girshick的具体内容是首先对一副图片进行选择搜索,产生大量regionproposals,然后对每一幅图片的所有region proposals进行特征提取,采用的是7层的卷积神经网络,最后用支持向量机进行分类。
传统的目标检测算法一般都采用滑动窗口的方法来解决定位题,但是由于RossGirshick采用的是7层卷积神经网络,在5层卷积后得到的图像大小已经很小了,不适合滑动窗口,而且滑动窗口耗时长。因此,Ross Girshick采用选择搜索的方法产生大量的region proposals。选择搜索通过分割方法将图分成多个regions,再用最小生成树算法合并像素点,构成一个个region proposals。第一步分割图片,把图像(Image)表示成图结构(Graph),Image中的每一个像素看成Graph中的每一个顶点,像素之间的关系构成Graph的边,边得权值是像素之间的灰度差值,用最小生成树算法合并像素点,构成一个个regions。第二部合并regions,首先计算所有regions之间两两的颜色相似度,纹理相似度,大小相似度,吻合相似度,再把这4种相似度组合起来,得到最终的相似度。根据相似度合并最像的2个regions,再重新计算新产生的region和其它剩下的regions的相似度。重复上述过程直到整张图片都聚合成了一个大的region,随机给每个region打分,并按分数进行排序,选出前K个子集。
以Alex Krizhevsky提出的7层卷积神经网络为框架,对每一幅图片的所有regionproposals进行特征提取。7层卷积神经网络中前5层是卷基层,后2层是全连接层。因为卷积神经网络的输入是固定格式的227*227,而经过选择搜索后得到的region proposals大小不定,所以,对每一个region proposal先进行长宽调整再输入网络。最后把从网络输出的结果用线性的支持向量机进行分类,从而进行目标检测。为了消除多余的框,找到最佳的物体检测的位置,一般采用非极大值抑制(non-maxima suppression)方法。
发明目的
本发明给出一种新的找到最佳物体检测位置的方法。主要解决的技术问题是提供一种新的上下文模型,代替原有的非极大值抑制(non-maxima suppression)方法,用来获得更好的目标检测正确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610056601.3/2.html,转载请声明来源钻瓜专利网。