[发明专利]一种自适应确定目标尺寸和感受野大小的方法有效
申请号: | 202110449343.6 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113378876B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 许雯;孟朝晖 | 申请(专利权)人: | 河海大学 |
主分类号: | G06V10/70 | 分类号: | G06V10/70;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 罗运红 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 确定 目标 尺寸 感受 大小 方法 | ||
本发明公开了一种自适应确定目标尺寸和感受野大小的方法,包括如下步骤:S1:定义九个候选框尺寸,计算真实目标框与候选框的交集面积,与它们的并集面积比,得到一个面积比值;S2:根据得到的候选框,计算出正候选框与真实框之间的偏移量offset与缩放因子(sx,sy);S3:从正候选框中选出得分最高的k个候选框(k表示图片中目标的个数),再进行一次面积计算,大于给定阈值的视为该正候选框与得分最高的其中一个候选框表示同一个目标故去掉。本发明在保证高运算效率以及低内存占有率的情况下保证了图像目标框的结果,通过RGB颜色差值的对比来进行分割,每个图片包含的像素点均有最大限制,保证了每张图片产生九×高×宽个候选框,保证了计算运行的效率。
技术领域
本发明涉及一种自适应确定目标尺寸和感受野大小的方法,属于计算机视觉和模式识别领域。
背景技术
图片是由W×H×3的像素点组成,其中W、H是图片的宽和高,3代表由红、绿、蓝组成3通道的颜色,(x,y,rbg)代表图片中的任意一点,(x,y)是位置坐标,rbg为该位置的颜色。
目标检测分为两类,一类是two-stage,将物体识别和定位分为两个步骤,例如R-CNN、Fast R-CNN、Faster R-CNN;另一类是one-stage,适用于实时检测,例如Yolo、SDD、YoloV2。第一类准确度更高,但速度慢一些,第二类速度更快,但没有two-stage精确。本发明则是属于第一类two-stage。
传统卷积网络的卷积核都是固定大小的尺寸,不能很好的适应几何形变,可变形卷积网络在位置坐标中加了一个偏移量Δp,能够自适应学习改变提取框的形状和位置,但是由于多加了一个训练参数,将会导致训练速度低下,为了提升网络的训练速度,减小资源消耗。
RPN(区域候选网络),本质上是基于过滤器的无差别object检测。RPN的输入特征图是Faster RCNN的公用特征图Feature map,取一个a*a的滑动窗口,对特征图中的k个候选框做卷积操作,根据每个候选框的得分和位置坐标来修改提取框,确定目标中心。而日常生活中大多数是不规则物体,矩形提取框不能很好描述目标。
本发明受可变形卷积网络启发,在基础RPN的提取框上进行改进。需要对Featuremap提取几个候选框,在候选框中的每个位置增加一个偏移量,经过学习候选框则会移动到目标位置,候选框也会形成目标形状。以上网络的实现如果采用传统网络的输入矩阵与权值矩阵的乘积,因为增加了的一个位置参数,而使得计算量巨大。所以这里我们采用加法网络代替乘法网络,精度损失非常小,但速度提升一个量级。
发明内容
发明目的:本发明旨在使用加法网络提升two-stage目标检测的速度,使提取框更准确的描述目标。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种自适应确定目标尺寸和感受野大小的方法,该方法包括如下步骤:
Step1:对原始分辨率448*256的图片进行ResNet-50网络卷积操作提取特征图featuremaps,将卷积中的乘法换成加法操作,具体操作如下:
其中,Y(m,n,t)表示输出坐标为(m,n)第t个通道的值,X(m+i,n+j,k)表示输入坐标为(m+i,n+j)的第k个通道的值,cin为原始输入图片的通道,F(i,j,k,t)是过滤器,也为权值矩阵,过滤器大小为d*d,经过ResNet-50网络卷积得到28*16*256的特征图,用于区域候选框提取RPN和感兴趣区域池化ROIPooling共享;
Step2:定义九个边界框尺寸,候选框尺寸如下:
{[2,2],[2,4],[2,8],[4,2],[4,4],[4,8],[8,2],[8,4],[8,8]};
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110449343.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生物肥料施肥系统
- 下一篇:一种直接3D打印的复合功能材料及打印方法