[发明专利]一种基于多尺度特征卷积神经网络的目标定位方法有效
申请号: | 201910148554.9 | 申请日: | 2019-02-28 |
公开(公告)号: | CN110009679B | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 孙俊;周以鹏;吴豪;吴小俊;方伟;陈祺东;李超;游琪;冒钟杰 | 申请(专利权)人: | 江南大学 |
主分类号: | G06T7/73 | 分类号: | G06T7/73;G06N3/04;G06N3/08 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉;刘秋彤 |
地址: | 214122 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于多尺度特征卷积神经网络的目标定位方法,属于计算机视觉领域。本方法针对实际应用中诸多数据集标签部分缺失、无定位标注等问题,提出了基于多尺度特征卷积神经网络的弱监督定位方法,其核心思想利用神经网络分层的特性,在多层卷积层上使用梯度加权类激活映射,生成梯度金字塔模型,并通过均值滤波计算特征质心位置,利用置信强度映射和阈值梯减模块产生连接的像素段,围绕最大边界标注进行弱监督定位。在标准测试集上的实验结果表明,算法能够在存在大量类别、多尺度图像的情况下完成目标定位,具有较高的精确度。 | ||
搜索关键词: | 一种 基于 尺度 特征 卷积 神经网络 目标 定位 方法 | ||
【主权项】:
1.一种基于多尺度特征卷积神经网络的目标定位方法,其特征在于,步骤如下:步骤1、将任意大小的单尺度图像I输入卷积神经网络ConNet,利用特征金字塔模型以及梯度类平均映射Grad‑CAM算法,计算分类的交叉熵误差Lcross‑entrop,计算相对应的引导反向传播梯度
卷积神经网络ConNet每一层输出为{C2,C3,...,Cl},通过主干卷积网络计算预测类别c,针对类别的得分yc,输入图像I的大小w*h;其多层特征图与输出相对应为{F2,F3,...,Fl};步骤2、计算每一层的重要性权重
在多层特征图上计算像素级空间强度并利用ReLU激活函数
步骤3、针对每层梯度金字塔,进行上采样和横向连接操作,求出叠加后的强度,即
步骤4、针对叠加后的
在计算热力图后,计算全局峰值γ,以缩放因子σ进行缩放,作为局部最大阈值;对每个热力图应用最大滤波器和最小滤波器,对应计算最大均值滤波后的
和最小均值滤波后的
并计算差分热力图,将差异不变像素点置0,以获得具有局部最大质心的可能区域;步骤5、经过多次膨胀,生成多个候选点,找出最佳质心,然后利用缩放后的全局峰值进行梯减;步骤6、围绕梯减后的最大边界,选出最大矩形框的坐标[xmin,ymin,xmax,ymax];输出所有图像的目标预测类别Dclass和坐标合集Dloc。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910148554.9/,转载请声明来源钻瓜专利网。