[发明专利]一种基于邻近尺度特征滤除与转移的物体检测方法有效
申请号: | 201910861981.1 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110738113B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 庞彦伟;李亚钊 | 申请(专利权)人: | 天津大学 |
主分类号: | G06V20/58 | 分类号: | G06V20/58;G06V10/774;G06V10/80;G06V10/52;G06V10/82;G06N3/0464;G06N3/048;G06N3/084 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 邻近 尺度 特征 转移 物体 检测 方法 | ||
1.一种基于邻近尺度特征滤除与转移的物体检测方法,主要包含下列步骤:
第一步,收集包含各种不同类别物体的图像,并标注每张图像中的所有感兴趣物体,标注内容为每一个物体的坐标位置,每一个物体的类别,每一张图像的语义分割结果,以其作为图像标签信息;将收集的图像划分为训练集,验证集和测试集,训练集用于训练卷积神经网络,验证集用于选择最佳的训练模型,测试集为后续测试模型效果或者实际应用时使用;
第二步,设计物体检测主干卷积神经网络,基于该主干卷积神经网络,提取多层级的物体特征,其中浅层特征包含所有尺度物体的特征,中层特征包含中尺度与大尺度物体特征,深层特征包含大尺度的物体特征,方法如下:
(1)主干卷积神经网络包括卷积层、池化层、归一化层、非线性激活层;提取网络的多层级金字塔特征K1-K3,该特征为尺度无关特征,K1中包含大中小三种尺度物体的特征,K2中只包含大中尺度物体的特征,K3中只包含大尺度物体的特征;
(2)利用K2特征,经过注意力模块,生成大中尺度注意力,其在特征图中关注大中尺度物体的信息,注意力模块包含卷积层、上采样层和Sigmoid激活函数层;将该注意力与K1特征进行逐元素相乘得到K1中所包含的大中尺度物体的特征N;
(3)采用包含特征相减、卷积操作在内的特征滤除模块E,从K1中滤除大中尺度物体特征N,得到小物体特征S1;
(4)包含特征相加、并联、卷积融合操作的采用特征转移模块T,将大中尺度物体特征N与K2融合得到增强后的大中尺度物体特征K2’;
(5)在K2’和K3上采用特征滤除模块E与特征转移模块T,得到中尺度物体敏感的特征S2与大尺度物体敏感特征S3;
(6)根据所得到的尺度敏感特征S1-S3,设计三种尺度对应的检测子,回归和分类对应尺度的物体所述检测子包含卷积层、ReLU和 Softmax层;
第三步,输入数据,前向计算预测结果和损失代价,通过反向传播算法计算参数的梯度并更新参数;迭代的更新参数,待代价函数曲线收敛时,模型训练完毕,方法如下:
(1)前向计算:
a) 将训练图像输入网络中,通过主干子网络的各层计算,得到多层级特征K1-K3;
b)经过特征滤除模块E与特征转移模块T,生成尺度敏感的特征S1-S3;
c) 基于尺度敏感特征S1-S3,计算每一个尺度检测子的预测结果;
d) 根据预测结果和真实标签,计算物体框的回归损失与类别分类损失,并计算总损失
(2)反向传播:
通过反向传播算法,计算每一层参数的梯度,采用梯度下降法更新该网络中的所有可学习的参数;
(3)迭代训练:
迭代的进行上述的(1)前向传播和(2)反向传播过程,不断的更新参数,停止标准选择损失函数的损失值趋近于收敛,停止迭代信号;
第四步,将训练好的模型应用于测试或实际应用中,当输入图像时,通过该模型计算得到图像的检测结果,即物体的位置和类别信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910861981.1/1.html,转载请声明来源钻瓜专利网。