[发明专利]一种基于复合金字塔的旋转目标检测方法有效
申请号: | 201910031679.3 | 申请日: | 2019-01-14 |
公开(公告)号: | CN109858530B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 杭涛;祁伟;张婷婷;曹峰 | 申请(专利权)人: | 苏州长风航空电子有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/70;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 215000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明揭示了一种基于复合金字塔的旋转目标检测方法,在标定目标样本时加入了旋转标定的功能,对于目标的位置通过增加目标框的旋转角度来准确标定目标;在训练网络模型时通过加入旋转角度的计算,将目标角度误差反馈到网络中,使得网络能够学习到目标的角度信息。本发明通过加入角度信息的误差计算,对损失函数进行约束,使得网络能够输出带有角度信息的目标框,能实现在复杂的环境场景下对旋转目标的检测。利用复合金字塔特征对目标进行分析,提高了远小目标的识别率。 | ||
搜索关键词: | 一种 基于 复合 金字塔 旋转 目标 检测 方法 | ||
【主权项】:
1.一种基于复合金字塔的旋转目标检测方法,其特征在于包括以下步骤:S1对训练样本进行目标标定,标定结果存为[x,y,w,h,a],其中(x,y)是目标中心坐标,(w,h)是目标宽高,(a)是目标的旋转角度,预定义KL个先验框[pw,ph,pa],L为特征金字塔的层数,先验框以宽高(pw,ph)信息从小到大进行排序,pa为先验框的角度;S2将训练图像按固定的宽高比进行缩放填充到I×I大小输入训练网络得到预测特征图ZL,预测特征图大小为NL×WL×HL×KL×(6+C),其中NL为训练图像的批处理数量,(WL,HL)为预测特征图的大小,KL为先验框个数,L为特征金字塔的层数,C为识别的类别数;S3在预测特征图ZL的每个位置对每个先验框预测5个坐标[tx,ty,tw,th,ta]和to,to判断当前先验框是否是目标,目标框的预测通过如下函数计算:bx=σ(tx)+cx (1)by=σ(ty)+cy (2)![]()
ba=tan‑1(ta)+pa (5)Pr(object)*ArIOU(b,object)=σ(to) (6)其中,[bx,by,bw,bh,ba]为预测的实际目标位置坐标,(cx,cy)为预测特征图的坐标位置,σ为sigmoid函数,ArIOU(b,object)计算先验框和目标框的交集,其计算公式如下:
其中
除了角度参数和B相同,其他坐标参数和A相同,∪和∩是计算两个框并集和交集的布尔运算;S3根据公式(1)~公式(6)推倒计算训练误差,误差采用均方差函数计算得到,并反馈到网络中,对网络中的权重参数进行梯度下降优化,误差计算公式如下所示:
其中,N为所有匹配的先验框的个数,
为特征金字塔的每层误差值,其计算如下:
其中,xij∈{0,1},当先验框中包含目标时为1,反之为0,通过公式(7)进行计算先验框和目标框的ArIOU(b,object)值,当ArIOU(b,object)>thArIOU时认为先验框包含目标,反之不包含;i为先验框的下标数,j为预测目标框的下标数,
由公式(1‑5)计算得到,
为网络预测得到的值;smoothL2代表L2损失计算函数;S5重复步骤S2~步骤S4直至总体误差Lall达到一个较为稳定的值,则停止训练。S6将训练图像按固定的宽高比进行缩放填充到I×I大小输入训练网络中得到预测特征图ZL,根据预测特征图中的每个位置对先验框预测的5个坐标[tx,ty,tw,th,ta],通过公式(1)~公式(5)算相应的实际预测目标框的坐标位置[bx,by,bw,bh,ba]以及置信度σ(to),当σ(to)>tho时,认为该预测框含有目标,反之剔除该预测框,将特征金字塔得到的所有预测目标框的坐标位置进行合并;S7将所有的预测目标框的坐标位置信息进行非极大值抑制处理,此时计算重叠目标框的距离时采用如下公式:
其中,IOU的计算不考虑目标框的角度因素,只考虑宽高以及位置信息,当IOU的值大于0.5时,认为当前两个目标框表示的是同一个物体,因此删除置信度较低的预测框;S8经过步骤S6和步骤S7计算,将剩余的预测目标框进行输出绘制到原始图像中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州长风航空电子有限公司,未经苏州长风航空电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910031679.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种可伸缩性的图像聚类方法
- 下一篇:一种基于图的高光谱遥感图像快速聚类算法