[发明专利]一种基于多角度检测框的遥感图像目标检测方法在审
| 申请号: | 202111007113.0 | 申请日: | 2021-08-30 |
| 公开(公告)号: | CN113850761A | 公开(公告)日: | 2021-12-28 |
| 发明(设计)人: | 王素玉;许凯焱 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 角度 检测 遥感 图像 目标 方法 | ||
本发明公开了一种基于多角度检测框的遥感图像目标检测方法,在faster‑rcnn预测的正框基础上,设计了倾斜角度模块,主要分为两个阶段;第一个阶段通过全连接层和解码器进行初步的角度偏移旋转,第二个阶段使用rotated roi align提取旋转不变特征,再次进行角度偏移修正,得到准确角度的检测框。除此之外,针对遥感图像尺寸大,训练慢的问题,重新设计了倾斜检测模块的回归损失函数,使得损失函数收敛更快,准确率更高。实验结果表明,本发明相较于改进后的faster‑rcnn的准确率提升了4.4%,证明本发明具有良好的检测效果。
技术领域
本发明属于计算机视觉中的目标检测领域,是一种利用卷积神经网络对一张图片进行目标种类的检测和目标位置的标记的方法,相较于目前的遥感目标检测方法,比如ROI-Transfomer、SCRDet、R3Det等,具有更高的准确性,并且可以根据遥感图像的特点进行倾斜方向的检测,本方法在改进后的faster-rcnn的基础上,后接了一个倾斜检测模块以及数据增强,用于遥感图像的多角度回归。
背景技术
近年来,我国航天事业发展迅猛,遥感卫星技术也在不断地进步,卫星每天都要采集大量的图像用于各种用途,这其中搭载的可见光相机的卫星最为常见,可见光遥感图像最为直观,可以很方便的分辨出图像中的目标。但是传统的检测算法需要人工的提取特征,识别的性能不能满足日常的需要,并且受外界影响因素非常的大。但是随着深度学习的不断发展,利用卷积神经网络来自动的提取特性,大大的降低了人工作业的成本,准确率也有了明显的提升。但是目前最先进的检测器的准确率仍然不能完全满足当前的实际需要,此领域仍然存在着准确率不足的问题,亟待解决。
目前,基于卷积神经网络的遥感目标检测方法已经取得了很大的进展,例如基于单阶段网络的R3Det方法、PIOU方法、DRN等,基于双阶段网络的R2CNN方法、RRPN方法、ROI-Transfomer方法、SCRDet方法等。尽管上述方法相较于传统的的方法已经有了不可比拟的优势,在主流的数据集DOTA、HRSC2016上实现了相当高的精确度,但是仍然存在着准确率不足的问题,仍然存在比较大的提升空间。
发明内容
本发明针对上述算法的准确率不足的问题,设计了一种基于多角度遥感图像目标检测算法,相较于上述的算法有了不同程度的提升。
本发明采用如下技术方案:一种基于多角度遥感图像目标检测算法。目标检测的具体流程为:首先对图片进行预处理和数据增强,然后送入到本发明的提出的卷积神经网络中,经过主干网络,提取到图片的特征,然后将特征送入到RPN网络生成特定数量的proposal,之后需要对这些proposal进行roi align输出固定7×7尺寸的特征图,再进入到全连接层输出正框,之后将输出的正框经过一个全连接层和解码器进行角度的偏移回归,最后通过一个rotated roi align进行角度修正,得到最终的检测结果。
(1)数据预处理:本发明使用DOTA公开数据集。为了方便训练和预测,对输入网络图像的宽和高进行了限制,训练和预测时输入网络的图像尺寸均为1024×1024,在训练和预测时如果原始尺寸大于1024×1024,则会将图片根据步长512的滑动窗口来分割成若干张1024×1024尺寸的图片;如果原始尺寸小于1024×1024,则会用黑色背景补齐,这样可以在不丢失边界信息的情况下,对数据的尺寸进行预处理。
(2)数据增强:针对遥感图像小目标物体众多的问题,设计了一种数据增强策略,训练时每次迭代会计算面积小于32×32的框的回归损失占整张图片总的回归损失的比,如果小于0.4,则认为此次迭代小目标的损失对总的回归损失贡献率不够,则下次迭代随机选取训练集四张图片,每张图片的长宽缩短为原来的1/2,四张拼接为一张新的图片,并且修改相应的ground truth的坐标,送入网络训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111007113.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车网络安全需求的添加筛选方法
- 下一篇:一种实时结算支付方法及系统





