[发明专利]一种面向多尺度、多朝向的航拍物体检测方法及系统有效
申请号: | 202110253427.2 | 申请日: | 2021-03-05 |
公开(公告)号: | CN112926480B | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 刘春生;陈路昌;常发亮;李爽 | 申请(专利权)人: | 山东大学 |
主分类号: | G06V20/17 | 分类号: | G06V20/17;G06V10/25;G06V10/44;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 尺度 朝向 航拍 物体 检测 方法 系统 | ||
1.一种面向多尺度、多朝向的航拍物体检测方法,其特征是:包括以下步骤:
构建检测网络,所述检测网络包括级联注意力网络、特征融合网络和目标检测框,其中,特征融合网络使用自适应特征拼接网络在检测网络提取感兴趣区域时自适应地融合来自特征金字塔不同层的输出特征;
所述级联注意力网络包括分块自注意力模型,分块自注意力模型用于将原始输入特征图分成四块,每一块特征图中的每一个像素都会学习和其他像素之间的关系,从而捕获图像的局部几何特征,四块特征图通过一个跳连接结构与精炼前的特征图相加并,然后拼接到一起;
所述级联注意力网络还包括有监督的空间注意力模型,用于以物体的掩膜作为监督信息学习一个权重图,权重图中包含物体的部分权值接近于1,不包含物体的背景部分权值接近于0,将权重图和精炼后的特征图相乘以突出前景,抑制背景;
获取航拍图像,初始配置检测网络的参数,通过特征提取层以及特征金字塔;
利用级联注意力网络抑制输出特征中的背景噪声,并输出物体候选区域;
根据候选区域,在不同的特征金字塔输出层上提取特征,根据不同的权重将这些特征进行拼接;
其中,在不同的特征金字塔输出层上提取特征的具体过程包括:从特征金字塔层输出的四个层级的特征图以及一个全局特征图上提取特征,之后经过RoI-Align操作,获得五个大小一致的特征,再将它们拼接到一起,进行卷积,得到最终特征图,该特征图包含五个特征的相应权重信息,权重信息分别与输入特征相乘,得到包含各个尺度特征的特征图,由不同占比的四个尺度特征以及一个包含全局语义信息的语义特征构成拼接特征;
使用有向目标检测框多定义与选择策略优化目标检测框的回归过程,并输出所属的类别;
其中,使用有向目标检测框多定义与选择策略优化目标检测框的回归过程的具体过程包括:将水平检测框添加一个角度信息形成一个有向框来表示,对于每个真实的有向框OBB1,交换它的宽和高,然后顺时针旋转90°获得OBB2,逆时针旋转90°获得OBB3,分别计算这三个有向框与预测框之间的损失值,选择损失值最小的一个作为最后的真实框;
根据网络的前向输出结果与真实值之间的差值,进行迭代训练,更新网络参数,使用更新后的检测网络对输入的航拍图像进行处理,得到物体检测结果。
2.如权利要求1所述的一种面向多尺度、多朝向的航拍物体检测方法,其特征是:所述权重图与掩膜之间的损失作为损失函数的一部分,参与反向传播,且最终获得的特征图通过跳连接与原始输入的不同层级的特征图相加,完成特征的背景噪声抑制过程。
3.如权利要求1所述的一种面向多尺度、多朝向的航拍物体检测方法,其特征是:进行迭代训练时,损失函数包括分类损失、位置损失以及级联注意力网络中的掩膜分割损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110253427.2/1.html,转载请声明来源钻瓜专利网。