[发明专利]多尺度注意力融合的Faster RCNN的海洋生物检测方法及结构在审
申请号: | 202310236356.4 | 申请日: | 2023-03-13 |
公开(公告)号: | CN116524174A | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 陈小毛;张健;王立成;赵金润 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/77;G06V10/80;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 541004 广*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 尺度 注意力 融合 faster rcnn 海洋生物 检测 方法 结构 | ||
本发明提供一种多尺度注意力融合的FasterRCNN的海洋生物检测方法,包括:1)采用MSRCR图像增强算法对输入图像进行增强处理;2)采用MSAFPN网络提取增强处理后的图像的特征,得到多尺度特征图;3)将所述多尺度特征图输入RPN网络,获得候选框;4)将所述候选框映射到所述多尺度特征图上并进行截取,并将截取的所述特征图固定为统一的大小,再将所述特征图展平为一维向量,并通过全连接层进行目标分类与边框回归,从而实现精确定位检测。本发明采用图像增强算法提升海洋生物图像质量,并通过MSAFPN中的多尺度融合以及注意力模块获得目标更精确的特征信息,在检测目标时,能够检测到更多的海洋生物,有效提高目标检测的准确率。
技术领域
本发明属于目标检测领域,特别是涉及一种多尺度注意力融合的Faster RCNN的海洋生物检测方法及结构。
背景技术
海洋的地域广阔,其中蕴含着大量的生物资源,海洋生物具有易于消化的蛋白质和氨基酸,海洋中海参、扇贝等生物蛋白质含量丰富,富含人体所必需的9种氨基酸并且易于被人体吸收。由于海洋生物具有很高的营养价值,因此人类对此有了很高的需求,为了能够充分的利用这些海洋资源,需要水下机器人来代替人类进行水下作业捕捞。
水下机器人主要的作用是通过目标检测算法获得周围海洋生物目标的种类与位置信息,并且将其成功的捕捞。准确的海洋生物目标检测可以有效提高水下机器人在水下作业的效率,目标检测算法的好坏能够直接影响捕捞的效率。传统的目标检测方法预先设计目标物体的特征,这些特征采用常用的特征描述符,能够准确的检测到简单的目标。由于海洋生物的多样性和水下环境的特殊性,导致传统的目标检测的泛化性与鲁棒性较差。近些年,深度学习在图像识别、目标检测等领域取得了优异的成绩。卷积神经网络具有强大的特征提取能力,可以有效提取到目标物体的特征,基于深度学习的目标检测网络的检测精度以及速度有很大的提升。
Faster R-CNN作为深度卷积神经网络的代表,首先通过特征提取网络提取目标特征生成特征图,其次将特征图作为区域建议网络(Region Proposal Network,RPN)的输入,先通过滑动窗口在特征图进行滑动,分别进行1*1卷积获得区域得分和边框回归参数,通过非极大值抑制获得最终的候选框。候选框在特征图进行映射并进行ROI池化操作将不同大小的特征图固定为7×7,将该特征图变为一维向量后使用全连接层进行后续的目标分类与边框回归。但是目前主流的目标检测网络如Faster R-CNN对常见的较大目标检测效果较好,对小目标检测效果较差。由于水下环境的特殊性,海洋生物的图像存在对比度低、噪声大、颜色呈蓝绿色等问题,并且海洋生物大多数为小型目标,导致检测的准确率较低,从而影响捕捞效率,因此无法直接对海洋生物目标进行检测。针对以上问题,本发明提出多尺度注意力融合Faster RCNN的海洋生物检测方法及结构。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种多尺度注意力融合的Faster RCNN的海洋生物检测方法及结构,用于解决现有技术中检测网络对小型海洋生物检测图像质量差,检测准确率低导致捕捞效率低的问题。
为实现上述目的及其他相关目的,本发明提供一种多尺度注意力融合的FasterRCNN的海洋生物检测方法,所述检测方法至少包括:
1)采用MSRCR图像增强算法对输入图像进行增强处理;
2)采用MSAFPN网络提取增强处理后的图像的特征,得到多尺度特征图;
3)将所述多尺度特征图输入RPN网络,获得候选框;
4)将所述候选框映射到所述多尺度特征图上并进行截取,并将截取的所述特征图固定为统一的大小,再将所述特征图展平为一维向量,并通过全连接层进行目标分类与边框回归,从而实现精确定位检测。
优选地,步骤1)中,所述MSRCR图像增强算法是Retinex发展而来,Retinex的本质是将一幅图像分为反射图像和亮度图像,如下式(1)所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310236356.4/2.html,转载请声明来源钻瓜专利网。