[发明专利]一种新的基于深度学习的无人机目标检测方法在审
申请号: | 202110899050.8 | 申请日: | 2021-08-04 |
公开(公告)号: | CN115705700A | 公开(公告)日: | 2023-02-17 |
发明(设计)人: | 叶涛;张俊;赵宗扬;秦文阳 | 申请(专利权)人: | 中国矿业大学(北京) |
主分类号: | G06V20/13 | 分类号: | G06V20/13;G06V10/774;G06V10/82;G06N3/0464 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 无人机 目标 检测 方法 | ||
1.一种新的基于深度学习的无人机目标检测算法,具体包括以下步骤:
(1)数据集采集,划分为训练集、验证集与测试集,首先使用图像标注工具对图像进行标注,生成标注文件,其次对标注文件进行处理,划分为训练集、验证集与测试集;
(2)修改目标检测网络YOLOv3-tiny的基础网络,将基础网络的尺寸为3×3、步长为1的卷积层替换为深度可分离卷积层,就是将常规的卷积运算拆分为一个尺寸为3×3、组卷积数为通道数的深度卷积运算加一个尺寸为1×1、步长为1的点卷积运算。其中深度卷积1代表尺寸为3×3,步长为1,组卷积数与通道数为256的深度卷积1_1,深度卷积1_2,深度卷积1_3与两个最大值池化层,深度卷积2代表尺寸为3×3,步长为1,组卷积数与通道数为256的深度卷积2_1,深度卷积2_2,深度卷积2_3与两个最大值池化层,卷积层3与卷积层4分别代表尺寸为1×1,步长为1,通道数为255的标准卷积,这种替换方式的优点是可以在损失一小部分精度的情况下大大减少参数量和计算量,从而使得模型更加轻量化;借鉴注意力机制的思想,在尺寸为3×3,步长为1,组卷积数与通道数为256的深度卷积2_3结尾处插入resolution参数为16的SE模块,目的是提取图像中的有效信息,过滤掉冗余信息从而提升检测精度;将尺寸为3×3,步长为1,组卷积数与通道数为256的深度卷积1_3输出特征图与经过了上采样的SE模块的通道数为128的输出特征图进行融合,有效结合上下文信息,减少信息丢失,从而实现不同特征层之间的特征融合,可以有效提升模型在对于不同尺度目标,尤其是小目标检测时的精度;
(3)使用数据集对改进的YOLOv3-tiny网络进行训练,首先将制作好的数据集放入命名为data的文件夹中,标注图像放入命名为JPEGImages的文件夹,标注文件放入命名为Annotations的文件夹下,其次使用程序生成含标注文件的文件夹,最后在程序文件train.py中修改模型配置文件,训练轮次设置为300轮,运行train.py开始训练,在命名为weights的文件夹中可以看到训练生成的权重文件;
(4)利用改进完成后的YOLOv3-tiny网络对数据集进行检测识别,首先将测试图片放入命名为sample的文件夹中,其次修改程序detect.py,将所使用的的权重文件设置为训练完成后生成的pt格式的权重文件,运行detect.py,运行结束后生成的检测图像保存在命名为output的文件夹下。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学(北京),未经中国矿业大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110899050.8/1.html,转载请声明来源钻瓜专利网。