[发明专利]一种基于通道裁剪的无人机视频小目标检测方法在审
申请号: | 202111567636.0 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114220032A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 贾海涛;邹新雷;周焕来;王云;乔磊崖;陈璐;孙靖哲;王俊 | 申请(专利权)人: | 一拓通信集团股份有限公司 |
主分类号: | G06V20/17 | 分类号: | G06V20/17;G06V20/40;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210000 江苏省南京市江苏省自贸*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通道 裁剪 无人机 视频 目标 检测 方法 | ||
1.一种基于通道裁剪的无人机视频小目标检测方法,其特征在于,包括以下步骤:
步骤1:YOLOv4模型结构改进针对目标尺寸特点,对原模型的检测层进行了改进,保留了负责从52×52和26×26特征图中检测中小目标的YOLOHead1和YOLOHead2模块。移除了负责检测大目标的YOLOHead3模块和其相关的采样卷积过程,但保留了与之对应的13×13特征图;
步骤2:步骤1中模型中小尺度YOLOHead1对应的初始候选框大小为[12,16,19,36,40,28],中尺度YOLOHead2对应的初始候选框大小为[36,75,76,55,72,146];
步骤3:进行模型通道裁剪首先需要对BN层进行稀疏化训练,本方法通过在初始损失函数中引入L1正则化来对BN层的缩放因子γ进行稀疏化训练,每个特征通道对应一个缩放因子γ;
步骤4:该步骤在YOLOv4模型中,通过卷积层和激活函数中间的BN层对每一个输入的mini-batch进行归一化,使网络收敛更快,获得更好的训练效果。YOLOv4模型中BN层的输入和输出之间关系为:
式中:m为每次输入的mini-batch;γ为BN层的缩放因子;β为BN层的偏置项;μ为BN层的均值参数;σ为BN层的方差参数;ε项可避免分母为0。
步骤5:该步骤是该专利的核心内容,在步骤4中对BN层进行稀疏化训练的基础上,对已经稀疏化的缩放因子进行排序,根据剪枝率求得缩放因子的阈值。当缩放因子大于或等于该阈值时,该缩放因子对应的特征通道将被保留。当缩放因子小于该阈值时,该缩放因子对应的特征通道将会被剪掉然后将网络输出的提议框映射成原图大小,框选出原图区域,输入至softmax分类和回归层,得出最后结果。
2.如权利要求1所述方法,其特征在于,步骤1中移除了负责检测大目标的YOLOHead3模块。
3.如权利要求1所述方法,其特征在于,步骤3中的稀疏化训练方法。
4.如权利要求1所述方法,其特征在于,步骤5中的模型通道裁剪方法,对初始聚类中心的选取更加智能化,通常情况下,剪裁后的模型其检测精度会有不同程度的下降。裁剪的通道数越多,参数越少,检测精度下降的就越明显。为了恢复一定的检测精度将裁剪后的模型重新训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于一拓通信集团股份有限公司,未经一拓通信集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111567636.0/1.html,转载请声明来源钻瓜专利网。