[发明专利]基于CSP模型的多级特征融合行人检测方法在审
申请号: | 202110295911.1 | 申请日: | 2021-03-19 |
公开(公告)号: | CN113033371A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 宦若虹;谢超杰 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 csp 模型 多级 特征 融合 行人 检测 方法 | ||
1.一种基于CSP模型的多级特征融合行人检测方法,其特征在于,所述方法包括以下步骤:
步骤1,采用CSP架构,使用CNN提取行人特征,然后网络分为3支分别预测目标中心点、目标高度和中心点偏移量,在训练阶段,对训练图像进行预处理后输入网络,所述预处理包括将图像尺寸调整到设定像素,对图像进行随机剪裁并调整亮度,使用PyconvResNet-101作为特征提取网络来提取行人特征,取PyconvResNet-101网络阶段二、阶段三、阶段四和阶段五得到的4张特征图进行多级融合得到最终特征图,最终特征图的通道数为1024,使用随机擦除数据增强对训练数据进行扩充,对目标中心点、目标高度和中心点偏移量使用FocalLoss和Smooth L1进行训练;
步骤2,将获得的最终特征图送入后续预测网络,预测网络首先使用一个3*3的卷积将最终特征图的通道数调整为2n,n为正整数,3≤n≤9,然后使用两个1*1的卷积和一个2*2的卷积分别对目标中心点、目标高度和中心点偏移量进行预测并生成目标检测框,使用非极大值抑制算法去除冗余的检测框得到最终的检测结果;
步骤3,在测试阶段,将测试图像调整成特定尺寸后输入网络,将得到的特征图进行多级融合后送入预测网络,预测网络输出目标的中心点、目标的高度和目标中心点的偏移量,目标宽度由目标高度乘系数得到。
2.如权利要求1所述的一种基于CSP模型的多级特征融合行人检测方法,其特征在于:所述步骤1的过程为:使用PyconvResNet-101网络中阶段二、阶段三、阶段四和阶段五的最后一张特征图p2,p3,p4和p5进行多级融合,其中p2,p3,p4和p5分别为输入图像的宽高分别下采样4倍、8倍、16倍和32倍所得,多级融合的步骤为:
1.1)使用卷积核尺寸为4*4,步长为2,留白为1的反卷积将p5上采样2倍后与p4在通道方向上进行拼接得到p4_l1;使用卷积核尺寸为4*4,步长为2,留白为1的反卷积将p4上采样2倍后与p3在通道方向上进行拼接得到p3_l1;使用卷积核尺寸为4*4,步长为2,留白为1的反卷积将p3上采样2倍后与p2在通道方向上进行拼接得到p2_l1;
1.2)使用卷积核尺寸为4*4,步长为2,留白为1的反卷积将1.1)中所得特征图p4_l1上采样2倍后与1.1)中所得特征图p3_l1在通道方向上进行拼接得到p3_l2;使用卷积核尺寸为4*4,步长为2,留白为1的反卷积将p3_l1上采样2倍后与(1)中所得特征图p2_l1在通道方向上进行拼接得到p2_l2;
1.3),使用卷积核尺寸为4*4,步长为2,留白为1的反卷积将1.2)中所得特征图p3_l2上采样2倍后与1.2)中所得特征图p2_l2在通道方向上进行拼接得到最终特征图pout送入后续预测网络。
3.如权利要求1所述的一种基于CSP模型的多级特征融合行人检测方法,其特征在于:所述步骤3中,所述系数为0.41。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110295911.1/1.html,转载请声明来源钻瓜专利网。