[发明专利]一种基于ACSP的轻量级注意力机制行人检测算法在审
| 申请号: | 202210613166.5 | 申请日: | 2022-06-01 |
| 公开(公告)号: | CN114973137A | 公开(公告)日: | 2022-08-30 |
| 发明(设计)人: | 侯阿临;任子航;孙弘建 | 申请(专利权)人: | 长春工业大学 |
| 主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/40;G06V10/774;G06V10/80;G06V10/82;G06N3/04 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 130012 吉林*** | 国省代码: | 吉林;22 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 acsp 轻量级 注意力 机制 行人 检测 算法 | ||
1.一种基于ACSP的轻量级注意力机制行人检测算法,其特征在于,包括以下步骤:
Step1:数据预处理,将行人数据集根据需求调整为网络可训练的大小;
Step2:输入需要进行处理的行人图像,通过构建引入ECA轻量级通道注意力模块的ResNet-101模型,进行特征提取及特征融合;
Step3:行人预测,分别对行人中心点、尺度和偏移量进行预测;
Step4:预测框后处理,行人预测结果经过DIoU-NMS处理,保留遮挡行人的预测框,去除同一个行人的冗余预测框,最终得到网络的整个预测结果。
2.根据权利要求1所述的一种基于ACSP的轻量级注意力机制行人检测算法,其特征在于,所述Step 1中的具体过程如下:
Step1.1将输入图片尺寸调整为768×1536,Batch size设置为4。
3.根据权利要求1所述的一种基于ACSP的轻量级注意力机制行人检测算法,其特征在于,所述Step 2中的具体过程如下:
Step2.1构建引入了ECA轻量级通道注意力模块的ResNet-101模型,即在ResNet的每个残差块中都引入一个ECA模块;
Step2.2输入需要进行处理的行人图像后,主干网络通过卷积操作生成不同分辨率的特征图,定义如下:
其中,表示第i层输出的特征图,这些特征图由fi对第i-1层特征图进行卷积、池化、正则化等处理。为一个N层网络输出的所有特征图,些特征图中所包含目标的位置或语义信息都可以被预测部分所利用;
Step2.3 ResNet作为主干网络提取特征图按照尺寸不同划分为四个特征层,每个特征层的尺寸依次为原图像的1/4、1/16、1/64、1/256,而每层特征层由前一特征层通过下采样操作得到;
Step2.4在特征融合部分,深层特征层通过反卷积操作让特征尺寸适应浅层特征层的特征尺寸,然后按照特征金字塔策略(FPN)使用Concat操作进行特征融合。
4.根据权利要求1所述的一种基于ACSP的轻量级注意力机制行人检测算法,其特征在于,所述Step 3中的具体过程如下:
Step3.1将处理后的行人数据通过两个1×1卷积核和一个2×2卷积核,分别对行人中心点、度和偏移量进行预测。
5.根据权利要求1所述的一种基于ACSP的轻量级注意力机制行人检测算法,其特征在于,所述Step 4中的具体过程如下:
Step4.1在IoU的基础上,引入一个惩罚项,即DIoU:
其中,ρ表示计算两个预测框中心点间的欧氏距离,c表示能够同时覆盖两个预测框的最小矩形的对角线距离,B_1、B_2分别表示预测框1和预测框2的面积;
Step4.2使用DIoU-NMS对行人预测结果进行处理。对于当前正在进行处理的预测框,DIoU-NMS的预测得分更新公式如下式所示:
其中,si为当前处理的预测框得分,M为分数最高的预测框,Bi为当前进行处理的第i个预测框,ε为阈值,在目标检测进行计算IoU时,该阈值通常设定为0.4;
Step4.3当ρ2和c2的比值较小时,对IoU的值基本不会产生影响,两个预测框IoU的值依然很大,此时依然会存在两个预测框预测的是同一个行人的可能性;减去惩罚项后,IoU的值大于或等于阈值ε,此时被处理的预测框得分置0,以此来达到抑制重复预测框的效果;当ρ2和c2的比值较大时,IoU的值变化会很明显,此时两个预测框预测的很有可能是两个不同的行人,减去惩罚项后IoU小于阈值ε,当前预测框保留预测得分,以此保留更多的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春工业大学,未经长春工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210613166.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种拼接显示面板
- 下一篇:一种基于轻量级UNet++网络的脑肿瘤分割算法





