[发明专利]红外夜视图像行人检测方法、电子设备及存储介质在审
申请号: | 202110051711.1 | 申请日: | 2021-01-15 |
公开(公告)号: | CN112733754A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 李承政;秦豪;赵明 | 申请(专利权)人: | 上海有个机器人有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 梁秀秀 |
地址: | 200120 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 红外 视图 行人 检测 方法 电子设备 存储 介质 | ||
1.一种红外夜视图像行人检测方法,其特征在于,包括以下步骤:
步骤1,采集预设场景下的行人图像,并对所述预设场景下的行人图像进行预处理,形成训练集;
步骤2,构建行人检测网络模型,所述行人检测网络模型包括Shufflenet-v2算法的骨干网络、特征融合模块以及检测头部;
步骤3,采用所述训练集的图像对所述行人检测网络模型进行训练,优化所述行人检测网络模型的网络参数。
2.根据权利要求1所述的红外夜视图像行人检测方法,其特征在于,在所述行人检测网络模型中,通过Quality Focal Loss(QFL)对所述预设场景下的行人图像的分类或者质量分数约束。
3.根据权利要求1所述的红外夜视图像行人检测方法,其特征在于,在所述行人检测网络模型中,通过Distribution Focal Loss(DFL)对所述预设场景下的行人图像的边界框回归约束。
4.根据权利要求2所述的红外夜视图像行人检测方法,其特征在于,Quality FocalLoss(QFL)的约束函数为:
QFL(x)=-|y-x|β((1-y)log(1-x)+ylog(x));
其中x为经过sigmoid激活的置信度,y为预测目标,当行人图像为负样本时,y值为0;行人图像为正样本时,y值表示样本对应的IoU值。
5.根据权利要求3所述的红外夜视图像行人检测方法,其特征在于,DistributionFocal Loss(DFL)的约束函数为:
DFL(Si,Si+1)=-((yi+1-y)log(Si)+(y-yi)log(Si+1));
其中,Si和Si+1则分别表示预测目标y落在对应预测区间[yi,yi+1]的概率。
6.根据权利要求1所述的红外夜视图像行人检测方法,其特征在于,所述骨干网络包括多个子模块,所述子模块的卷积层采用深度可分离卷积,深度可分离卷积由深度卷积和逐点卷积组成。
7.根据权利要求6所述的红外夜视图像行人检测方法,其特征在于,当输入图片的尺寸为DF×DF×M,卷积核尺寸为DK×DK×M,输出的图片的尺寸为DF×DF×N,利用所述深度可分离卷积对输入的图片进行卷积包括以下步骤:
S101,利用所述深度卷积对M组的特征进行逐通道的卷积操作,得到深度卷积中的参数量为(DK×DK×1)×M;
S102,利用所述逐点卷积转换通道,得到所述逐点卷积的参数量为(1×1×M)×N。
8.根据权利要求7所述的红外夜视图像行人检测方法,其特征在于,所述子模块包括一基础模块以及一下采样模块,所述基础模块的结构按计算单元处理顺序为:
通道分离器,用于将输入图像的特征分离;
第一卷积层采用标准卷积,卷积核大小为1*1;
第二卷积层采用深度可分离卷积,卷积核大小为3*3,所述第一卷积层与所述第二卷积层通过激活函数连接;
第三卷积层为标准卷积,卷积核大小为1*1,所述第二卷积层通过批量归一化后得到所述第三卷积层;
串接器,用于将所述通道分离器分离后的特征通道重新串接在一起;
通道重组器,用于将所述串接器串接的特征通道重组。
9.根据权利要求1所述的红外夜视图像行人检测方法,其特征在于:所述特征融合模块采用两层特征融合的方式,所述检测头部包括多层特征金字塔,多个所述特征金字塔共享两层卷积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海有个机器人有限公司,未经上海有个机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110051711.1/1.html,转载请声明来源钻瓜专利网。