[发明专利]红外夜视图像行人检测方法、电子设备及存储介质在审
申请号: | 202110051711.1 | 申请日: | 2021-01-15 |
公开(公告)号: | CN112733754A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 李承政;秦豪;赵明 | 申请(专利权)人: | 上海有个机器人有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 梁秀秀 |
地址: | 200120 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 红外 视图 行人 检测 方法 电子设备 存储 介质 | ||
本申请是关于一种红外夜视图像行人检测方法、电子设备及存储介质,通过行人检测模型中采用Quality Focal Loss对所述预设场景下的行人图像的分类或者质量分数约束和通过Distribution Focal Loss对所述预设场景下的行人图像的边界框回归约束,提升整体效果,同时骨干网络选用Shufflenet‑v2作为特征提取器,且利用通道重组的方式防止特征信息不流通的问题,使得红外夜视图像行人检测方法的模型参数及推理速度上大幅度提升,解决了现有的检测结构复杂,速度慢,效率低的问题。
技术领域
本申请涉及人工智能技术领域,尤其涉及红外夜视图像行人检测方法、电子设备及存储介质。
背景技术
机器人在正常行驶过程中,往往需要对周围环境进行一定的理解,例如对采集到的图像进行行人检测、道路分割等感知操作,这样可以对机器人的正常行驶产生辅助作用,如检测到行人时进行有效避障、躲避不可行驶区域等,同时可以基于行人信息,额外增加一些人机交互功能,如语音提示等功能。在白天时,这些环境感知操作可以直接通过对前置摄像头采集到的彩色图像分析得到,然而在暗光或是黑夜场景下,一般的摄像头通常不能获取到可用的有效数据,这时候就需要利用夜视摄像头,通过红外补光操作捕捉黑夜中的图像,进而利用训练好的模型预测。而一般的基于卷积神经网络的检测模型都过于复杂,在机器人等类似移动边缘设备上运行时很难满足实际场景中的实时性需求,因此需要设计出快速高效且性能相当的检测模型。
发明内容
为克服相关技术中存在的问题,本申请提供一种红外夜视图像行人检测方法、电子设备及存储介质,旨在提供一种快速高效的红外夜视图像行人检测方法,轻量化的红外夜视图像行人检测模块,以此解决原始的检测结构复杂,速度慢,效率低的问题。
本申请解决上述技术问题的技术方案如下:一种红外夜视图像行人检测方法,其包括以下步骤:步骤1,采集预设场景下的行人图像,并对所述预设场景下的行人图像进行预处理,形成训练集;步骤2,构建行人检测网络模型,所述行人检测网络模型包括Shufflenet-v2算法的骨干网络、特征融合模块以及检测头部;步骤3,采用所述训练集的图像对所述行人检测网络模型进行训练,优化所述行人检测网络模型的网络参数。
优选的,在所述行人检测网络模型中,通过Quality Focal Loss(QFL)对所述预设场景下的行人图像的分类或者质量分数约束。
优选的,在所述行人检测网络模型中,通过Distribution Focal Loss(DFL)对所述预设场景下的行人图像的边界框回归约束。。
优选的,Quality Focal Loss(QFL)的约束函数为:
QFL(x)=-|y-x|β((1-y)log(1-x)+ylog(x));其中x为经过sigmoid激活的置信度,y为预测目标,当行人图像为负样本时,y值为0;行人图像为正样本时,y值表示样本对应的IoU值。
优选的,Distribution Focal Loss(DFL)的约束函数为:
DFL(Si,Si+1)=-((yi+1-y)log(Si)+(y-yi)log(Si+1));其中,Si和Si+1则分别表示预测目标y落在对应预测区间[yi,yi+1]的概率。
优选的,所述骨干网络包括多个子模块,所述子模块的卷积层采用深度可分离卷积,深度可分离卷积由深度卷积和逐点卷积组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海有个机器人有限公司,未经上海有个机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110051711.1/2.html,转载请声明来源钻瓜专利网。