[发明专利]一种基于改进YOLOv3模型的行人检测方法及系统在审
申请号: | 202110453896.9 | 申请日: | 2021-04-26 |
公开(公告)号: | CN113205028A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 钱惠敏;陈纬;陈啸 | 申请(专利权)人: | 河海大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F16/951;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 何春廷 |
地址: | 211100 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 yolov3 模型 行人 检测 方法 系统 | ||
本发明公开了一种基于改进YOLOv3模型的行人检测方法及系统,包括:获取自动驾驶场景下实时采集的监控场景视频,从视频中提取图像帧;将图像帧输入到预先训练好的改进YOLOv3模型,利用改进YOLOv3模型对图像帧中是否包含行人进行判断,若是则用边界框标记,若否则不做任何处理。优点:本发明能够提高对遮挡目标的识别能力,有效提高行人检测精度,对小目标和遮挡目标误检率更低,并且速度更快,具有一定的实际应用价值,并且具有良好的泛化性能。
技术领域
本发明涉及一种基于改进YOLOv3模型的行人检测方法及系统,属于计算机视觉技术领域。
背景技术
近年来,基于深度卷积神经网络的计算机视觉技术已取得了举世瞩目的成就,这些成就推动了无人驾驶、监控视频、互联网的视频检索处理、人机交互、虚拟现实、医疗保健、智能安防等技术的发展。行人检测是自动驾驶技术中的一项重要研究内容,也是计算机视觉领域的研究热点之一。
随着深度神经网络,特别是卷积神经网络在目标检测任务中的发展,以及大规模行人检测公共数据集的出现,基于深度神经网络的行人检测算法已在实际问题中得到应用,但仍然存在小尺寸行人目标和被遮挡行人目标被误检、漏检或重复检测的问题。
此外在自动驾驶应用场景下,行人目标检测算法应当同时具备实时性和准确性。R-CNN、Faster R-CNN等二阶段方法由于实时性难以得到保证而较难实现应用,而YOLOv2、YOLOv3等一阶段算法在经过不断地改进后,在检测的实时性方面性能十分突出,但需要较大的GPU显存,资源消耗量大,在部署方面存在一定的困难。
发明内容
本发明所要解决的技术问题是克服现有技术的缺陷,提供一种基于改进YOLOv3模型的行人检测方法及系统。
为解决上述技术问题,本发明提供一种基于改进YOLOv3模型的行人检测方法,包括:
获取自动驾驶场景下实时采集的监控场景视频,从视频中提取图像帧;
将图像帧输入到预先训练好的改进YOLOv3模型,利用改进YOLOv3模型对图像帧中是否包含行人进行判断,若是用边界框标记,若否则不做任何处理;
所述改进YOLOv3模型的改进包括:
在YOLOv3模型的ResNet34的网络结构的卷积块的近道连接上依次添加平均池化层和卷积层,得到ResNet34-D,并作为改进YOLOv3模型的的主干网络;
在YOLOv3模型的多特征融合网络中增加空间金字塔池化层,用于提取不同感受野的特征并进行融合;
在YOLOv3的多特征融合网络的输出层增加DropBlock模块,用于随机删除一部分输出层中固定大小的整片区域神经单元,利用保留下来的神经元集中学习剩余部分的特征表示;
利用DIoU损失函数代替YOLOv3模型中原先边框位置损失函数。
进一步的,所述改进YOLOv3模型的训练过程包括:
使用从网络中下载的ImageNet数据集训练ResNet34_D网络,得到ResNet34_D网络的权重文件;
利用所述ResNet34_D网络的权重文件初始化改进Y0L0v3模型的主干网络的网络参数;
获取自动驾驶场景下的历史行人图像,根据历史行人图像构建初始数据集,对初始数据集中的图像进行标注,得到行人数据集,按随机方式从行人数据集中选择训练集和验证集;
根据训练集和所述DIoU损失函数,利用梯度下降反向传播方法,对初始化网络参数后的改进YOLOv3模型中的深度卷积神经网络的参数进行迭代更新;将迭代至最大设定次数后得到的网络参数作为最优的网络参数,完成训练,得到初步的改进YOLOv3模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110453896.9/2.html,转载请声明来源钻瓜专利网。