[发明专利]一种基于YOLO的行人检测追踪方法在审
申请号: | 201911012572.0 | 申请日: | 2019-10-23 |
公开(公告)号: | CN110781806A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 王宪保;孙任强;张柯军;胡芳铁;谭振宙;何祖敏 | 申请(专利权)人: | 浙江工业大学;杭州市地铁集团有限责任公司运营分公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 33200 杭州求是专利事务所有限公司 | 代理人: | 邱启旺 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类法 追踪 对象特征 轨迹跟踪 视频采集 视频输入 网络模型 网络判别 信息工程 行人检测 传统的 生成式 图像帧 提示 报警 跟踪 预测 | ||
1.一种基于YOLO的行人检测追踪方法,其特征在于,具体包括以下步骤:
步骤1,网络模型训练:训练YOLO网络模型,训练后的模型包含各识别目标及名字,设置置信度阈值,将置信度大于等于置信度阈值的目标用“person”标记;
步骤2,视频采集:采集摄像头采集的视频,并将视频输入至服务器或超脑智能网络硬盘录像机;
步骤3,视频输入:使用OpenCV中的Video Writer将步骤2的视频输入的每一帧进行保存,保存的图像像素缩放到0~1之间,得到缩放的帧图像;
步骤4,目标行人预测:将步骤3缩放的帧图像输入至所述步骤1的YOLO网络模型中,对帧图像中是否包含行人进行判断,如果包含用边界框标记,否则不做任何处理;
步骤5,行人轨迹跟踪:将步骤4检测包含行人的每一帧图像预测用for循环连接,利用OpenCV的可视化,将每一帧图像行人边界框的中点连接,形成目标行人跟踪轨迹。
步骤6,报警或提示:当采集区域内通过步骤2-5的方法检测到行人时,用声光报警的方式警示行人已进入该区域,并同时提醒工作人员有人进入采集区域。
2.根据权利要求1所述工作方法,其特征在于,步骤1包括如下子步骤:
1.1预训练:YOLO网络结构共有26层,包括24个卷积层和2个全连接层,首先使用ImageNet1000类数据集训练YOLO网络的前20个卷积层、1个平均池化层和1个全连接层,训练前使用OpenCV的ReSize将ImageNet1000类数据集中的训练图片分辨率调整至224×224,得到20个卷积层权重文件。
1.2训练:将步骤1.1得到的前20个卷积层权重文件初始化YOLO模型前20个卷积层的网络参数,再随机初始化4个卷积层和2个全连接层,用PASCAL VOC 20类标记数据集对YOLO模型进行训练,训练前使用OpenCV的ReSize将PASCAL VOC 20类数据集中的训练图片分辨率调整至448×448。
1.3模型参数确认:收集行人图像,并用LabelImg工具制作成标记数据集,用该标记数据集继续训练YOLO模型,当置信度大于等于置信度阈值时,在配置文件Config中将识别类型修改为Classes=[‘person’]。
3.根据权利要求1所述工作方法,其特征在于:所述置信度阈值为0.7。
4.根据权利要求1所述工作方法,其特征在于:步骤4的边界框标记采用如下方法:
(x,y,w,h,Score_confidence) (2)
在目标行人预测时,Score_confidence的值由式(1)确定,其中Pr(Object)表示行人是否真正出现在网格中,若出现则为1,不出现为0。表示预测框和实际框之间面积的重叠比例,pred表示预测框的区域,truth值表示实际框的区域,实际框的区域是数据集中已经标记好的真实值。
YOLO模型实际检测行人时会直接输出式(2)中的五个值,其中坐标(x,y)表示预测的边界框的中心与网格界线的相对值,(w,h)代表预测的边界框的宽度和高度相对于整幅图像的宽、高度的比例,其值在0~1之间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学;杭州市地铁集团有限责任公司运营分公司,未经浙江工业大学;杭州市地铁集团有限责任公司运营分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911012572.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种目标物体检测方法、装置、计算设备和介质
- 下一篇:灾情信息处理方法和装置