[发明专利]基于YOLO的车辆前方障碍物检测方法在审
申请号: | 201811353905.1 | 申请日: | 2018-11-14 |
公开(公告)号: | CN109447033A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 王超 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 刘冰 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 车辆前方 障碍物检测 训练集图像 标注框 置信度 网格 标注 预处理 目标检测算法 获取数据 目标类别 测试集 初始化 候选框 权值和 训练集 障碍物 检测 准确率 测试 图像 输出 分割 预测 | ||
1.基于YOLO的车辆前方障碍物检测方法,其特征在于:所述方法具体过程为:
步骤一、获取数据集,数据集分为训练集和测试集,利用标注框标注训练集图像中每一个目标,得到训练集图像中每一个目标的位置信息与类别信息;
步骤二、初始化卷积神经网络,将标注框标注完的训练集输入卷积神经网络;
步骤三、对训练集图像进行预处理;
步骤四、将预处理后的训练集图像分割成网格;
步骤五、网格选取初始候选框;
每个网格随机生成两个初始候选框;
步骤六、网格进行目标检测,得到目标类别M的类别置信度;
步骤七、根据类别置信度设置卷积神经网络输出,得到最终预测框;
步骤八、将步骤一中标注框标注的训练集图像作为卷积神经网络的输入,步骤七得到的最终预测框的训练集图像作为卷积神经网络的输出,训练卷积神经网络,得到最终权值和训练完的卷积神经网络;
步骤九、利用训练完的卷积神经网络和最终权值对测试集图像进行测试,确定车辆前方障碍物。
2.根据权利要求1所述基于YOLO的车辆前方障碍物检测方法,其特征在于:所述步骤一中获取数据集,数据集分为训练集和测试集,利用标注框标注训练集图像中每一个目标,得到训练集图像中每一个目标的位置信息与类别信息;具体过程为:
步骤一一、从行车纪录仪中截取数据集,数据集中图像分为训练集和测试集;
数据集中图像为驾驶员前方视野路况,图像包括行人、骑自行车的人和汽车三类目标;
步骤一二、利用标注框标注训练集图像中每一个目标,得到训练集图像中每一个目标的位置信息与类别信息;
其中位置信息为标注框中心点坐标和标注框宽、高,类别信息即为目标所属类别,以xml格式存储;
步骤一三、将标注完成的xml格式文件转换为txt格式文件。
3.根据权利要求1或2所述基于YOLO的车辆前方障碍物检测方法,其特征在于:所述步骤二中初始化卷积神经网络;具体过程为:
YOLO检测网络包括24个卷积层和2个全连接层;
其中卷积层用来提取图像特征,全连接层用来预测图像位置和类别概率值;
卷积神经网络参数包括冲量Momentum、权值衰减Decay、最大迭代次数Max batches、学习率Learning rate、学习率变化迭代次数Steps和学习率变化比率Scales。
4.根据权利要求3所述基于YOLO的车辆前方障碍物检测方法,其特征在于:所述步骤三中对训练集图像进行预处理;过程为:
将训练集图像大小调整为448*448;
所述步骤四中将预处理后的训练集图像分割成7*7的网格。
5.根据权利要求4所述基于YOLO的车辆前方障碍物检测方法,其特征在于:所述步骤六中网格进行目标检测,得到目标类别M的类别置信度;具体过程为:
每一个候选框预测5个数据;
5个数据包含归一化后的目标坐标x、y,归一化后的候选框的宽和高w、h,以及网格检测此类别目标的置信度confidence;
置信度计算公式如下;
式中,Pr(object)为候选框是否存在目标,若一个网格中出现了目标,则Pr(object)的值为1;若没有出现目标,则Pr(object)的值为0,即置信度confidence的值也为0;*为乘号;
为候选框与标注框的面积交并比,计算公式如下:
式中,DetectionResult为候选框,GroundTruth为标注框;
训练时,当网格中存在目标,还需要对目标类别M进行预测,用条件概率Pr(classM|object)进行表示,目标类别M的类别置信度计算公式如下:
式中,Pr(classM|object)为在网格中有物体的条件下,物体类别为M的概率;训练时,当物体M落在网格内此值为1,网格内有物体但不是类别M此值为0;
测试时,网络直接输出目标类别M的类别置信度confidence(M)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811353905.1/1.html,转载请声明来源钻瓜专利网。