[发明专利]一种基于深度学习的无人驾驶汽车障碍物识别检测方法在审
申请号: | 201810240723.7 | 申请日: | 2018-03-22 |
公开(公告)号: | CN108399398A | 公开(公告)日: | 2018-08-14 |
发明(设计)人: | 李吉成;杨红心;朱波;廖载霖 | 申请(专利权)人: | 武汉云衡智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 武汉宇晨专利事务所 42001 | 代理人: | 李鹏;王敏锋 |
地址: | 430074 湖北省武汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习的无人驾驶汽车障碍物识别检测方法,首先对传感器输出的图像进行预处理,将预处理后的图像送入卷积层进行处理,解析通过卷积层处理后的图像,获取目标类别、目标概率以及目标坐标,将目标类别和目标概率相乘计算出每个目标的各个类别对应的概率向量,根据概率向量中的元素与设定阈值的进行比较,根据比较结果获得目标对应的类别,以及获得目标对应的坐标。本发明通过深度卷积神经网络对图像特征进行提取分析,对图像中的目标进行深度学习,从而有效的识别检测出障碍物,使汽车更好的感知外界环境,提高汽车的安全性。 | ||
搜索关键词: | 图像 预处理 无人驾驶汽车 障碍物识别 概率向量 目标概率 卷积 检测 相乘 卷积神经网络 获取目标 目标类别 目标坐标 图像特征 外界环境 障碍物 传感器 学习 感知 解析 汽车 送入 输出 分析 | ||
【主权项】:
1.一种基于深度学习的无人驾驶汽车障碍物识别检测方法,其特征在于,包括以下步骤:步骤1、预处理步骤,对摄像头传感器采集的图像进行预处理,并将预处理之后的图像缩放成416×416的像素大小;步骤2、进入第一卷积层处理,具体为:步骤2.1、经过步骤1处理后的图像进入第一卷积层进行处理,第一卷积层的卷积核大小为3×3,卷积滑动窗口步长为1,卷积后的输出特征数为32,输出图像的维度为416×416×32;步骤2.2、经过步骤2.1处理后的图像进入了第一池化层,第一池化层采用最大值池化方法,池化窗口大小为2×2,池化滑动窗口步长为2,故池化后输出的图像维度为208×208×32;步骤3、进入第二卷积层处理,具体为:步骤3.1、经过步骤2.2处理后的图像进入第二卷积层进行处理,第二卷积层的卷积核大小为3×3,卷积滑动窗口步长为1,卷积后的输出特征数为64,输出图像的维度为208×208×64;步骤3.2、经过步骤3.1处理后的图像进入了第二池化层,第二池化层采用最大值池化方法,池化窗口大小为2×2,池化滑动窗口步长为2,故池化后输出的图像维度为104×104×64;步骤4、进入第三卷积层和第四卷积层处理,具体为:步骤4.1、经过步骤3.2处理后的图像进入了第三卷积层进行处理,第三卷积层的卷积核大小为3×3,卷积滑动窗口步长为1,卷积后的输出特征数为64,输出图像的维度为104×104×64;步骤4.2、经过步骤4.1处理后的图像进入了第四卷积层进行处理,第四卷积层的卷积核大小为1×1,卷积滑动窗口步长为1,卷积后的输出特征数为128,输出图像的维度为104×104×128;步骤4.3、经过步骤4.2处理后的图像进入了第三池化层进行处理,第三池化层采用最大值池化方法进行处理,池化窗口大小为2×2,池化滑动窗口步长为2,故池化后输出的图像维度为52×52×128;步骤5、进入第五卷积层至第八卷积层处理,具体为:步骤5.1、经过步骤4.3处理后的图像进入了第五卷积层进行处理,第五卷积层的卷积核大小为3×3,卷积滑动窗口步长为1,卷积后的输出特征数为128,输出图像的维度为52×52×128;步骤5.2、经过步骤5.1处理后的图像进入了第六卷积层进行处理,第六卷积层的卷积核大小为1×1,卷积滑动窗口步长为1,卷积后的输出特征数为256,输出图像的维度为52×52×256;步骤5.3、经过步骤5.2处理后的图像进入了第七卷积层进行处理,第七卷积层的卷积核大小为3×3,卷积滑动窗口步长为1,卷积后的输出特征数为128,输出图像的维度为52×52×128;步骤5.4、经过步骤5.3处理后的图像进入了第八卷积层进行处理,第八卷积层的卷积核大小为1×1,卷积滑动窗口步长为1,卷积后的输出特征数为256,输出图像的维度为52×52×256;步骤5.5、经过步骤5.4处理后的图像进入了第四池化层进行处理,第四池化层采用最大值池化方法进行处理,池化窗口大小为2×2,池化滑动窗口步长为2,故池化后输出的图像维度为26×26×256;步骤6、进入第九卷积层至第十二卷积层处理,具体为:步骤6.1、经过步骤5.5处理后的图像进入第九卷积层进行处理,第九卷积层的卷积核大小为3×3,卷积滑动窗口步长为1,卷积后的输出特征数为256,输出图像的维度为26×26×256;步骤6.2、经过步骤6.1处理后的图像进入第十卷积层进行处理,第十卷积层的卷积核大小为1×1,卷积滑动窗口步长为1,卷积后的输出特征数为512,输出图像的维度为26×26×512;步骤6.3、经过步骤6.2处理后的图像进入第十一卷积层进行处理,第十一卷积层的卷积核大小为3×3,卷积滑动窗口步长为1,卷积后的输出特征数为256,输出图像的维度为26×26×256;步骤6.4、经过步骤6.3处理后的图像进入第十二卷积层进行处理,第十二卷积层的卷积核大小为1×1,卷积滑动窗口步长为1,卷积后的输出特征数为512,输出图像的维度为26×26×512;步骤6.5、经过步骤6.4处理后的图像进入了第五池化层进行处理,第五池化层采用最大值池化方法进行处理,池化窗口大小为2×2,池化滑动窗口步长为2,故池化后输出的图像维度为13×13×512;步骤7、进入第十三卷积层至第十八卷积层进行处理,具体为:步骤7.1、经过步骤6.5处理后的图像进入第十三卷积层进行处理,第十三卷积层的卷积核大小为3×3,卷积滑动窗口步长为1,卷积后的输出特征数为512,输出图像的维度为13×13×512;步骤7.2、经过步骤7.1处理后的图像进入第十四卷积层进行处理,第十四卷积层的卷积核大小为1×1,卷积滑动窗口步长为1,卷积后的输出特征数为1024,输出图像的维度为13×13×1024;步骤7.3、经过步骤7.2处理后的图像进入第十五卷积层进行处理,第十五卷积层的卷积核大小为3×3,卷积滑动窗口步长为1,卷积后的输出特征数为512,输出图像的维度为13×13×512;步骤7.4、经过步骤7.3处理后的图像进入第十六卷积层进行处理,第十六卷积层的卷积核大小为1×1,卷积滑动窗口步长为1,卷积后的输出特征数为1024,输出图像的维度为13×13×1024;步骤7.5、经过步骤7.4处理后的图像进入第十七卷积层进行处理,第十七卷积层的卷积核大小为3×3,卷积滑动窗口步长为1,卷积后的输出特征数为512,输出图像的维度为13×13×512;步骤7.6、经过步骤7.5处理后的图像进入第十八卷积层进行处理,第十八卷积层的卷积核大小为1×1,卷积滑动窗口步长为1,卷积后的输出特征数为1024,输出图像的维度为13×13×1024;步骤8、进入第十九卷积层至第二十一卷积层进行处理,具体为:步骤8.1、经过步骤7.6处理后的图像进入第十九卷积层进行处理,第十九卷积层的卷积核大小为3×3,卷积滑动窗口步长为1,卷积后的输出特征数为1024,输出图像的维度为13×13×1024;步骤8.2、经过步骤8.1处理后的图像进入第二十卷积层进行处理,第二十卷积层的卷积核大小为1×1,卷积滑动窗口步长为1,卷积后的输出特征数为1024,输出图像的维度为13×13×1024;步骤8.3、经过步骤8.2处理后的图像进入第二十一卷积层进行处理,第二十一卷积层的卷积核大小为3×3,卷积滑动窗口步长为1,卷积后的输出特征数为1024,输出图像的维度为13×13×1024;步骤9、进入输出卷积层进行处理,经过步骤8.3处理后的图像进入输出卷积层进行处理,输出卷积层的卷积核大小为1×1,卷积滑动窗口步长为1,卷积后的输出特征数为60,输出图像的维度为13×13×60,即13×13×(5×(7+1+4)),其中,13×13为单元的维度,5为每个单元预测的候选窗口的维度,7为识别的目标类别维度,目标类别包括行人、自行车、摩托车、电动车、汽车、猫和狗,1为目标的概率维度,4为目标的坐标维度,步骤10、步骤9输出的图像的维度为13×13×5×12,解析步骤9输出的图像中的目标类别、目标概率、以及目标坐标,将目标类别和目标概率相乘计算出每个目标的各个类别对应的概率向量,将概率向量中的元素与设定阈值的进行比较,根据比较结果获得目标对应的类别,以及获得目标对应的坐标。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉云衡智能科技有限公司,未经武汉云衡智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810240723.7/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序