[发明专利]一种基于卷积神经网络的车辆前方可通行性分析方法有效

专利信息
申请号: 201310234126.0 申请日: 2013-06-09
公开(公告)号: CN103279759A 公开(公告)日: 2013-09-04
发明(设计)人: 李琳辉;连静;王蒙蒙;丁新立;宗云鹏;化玉伟;王宏旭;常静 申请(专利权)人: 大连理工大学
主分类号: G06K9/60 分类号: G06K9/60
代理公司: 大连东方专利代理有限责任公司 21212 代理人: 李洪福
地址: 116024 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于卷积神经网络的车辆前方可通行性分析方法,包括以下步骤:首先通过安装在车辆前方的摄像机采集大量真实的车辆行驶环境图像;利用Gamma矫正函数对图像进行预处理;进行卷积神经网络的训练。本发明采用非线性函数叠加的Gamma矫正方法预处理图像,避免了强烈变化的光照对目标识别的影响,提高了图像分辨率。本发明采用了几何归一化方法,降低了识别目标距离摄像机远近所造成的分辨率差异。本发明采用的卷积神经网络LeNet-5能够提取具有类别分辨能力的隐式特征,提取过程简单;LeNet-5结合局域感受野、权值共享和次抽样,确保对简单几何变形的鲁棒性,且减少了网络的训练参数,简化了网络结构。
搜索关键词: 一种 基于 卷积 神经网络 车辆 方可 通行 分析 方法
【主权项】:
一种基于卷积神经网络的车辆前方可通行性分析方法,其特征在于:包括以下步骤:A、图像采集首先通过安装在车辆前方的摄像机采集大量真实的车辆行驶环境图像,所述的图像具有m×n个像素;然后通过裁剪得到图像下部五分之三的区域作为感兴趣区域;最后将裁剪后的图像转化为灰度图像;B、图像预处理B1、利用非线性函数叠加的方法构造一个Gamma矫正函数,对步骤A获得的灰度图像进行矫正,具体函数式如下:G(x)=1+f1(x)+f2(x)+f3(x)    (1)f1(x)=acos(πx/255)    (2)f2(x)=(K(x)+b)cosβ+xsinα    (3)K(x)=ρsin(4πx/255)    (4)α=arctan(‑2b/255)    (5)f3(x)=R(x)cos(3πx/255)    (6)R(x)=c|2x/255‑1|    (7)式中,x为某一像素点的灰度值,G(x)代表某一灰度值对应的Gamma矫正值,a∈(0,1)是一个加权系数,b代表f2(x)的最大变化范围,ρ表示K(x)的振幅,α表示K(x)的偏转角度,c表示R(x)的幅值,且满足a+b+c<1;经Gamma矫正后的灰度值计算公式为:g(x)=255(x/255)1/G(x)    (8)式中,g(x)代表经过Gamma矫正后的某一像素点的灰度值;经过Gamma矫正,得到灰度图像P;B2、B2、针对灰度图像P,改变某些像素点的灰度值,具体的改变方法如下:选取图像中除车辆和道路边界之外的图像区域中灰度值为0的像素点,将其灰度值改为1,选取图像中除车辆和道路边界之外的图像区域中灰度值为255的像素点,将其灰度值改为254;将图像中车辆区域像素点的灰度值改为0,道路边界区域像素点的灰度值改为255,改变像素点后的图像为灰度图像Q;至此,灰度图像Q的像素点包括三类:第一类是灰度值为0的像素点,代表车辆;第二类是灰度值为255的像素点,代表道路边界;第三类是除去灰度值为0和255之外的像素点,代表路面;将以上三类像素点分别赋予相应的标签,即将标签“0”赋给第一类像素点,表示“车辆”,将标签“1”赋给第二类像素点,表示“道路边界”,将标签“2”赋给第三类像素点,表示“路面”;最后将灰度图像Q中各个像素点的标签赋给灰度图像P中相应的像素点;B3、针对灰度图像P的大小进行归一化处理:B31、沿图像高度方向,间隔选取不同的像素行,用x表示,通过实际采样测量,获取不同像素行x所对应目标的像素宽度和高度;B32、以图像中像素高度为0~32的图像区域为参考图像区域,以该参考图像区域中所要识别的目标的像素宽度W和高度H为基准,即设该参考图像区域的横向和纵向裁剪比例系数均为1;用W和H分别去除其余各像素行上目标的宽度和高度,获得两组比值,分别用Y和Z表示;B33、最后将像素行x与两组比值Y和Z分别进行拟合,得到两条拟合曲线,如下所示:Y=k1x+b1    (9)Z=k2x+b2    (10)其中,Y代表图像横向裁剪比例系数,Z代表图像纵向裁剪比例系数,x代表图像的某一像素行,k1、k2分别代表两条拟合曲线的斜率,b1、b2分别代表两条拟合曲线的截距;B34、将参考图像区域的横向和纵向裁剪比例均设为1,即将参考图像区域裁剪为32×32像素的图像样本;随着x的增大,根据式(9)、(10)获得的横向和纵向裁剪尺寸也相应增大;通过裁剪,得到一系列大小不一的图像样本,最后将裁剪得到的图像样本统一缩放为32×32像素的图像;将得到的32×32像素的图像作为卷积神经网络的训练样本;C、卷积神经网络的训练典型卷积神经网络LeNet‑5由8层组成,输入是层是32×32像素图像;网络层C1、C3和C5分别代表卷积层,网络层S2和S4为次抽样层,网络层F5为全连接层,输出层神经元的个数与要识别的目标类别数相同,根据实际应用环境进行改变;每层网络的一个面代表一个特征图,该特征图是由每一层中权值共享的神经元组成的集合;每一层的神经元只与上一层的一个局域感受野的神经元连接;卷积层的一般形式为: x j l = f ( Σ i M j x i l - 1 * k ij l + b j l ) - - - ( 11 ) 式中,l∈{1,2,3,4,5,6,7,8}代表层数,k是卷积核,Mj代表输入特征图的一个选择,b代表偏置;次抽样层的一般形式为: x j l = f ( β j l down ( x j l - 1 ) + b j l ) - - - ( 12 ) 式中,down(·)表示次抽样函数,一般是对前一层图像的一个n×n的区域求和,β表示次抽样层的权值,b表示偏置;根据实际应用环境,对LeNet‑5的输出神经元的个数进行调整,然后采用步骤B获得的像素尺寸为32×32的图像样本进行训练;通过训练,当卷积神经网络的输出值与期望值的误差处在可接受范围内,便得到可用于车辆前方可通行性分析的卷积神经网络。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310234126.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top