[发明专利]一种基于卷积神经网络的车辆识别与检测方法在审
申请号: | 201711422519.9 | 申请日: | 2017-12-25 |
公开(公告)号: | CN108009526A | 公开(公告)日: | 2018-05-08 |
发明(设计)人: | 周巍;饶玉昆;张冠文 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 金凤 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于卷积神经网络的车辆识别与检测方法,涉及图像处理领域,采用四层卷积神经网络实现车辆分类以及图片的特征提取,同时在每一个选取的特征层上定义默认框,并定义车辆检测网络的损失函数,完成车辆检测网络的训练与测试,得到最终的车辆检测模型。本发明采用一种端到端的车辆分类与检测方法,相比于传统的车辆检测方法有着更强的鲁棒性,能够一次性识别出一张图片中的所有车辆对象,同时拥有更高的准确率;相比于现有的基于深度学习的目标检测算法,本发明在第一步中采用了小型卷积神经网络,大大减少了训练所用的时间,在保证检测效果的前提下,提升了网络对车辆的检测速度。 | ||
搜索关键词: | 一种 基于 卷积 神经网络 车辆 识别 检测 方法 | ||
【主权项】:
1.一种基于卷积神经网络的车辆识别与检测方法,其特征在于包括下述步骤:第一步,搭建车辆检测的基本网络采用了四层卷积神经网络作为车辆检测的基本网络,用于车辆分类以及车辆图像的特征提取;所述的四层卷积神经网络由数据层,卷积层1,激活函数层1,池化层1,卷积层2,激活函数层2,池化层2,卷积层3,激活函数层3,池化层3,卷积层4,激活函数层4,池化层4,全连接层5,激活函数层5,全连接层6依次连接,全连接层6后接并列的损失层和准确率层,在caffe框架上,训练网络得到一个分类模型,该模型用于后续的车辆检测网络的搭建;网络的损失层用于计算分类误差;网络的准确率层用于计算网络的准确率,统计预测结果,将正确预测出车辆的数量与总车辆数量的比值作为网络的准确率,计算公式如下: A c = M N × 100 % - - - ( 1 ) ]]> 其中,Ac表示分类准确率,M表示分类为车辆的标签数量,N表示总的标签数量;第二步,定义默认框对于每一张输入到第一步所述网络结构图片,每经过一个网络层都会成为一张特征图,选取m个网络层输出的特征图,所述的网络层为卷积层或池化层;在每个特征图上的每个像素点位置定义正方形默认框,同一个特征图上的正方形默认框边长一致,该特征图的正方形默认框的数量和该特征图的像素点的总数量相同,记选取的m特征图中,其中边长最大的特征图上的正方形默认框的边长为s1 ,其余每个特征图上正方形默认框的大小计算公式如下式:sk =sk-1 +15×(k-1),k∈[2,m] (2)其中,m表示选取的特征图数量,sk 表示第k个特征图上默认框的边长;再对每一个正方形默认框基础上进行缩放扩张,获得n个宽高比不同的矩形默认框,宽高比记为αr ∈{α1 ,α2 ,......,αn },缩放后默认框的宽和高计算公式如下式: w k α r = s k α r , h k α r = s k α r - - - ( 3 ) ]]> 其中, 表示第k个特征图上宽高比为αr 的默认框宽的宽度; 表示第k个特征图上宽高比为αr 的默认框高的高度;最终对于选取的m个特征图上的每个像素点,得到包括一个正方形默认框和缩放扩张后的n个矩形默认框,总计n+1个大小不同的默认框用于预测;第三步,定义车辆检测网络的损失函数对于m个特征图上每一个像素点上的n+1个默认框,计算每一个默认框相对于车辆目标真实位置的回归损失,同时计算默认框中对象是车辆的置信度损失,经过加权计算得到车辆检测网络的总损失;损失由两部分组成,目标属于车辆的置信度损失以及目标预测位置相对于真实位置的回归损失,xij 表示第x个像素点上第i个默认框与第j个真实位置框是否匹配,若默认框与真实位置框的重叠系数大于一个阈值to ,则默认框与真实位置框为匹配,xij 值为1;若默认框与真实位置框重叠系数小于阈值to ,则默认框与真实位置不匹配,xij 值为0;重叠系数计算为下式: J ( l i , g j ) = | l i ∩ g j | | l i ∪ g j | - - - ( 4 ) ]]> 其中,li 表示第i个默认框的位置,gj 表示车辆的第j个真实位置;回归损失Lloc 表示预测框l与真实位置框g的损失,由smooth L1函数计算而来,定义为下式: L l o c ( x , l , g ) = Σ i Σ j x i j smooth L 1 ( l i - g j ) smooth L 1 ( t ) = 0.5 t 2 | t | < 1 | t | - 0.5 o t h e r w i s e - - - ( 5 ) ]]> 其中,x表示像素点;i的取值范围为[1,n+1];j的取值范围为[1,t],t为真实框数量;置信度损失Lconf 表示目标在不同类别上的softmax损失,定义为下式: L c o n f ( x , c ) = - Σ i ∈ P o s N x i j l o g ( c i ) - Σ i ∈ N e g l o g ( c i 0 ) - - - ( 6 ) ]]> 其中,c表示置信度,ci 表示对象为车辆的置信度, 表示对象为背景的置信度;检测网络的总损失为回归损失与置信度损失的权重和,定义为下式: L ( x , c , l , g ) = 1 N ( L c o n f ( x , c ) + αL l o c ( x , l , g ) ) - - - ( 7 ) ]]> 其中,N表示被判断为车辆的默认框总数,α表示回归损失在网络的总损失中的权重大小;第四步,对车辆检测网络进行训练与测试:对于每一张车辆图片,给定每一个图片中车辆对象的数量以及每一个车辆对象的坐标,将所有的图片按5:1的比例分成训练集与测试集两个部分,训练集用于训练车辆检测网络,测试集用于测试车辆检测网络的检测效果,在caffe平台上,按照第一步到第四步搭建车辆检测网络,利用车辆图片训练集与车辆图片测试集对网络进行训练,得到最终的车辆检测模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711422519.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种无溶剂环氧饮水白漆及其制备方法
- 下一篇:接地电阻的仿真建模方法