[发明专利]一种基于深度学习的车辆品牌型号识别方法有效
申请号: | 201510744974.5 | 申请日: | 2015-11-30 |
公开(公告)号: | CN105488517B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 曾凡涛 | 申请(专利权)人: | 杭州全实鹰科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 浙江永鼎律师事务所 33233 | 代理人: | 郭小丽 |
地址: | 310030 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习的车辆品牌型号自动识别方法,该方法针对车辆品牌型号识别设计了一种稳健的深度卷积网络结构,采用深度卷积网络提取车脸区域在不同尺度下的图像特征,再结合支撑向量机对其进行分类,自动完成车辆品牌型号的识别,该方法具有极高的识别准确度。 | ||
搜索关键词: | 一种 基于 深度 学习 车辆 品牌 型号 识别 方法 | ||
【主权项】:
1.一种基于深度学习的车辆品牌型号识别方法,其特征在于,包括以下步骤:S1、准备数据集:不同城市的高清卡口点位搜集准备了2000多万张抓拍图片,经过人工筛选,根据车辆的品牌型号精确分成三千多类,建立丰富的涵盖各种条件的车辆品牌型号图片数据库,然后再利用车牌识别技术精确定位卡口图片中的车牌位置,根据车牌位置信息准确估计车脸区域,再将车脸区域图像进行尺度归一化处理;S2、针对车辆品牌型号的识别任务设计一种新的深度卷积网络结构,深度卷积网络由1个输入层,4个卷积层,4个下采样层,2个全连接层和1个输出层组成,其中,4个卷积层分别用C1、C2、C3、C4来表示,其中C1和C2为全局共享卷积核的卷积层用于提取全局图像特征,C3和C4为局部共享卷积核的卷积层用于提取局部图像特征以增强不同类型的车辆之间的区分度;4个下采样层分别用P1、P2、P3、P4来表示,2个全连接层分别用F1、F2来表示,1个输出层用SoftMax来表示;其中,输入层为200x80的单通道灰度图像;C1层全局共享的卷积核大小为5x5,步长为1,卷积核数量为30个,卷积后的特征尺度为196x76;P1层采样窗口为3,步长为3,采样后的特征数量为30个,特征尺度为66x26;C2层全局共享的卷积核大小为3x3,步长为1,卷积核数量为60个,卷积后的特征尺度为64x24;P2层采样窗口为2,步长为2,采样后的特征数量为60个,特征尺度为32x12;C3层采用了局部共享卷积核的策略,将P2层的输出特征分为了4个16x6,每一个子区域共享3x3的卷积核,卷积核的数量为100个,这样得到的特征尺度为4个14x4的子特征,整个特征尺度为28x8;P3层采用了2x2的采样窗口,步长为2,采样后的特征数量为100个,特征尺度为14x4;C4层同样采用了局部共享权值的策略,将P3层的输出特征分为了2个8x4的子区域,其中两个子区域存在2x4的两列重叠区域,每一个子区域共享3x3的卷积核,卷积核的数量为150,这样得到的特征为2个6x2的子特征,特征尺度为12x2;P4层的采样窗口为2,步长为2,采样后的特征尺度为6x1,数量为150;为了增加特征的描述能力,将P3层和P4层两个不同尺度的所有特征联合拼接起来作为F1层向后继续传递,这样F1层的神经元个数为6500,这样的高维特征中存在冗余信息,为了降低特征的维度F1后面接入了F2层,F2层的神经元个数为3000;网络的最后层为SoftMax,计算每一个输入样本隶属于每一类车辆的概率,概率最大的类别即为样本所属的车辆型号,深度卷积网络结构中只有卷积层和全连接层使用了激活函数;S3、训练深度卷积网络,得到每个层的网络权值;S4、利用深度卷积网络提取车脸区域的图像特征,将车脸区域图像输入到深度卷积网络结构中,计算出的F1层和F2层结果均可作为车型识别的特征输入,F1层特征维度较高,稀疏程度较高,存在较多的冗余信息,F2层是F1层经过降维后的特征,保留了区分度较高特征部分,能更好地描述车脸区域,采用F2层的输出作为最终用于识别的特征描述子;S5、将深度卷积网络提取的特征输入到支撑向量机,完成车辆品牌型号的识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州全实鹰科技有限公司,未经杭州全实鹰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510744974.5/,转载请声明来源钻瓜专利网。