[发明专利]一种基于卷积神经网络的车型识别方法在审
申请号: | 201910904657.3 | 申请日: | 2019-09-24 |
公开(公告)号: | CN110598801A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 赵宏阳;付俊;井元伟 | 申请(专利权)人: | 东北大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06F16/55 |
代理公司: | 21109 沈阳东大知识产权代理有限公司 | 代理人: | 李在川 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车型识别 损失函数 数据集 卷积神经网络 背景环境 类间差异 类内差异 数据增强 优化算法 智能交通 传统的 偏移量 权值和 减小 扩增 贴合 迁移 下车 更新 网络 学习 | ||
1.一种基于卷积神经网络的车型识别方法,其特征在于包括如下步骤:
步骤1:采集车型图片数据集,利用数据增强对数据集进行扩增,将扩增后的数据集按一定比例分为训练集和测试集;
步骤2:借鉴迁移学习的思想,将Inception-V3网络模型在大规模数据集ImageNet上进行训练,得到Inception-V3网络模型各个参数的最优初始值;
步骤3:采用Adam优化算法对权值和偏移量进行更新,并采用AMSoftmax损失函数对输出分类引入角度特征,来优化Inception-V3网络模型;
步骤4:将车型图像数据集中的训练集及步骤2得到的网络参数的最优初始值输入到优化后的Inception-V3网络模型中,对模型进行训练;
步骤5:将车型图像的测试集输入训练好的网络模型中,对车型进行分类。
2.根据权利要求1所述的一种基于卷积神经网络的车型识别方法,其特征在于:所述步骤1中利用数据增强对数据集进行扩增的方法为:
分别采用旋转和高斯模糊两种策略对车型图片数据集中的每个图像进行处理,将处理后的图像加入原车型图片数据集中,使得车型图像数据扩增为原数据集的3倍。
3.根据权利要求1所述的一种基于卷积神经网络的车型识别方法,其特征在于所述步骤3中采用Adam优化算法对权值和偏移量进行更新的过程如下:
步骤3.1.1:首先初始化一阶和二阶变量:vdw=0,vdb=0,sdw=0,sdb=0;
其中,vdw为针对权重W的梯度的指数加权平均,vdb为针对偏移量b的梯度的指数加权平均,sdw为针对W的梯度平方的指数加权平均,sdb为针对b的梯度平方的指数加权平均;
步骤3.1.2:假设在第t轮训练中,对参数进行更新:
vdw(t)=β1vdw(t-1)+(1-β1)dW
vdb(t)=β1vdb(t-1)+(1-β1)db
sdw(t)=β2sdw(t-1)+(1-β2)dW2
sdb(t)=β2sdw(t-1)+(1-β2)db2
其中,v为一阶动量矩,s为二阶动量矩;
β1为一阶矩v的指数衰减率,β2为二阶矩s的指数衰减率,其中β1,β2∈[0,1);
dW和db为损失函数在反向传播时的权值和偏移量的梯度;
步骤3.1.3:对上述参数值进行偏差修正:
步骤3.1.4:最后对权重和偏置进行更新:
其中,α为学习率,ε取10-8,ε>0用来保证分母大于0。
4.根据权利要求1所述的一种基于卷积神经网络的车型识别方法,其特征在于:所述采用AMSoftmax损失函数对输出分类引入角度特征的过程如下:
传统的softmax损失函数:
其中,WTf=||W||·||f||·cosθ,可知特征向量包含角度信息,将WTf由||W||·||f||·cosθ代替,可得:
其中,f是最后一个完全连接层的输入,Wj是最后一个完全连接层参数矩阵W的第j列,可称为第i个样本的目标逻辑,n为输入数据的总个数,c为类别总数;
在每一次迭代中归一化权值||Wj||=1,将偏置b设为0,可得A-Softmax损失函数:
其中,并且k∈[0,m-1],其中m通常是个大于1的数,控制分类边界的大小;
在A-Softmax损失函数的基础上,引入一个简洁的附加间隔,定义得到AMSoftmax,如下:
其中,m用于控制边界,s为引入的缩放因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910904657.3/1.html,转载请声明来源钻瓜专利网。