[发明专利]一种基于深度学习与大数据结合的车牌识别方法及装置有效
申请号: | 201911325648.5 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111079753B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 罗茜;张斯尧;王思远;蒋杰;张诚;李乾;谢喜林;黄晋 | 申请(专利权)人: | 长沙千视通智能科技有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/146;G06V30/148;G06V30/18;G06V30/19;G06V10/82;G06N3/0464;G06N3/0442;G06N3/0455;G06N3/048;G06N3/084 |
代理公司: | 长沙德权知识产权代理事务所(普通合伙) 43229 | 代理人: | 徐仰贵 |
地址: | 410000 湖南省长沙市岳*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 数据 结合 车牌 识别 方法 装置 | ||
1.一种基于深度学习与大数据结合的车牌识别方法,其特征在于,包括:
通过改进的随机梯度下降迭代算法对大数据车辆图像的深度学习模型进行迭代训练;其中,在每次对所述大数据车辆图像的深度学习模型进行迭代训练时,使用比前次迭代训练更多的处理器来加载更多的车辆图像数据;
通过改进的线性缩放与预热策略对加载的所述更多的车辆图像数据进行批量训练,以提高对所述大数据车辆图像的深度学习模型进行训练的准确度;所述改进的线性缩放包括:将批量从B增加到kB时,同时将学习率从η增加到kη;所述改进的预热策略包括:如果使用相对较大的学习率kη,则从相对较小的学习率η值开始,在前几个时间段将所述相对较小的学习率η增加到所述相对较大的学习率kη;
通过改进的适应率缩放算法对所述批量训练中的大批量训练层进行训练,得出快速训练模型;
将通过所述深度学习模型和快速训练模型训练好的车辆图像输入循环神经网络RNN中,以检测所述车辆图像的感兴趣区域ROI是否为车牌;
若为车牌,则通过一体化的深度网络模型对所述ROI进行车牌识别;所述一体化的深度网络模型包括卷积层、双向循环神经网络BRNN层、线性变换层和联结主义时间分类CTC层;
所述通过改进的随机梯度下降迭代算法对大数据车辆图像的深度学习模型进行迭代训练,包括:
构建所述大数据车辆图像的深度学习模型的损失函数L(W):
其中,w代表深度神经网络DNN的权重,X为训练数据,n为X中的样本数,Y代表训练数据X的标注,xi为训练数据X中的样本,l(xi,yi,w)为针对xi和其标注yi(i∈{1,2,...,n))所计算出的损失;
在每次对所述大数据车辆图像的深度学习模型进行迭代训练时,根据所述损失函数对权重的梯度更新DNN的权重:
其中,wt为第t-1次迭代后的权重,wt+1为第t次迭代后的权重,η为学习率,第t次迭代的批量大小为Bt,且Bt的大小为b;在每次迭代训练时,使用比前次迭代训练更多的处理器来加载更多的图像数据;
所述通过改进的适应率缩放算法对所述批量训练中的大批量训练层进行训练,得出快速训练模型,包括:
获取所述批量训练中的大批量训练层中的每个可学习参数的本地学习率η;
获取所述批量训练中的大批量训练层中的每个层的真实学习率η';所述真实学习率为η'=γ×α×η;其中,γ是用户的调整参数,γ的取值范围为[1,50],α为加速项;
通过公式更新权重梯度;其中,为权重梯度,w为权重,β为权重衰减;
通过公式更新加速项α;其中,μ为动量;
采用公式w=w-α来更新权重,以得出快速训练模型;
所述通过一体化的深度网络模型对所述ROI进行车牌识别,包括:
对感兴趣区域进行ROI池化后的特征提取,将提取的特征通过两个卷积层,以及两个卷积层之间的矩形池化层进行处理,以将所述提取的特征变换为特征序列D×L;其中,D=512,L=19,所述特征序列使用V=(V1,V2,...,VL)表示;
在BRNN层应用所述特征序列V,形成两个相互分离的循环神经网络RNN,其中一个RNN前向处理所述特征序列V,另外一个RNN后向处理所述特征序列V,将两个隐含的状态级联一起,输入到具有37个输出的线性变换层中,并转到Softmax层,将所述37个输出转换到概率,所述概率对应26个字母、10个数字及一个非字符类的概率,所述概率经过BRNN层编码,使所述特征序列V转换到与L具有相同长度的概率估计q=(q1,q2,...,qL),同时使用长短期记忆网络LSTM定义包含三个乘法门的记忆细胞,以选择性地保存相关信息,解决RNN训练中的梯度消失问题,
通过CTC层对所述概率估计q做序列解码,并通过解码后的概率估计q寻找具有最大概率的近似最优路径:
其中,π*是具有最大概率的近似最优路径,B算子用于一处重复的标记及非字符标记,P为概率运算;
通过所述近似最优路径确定一体化的深度网络模型的损失函数,并通过所述损失函数对所述ROI进行车牌识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙千视通智能科技有限公司,未经长沙千视通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911325648.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置