[发明专利]一种实时交通场景的多车牌动态识别方法在审
申请号: | 201810368034.4 | 申请日: | 2018-04-23 |
公开(公告)号: | CN108509954A | 公开(公告)日: | 2018-09-07 |
发明(设计)人: | 张中;牛雷 | 申请(专利权)人: | 合肥湛达智能科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 昆明合众智信知识产权事务所 53113 | 代理人: | 钱磊 |
地址: | 230088 安徽省合肥市高新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车牌定位 动态识别 实时交通 网络训练 车牌 图像后处理 图像预处理 场景 车牌信息 创新优势 违章行为 字符分割 字符识别 字符信息 传统的 停车场 网络 高速公路 分割 监测 应用 图片 | ||
1.一种实时交通场景的多车牌动态识别方法,其特征在于运用多种卷积神经网络对车牌进行整体识别,包括以下步骤:
S1、建立卷积神经网络,其包括车牌定位网络和车牌识别;
S2、图像预处理:将采集到的图像调整为224*224分辨率;
S3、定位网络训练:将S2中处理过的图像输入到车牌定位网络中进行特征学习;
S4、图像后处理:把S3中定位后的车牌图像拉伸到224*224分辨率;
S5、识别网络训练:将S4中处理过的车牌图像输入到车牌识别网络中进行学习;
S6、神经网络测试:将测试图片输入到车牌定位网络和车牌识别网络中进行整体测试。
2.根据权利要求1所述的一种实时交通场景的多车牌动态识别方法,其特征在于,所述S3中将图像输入车牌定位网络的特征学习包括以下步骤:
S31、所述车牌定位网络具有16个卷积层、4个池化层、2个全连接层,层与层之间采用线性激活函数,其最后一层全连接层采用修正的线性激活函数,卷积层用于提取目标特征,全连接层用于预测坐标和类别概率;
S32、将输入图像划分成S*S个格子,进行遍历,当检测目标中心出现在格子中时,该格检测该目标并给出该目标在此格中表示该格子拥有目标的信心值的置信值,置信值范围为0~1,置信值定义为:其中IOU为表示bounding box与实际目标框交集与并集的比值的交并比函数,将检测出的目标区域定义为bounding box,每个格子预测出B个bounding box,bounding box预测五个值:x、y、h、w、confidence;
S33、S32中划分的每个格子预测一个记为C类的类别信息,预测C种假定类别的条件概率为Pr(Classi|Object);
S34、计算张量,张量计算公式为:S*S(B*5+C);
S35、通过将S32和S33得到的类别概率与置信值相乘,得到该类别的置信分数,用于表示该类别在bounding box中出现的概率,该公式如下:
其中,等式左边第一项代表每个网格预测的类别信息;
S36、计算坐标预测损失函数,该公式如下:
其中,λcoord代表边界框预测权重,λnoobj代表不包含目标边界框的置信度预测权重,其中表示目标是否出现在网格单元i中,表示网格单元i中的第j个边界框预测器负责预测;
含有目标的bounding box置信值预测损失函数计算为:
不包含目标的bounding box置信值预测损失函数计算为:
类别预测损失函数计算为:
S37、设定识别阈值作为标准,将得到每个bounding box的特定类别的置信分数与给定阈值比较,滤掉得分较低的bounding box,对保留的bounding box进行非极大值抑制处理,得到最终的检测结果。
3.根据权利要求2所述的一种实时交通场景的多车牌动态识别方法,其特征在于,所述车牌定位网络具有16个卷积层,2个全连接层,用以实现基于图像全图信息端到端的输出,其网络结构依次为:卷积层conv1、池化层max pool、卷积层conv2、池化层max pool、卷积层conv3、卷积层conv4、卷积层conv5、卷积层conv6、池化层max pool、卷积层conv7、卷积层conv8、卷积层conv9、卷积层conv10、池化层max pool、卷积层conv11、卷积层conv12、卷积层conv13、卷积层conv14、卷积层conv15、卷积层conv16、全连接层FC1和全连接层FC2。
4.根据权利要求1所述的一种实时交通场景的多车牌动态识别方法,其特征在于,所述车牌识别网络还包括字符识别网络算法,其包含5个卷积层,3个全连接层,其网络结构依次为:卷积层conv1、池化层max pool、卷积层conv2、池化层max pool、卷积层conv3、卷积层conv4、卷积层conv5、池化层max pool、全连接层FC1、全连接层FC2和全连接层FC3,其中,全连接层FC3维度分为7部分,用于后续softmax分类字符。
5.根据权利要求4所述的一种实时交通场景的多车牌动态识别方法,其特征在于,所述字符识别网络结构的全连接层FC3维度分为7个部分包括:采用可输出7个label的7个softmax分类器分别对字符进行分类,每个softmax分类器负责输出车牌对应位置的字符,每个分类器输出字符的概率为:
且每个softmax分类器的输出字符概率相加为1,即:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥湛达智能科技有限公司,未经合肥湛达智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810368034.4/1.html,转载请声明来源钻瓜专利网。