[发明专利]一种基于卷积神经网络的工业字符识别方法有效
| 申请号: | 201611235492.8 | 申请日: | 2016-12-28 |
| 公开(公告)号: | CN106650721B | 公开(公告)日: | 2019-08-13 |
| 发明(设计)人: | 吴晓军;张瑞 | 申请(专利权)人: | 吴晓军 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62;G06N3/04 |
| 代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 经国富 |
| 地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提出了一种基于卷积神经网络的工业字符识别方法,包括建立字符数据集,对字符数据集进行数据增强及预处理,建立CNN集成模型,所述模型包含3个不同的个体分类器,然后,利用模型进行训练,训练分为两步完成,第一步为离线训练,获取离线训练模型,第二步为在线训练,将离线训练模型用作初始化,进行特定生产线字符数据集的训练,获取在线训练模型;以及对目标图形进行预处理、字符定位和单个字符图像分割;将分割好的字符图像送入已训练好的在线训练模型中,得到CNN集成模型中三个分类器将单个目标图像分类为每个类别的概率值;采用投票的方式进行最终决策,得到测试数据的类别结果。本发明能够对不同生产线上的字符进行快速、高效的识别。 | ||
| 搜索关键词: | 一种 基于 卷积 神经网络 工业 字符 识别 方法 | ||
【主权项】:
1.一种基于卷积神经网络的工业字符识别方法,其特征在于:所述方法包括:建立字符数据集,所述字符数据集包括混合场景字符数据集和单一场景字符数据集;对所述字符数据集进行数据增强及预处理,其中,所述数据增强包括对字符图像进行一系列的变换和加干扰操作来进一步扩大数据集;建立CNN集成模型的核心思想是训练具有准确性和多样性的个体学习器,其中,个体学习器采用卷积神经网络,所述CNN集成模型共包含三个CNN结构:Net‑1、Net‑2、Net‑3,Net‑1包含3个由卷积层和下采样层重复堆叠的特征提取阶段和2个全连接层,采用Softmax层作为特征分类器,采用了多级特征融合的方式,将每一个特征提取层或特定若干个特征提取层的输出进行融合,共同输入全连接层,这样得到的集成特征向量传入分类器作为最终的特征提取结果;Net‑2也同样包含3个特征提取阶段,同样采用了多级特征融合,在Net‑2中所有的卷积层都采用3×3的卷积核;Net‑3的结构与Net‑2较为相似,但没有将多级特征共同输入全链接层;在建立了三个网络结构作为个体学习器后,对CNN集成模型进行训练,训练步骤如下:(1)从原始数据集中随机采样,产生三个随机样本空间,确保这些采样空间与所涉及的原始数据集有微小差异;(2)轮流训练三个网络模型;采用上一步得到的三个样本空间分别训练Net‑1,Net‑2,Net‑3,这样就得到了三个有差异的分类器;(3)一轮训练结束,返回步骤(1)继续执行随机采样操作及训练操作,直到达到预设的迭代次数或三个结构的误差分别收敛到一定值,然后保存权重,得到三个个体分类器;其中,训练分为两步完成,第一步为离线训练,获取离线训练模型,第二步为在线训练,将离线训练模型用作初始化,进行特定生产线字符数据集的训练,获取在线训练模型;以及对目标图形进行预处理、字符定位和单个字符图像分割;将分割好的字符图像送入已训练好的在线训练模型中,得到CNN集成模型中三个分类器将单个目标图像分类为每个类别的概率值;采用投票的方式进行最终决策,得到测试数据的类别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吴晓军,未经吴晓军许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611235492.8/,转载请声明来源钻瓜专利网。





