[发明专利]一种基于卷积神经网络的工业字符识别方法有效
| 申请号: | 201611235492.8 | 申请日: | 2016-12-28 |
| 公开(公告)号: | CN106650721B | 公开(公告)日: | 2019-08-13 |
| 发明(设计)人: | 吴晓军;张瑞 | 申请(专利权)人: | 吴晓军 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62;G06N3/04 |
| 代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 经国富 |
| 地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 卷积 神经网络 工业 字符 识别 方法 | ||
本发明提出了一种基于卷积神经网络的工业字符识别方法,包括建立字符数据集,对字符数据集进行数据增强及预处理,建立CNN集成模型,所述模型包含3个不同的个体分类器,然后,利用模型进行训练,训练分为两步完成,第一步为离线训练,获取离线训练模型,第二步为在线训练,将离线训练模型用作初始化,进行特定生产线字符数据集的训练,获取在线训练模型;以及对目标图形进行预处理、字符定位和单个字符图像分割;将分割好的字符图像送入已训练好的在线训练模型中,得到CNN集成模型中三个分类器将单个目标图像分类为每个类别的概率值;采用投票的方式进行最终决策,得到测试数据的类别结果。本发明能够对不同生产线上的字符进行快速、高效的识别。
技术领域
本发明涉及图像识别技术领域,尤其涉及一种工业字符识别方法。
背景技术
现有的字符识别技术一般采用基于模版匹配或基于结构统计的算法。以字符图像灰度作为匹配信息,通过计算字符模板图像与目标图像子区域的灰度相关系数来度量匹配度;或利用字符本身的形态结构,如边缘、拐点、连通域等特征进行识别。还有一类是在建立字符图像的特征后,通过有监督的方式学习特征与目标类别之间的关系,建立从输入到预测输出的函数关系。
专利文献1(中国专利公开号CN101436249A)公开了一种获得字符粗分类及细分类匹配模版的方法,用于手写字符识别系统。专利文献2(中国专利公开号CN103049750A)公开了一种采用边缘特征建立字符匹配模版的方法。专利文献3(中国专利公开号CN104820827A)公开了一种通过二值化、预处理、区域粗提取和分割等各个操作获取字符的单独图像与设定的模版进行相似性度量的匹配算法,用于电线电缆表面的点状字符识别。专利文献4(中国专利公开号CN105761351A)公开了一种基于结构特征的字符识别方法。专利文献5(中国专利公开号CN104871180A)公开了一种使用相同文本的多个图像改善文本辨识的方法用于改善文字识别效果。专利文献6(中国专利公开号CN105608453A)公开了一种能够对包括不同种类字符的复式记录的票据进行高精度识别的字符识别系统及字符识别方法。专利文献7(中国专利公开号CN103902956A)公开了一种基于神经网络的车牌照字符识别方法,以字符图像在X轴和Y轴上的投影为基本,对其做Fourier变换得到的K个变换系数中选出有代表性的M个特征作为神经网络的输入,采用有监督的方式训练得到特征和输出类别间的关系。专利文献8(中国专利公开号CN101408933A)公开了一种基于粗网格特征提取和BP神经网络的车牌字符识别方法。专利文献9(中国专利公开号CN103927534A)公开了针对易拉罐底喷码字符的在线视觉检测方法,包括离线状态下对图像中的字符进行分割,并归类构建字符库,采用卷积神经网络算法进行训练,形成字符分类器,在在线检测时用同样的过程对输入图像进行识别。专利文献10(中国专利公开号CN104463209A)公开了一种识别PCB板上数字代码的方法,采用频域法得到增强了特征值的图像,归一化特征值输入BP神经网络完成训练和预测。专利文献11(中国专利公开号CN104331688 A)公开了一种雷管外壳点阵字符的识别方法,利用连通域对单个字符区域进行切分,将字符边界到区域边界的距离作为待识别的特征值,利用最小距离分类器和多级识别法获得最终的识别结果。专利文献12(中国专利公开号CN105678293A)、专利文献13(中国专利公开号CN105678292A)公开了一种基于卷积及递归神经网络的文字序列识别系统,采用CNN提取图像文字序列特征并输出到RNN中,依次实现汉字前、后部分、数字、字母、标点符号或者空白的识别。王有旺等提出了基于深度学习的字符识别算法,分别应用于手写体汉字识别和自然场景英文文字识别(王有旺,深度学习及其在手写汉字识别中的应用研究,华南理工大学,硕士学位论文,2014;廖威敏,面向自然场景的端对端英文文字识别研究,厦门大学,硕士学位论文,2014)。周凤香提出了一种基于字符混合特征的工业生产线标签识别系统,通过提取字符的孔洞特征、统计特征、结构特征和基于Gabor变换的纹理特征等构建字符的混合特征,设计三层分类器进行递进的识别分类(周凤香,工业生产线标签字符识别系统的设计与实现,电子科技大学,硕士学位论文,2013)。刘萌萌提出了一种基于神经网络的压印字符识别系统,其中研究了模版匹配定位算法和基于Ostu法的字符分割方法,然后结合BP神经网络和字符的结构特征构建了完整的字符识别方案(刘萌萌,基于神经网络的压印字符识别系统研究,天津大学,硕士学位论文,2013)。国外的机器视觉软件例如美国康耐视的VisionPro、日本Keyence、德国MVtec的Halcon等都具有字符识别算法,一方面这些方法都是基于传统的技术实现,另一方面我们需要开发具有自主知识产权的核心技术,随着“中国制造2025”计划的实施,亟需掌握高性能的机器视觉核心算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吴晓军,未经吴晓军许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611235492.8/2.html,转载请声明来源钻瓜专利网。





