[发明专利]一种基于卷积神经网络的字符识别方法有效

专利信息
申请号: 201810332531.9 申请日: 2018-04-13
公开(公告)号: CN108596066B 公开(公告)日: 2020-05-26
发明(设计)人: 张海剑;成帅;杨天韵 申请(专利权)人: 武汉大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/34
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 王琪
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 卷积 神经网络 字符 识别 方法
【说明书】:

发明公开了一种基于卷积神经网络的字符识别方法,主要解决现有的人力录入工程图纸数据时费时费力、错误率高的问题,其主要步骤包括:1)采用基于Otsu法的最佳全局阈值处理将灰度图像转换为二值图像。2)对倾斜的图像进行旋转矫正。3)采用数学形态学的算法提取出表格框。4)获得字符所在区域。5)将斜向字符串旋转相应的角度至水平方向。6)采用圆形霍夫变换的算法来查找图像中的圆圈,提取工程图纸中的焊道号。7)采用卷积神经网络的方法对工程图纸进行图文识别。8)通过编码规则修正简单错误,自动纠正识别错误。9)输出并存储图纸数据。本发明在工程图纸的图文识别上具有高准确率和实时性,实现了工程图纸数据的高效记录与管理。

技术领域

本发明属于模式识别领域,特别涉及一种基于卷积神经网络的字符识别方法,可用于工业图纸的文档扫描识别。

背景技术

光学字符识别(Optical Character Recognition,OCR)技术,是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别的方法将形状翻译成计算机文字的过程。OCR是模式识别领域的重要研究方向,并广泛运用于自动化信息处理,在建筑、机械等工程领域有着重要的实际意义。

在实际工程中,工作人员需要将工业图纸的信息录入计算机,以便工程信息的记录与管理。然而,一般情况下,工程图纸数量庞大而且内容繁杂,如果仅凭人力录入往往需要大量的人力成本和时间成本,人力录入的工作的枯燥且重复,很可能出现误录、误识别的现象。如果能自动扫描识别工程图纸的内容,将为工程节省大量的人力和时间成本,工程图纸文档的管理也将变得简单高效。

传统的图文识别方法主要包括统计决策识别和基于机器学习的文字识别方法两类。统计决策识别是最传统的图文识别方法,典型的统计决策识别方法是模板匹配方法,它通过计算模板图像和输入图像的最小距离,选出输入图像的最佳匹配模板,这种方法的实现过程较为简单,但是出错率高,计算量大,不能取得良好的实时性。基于机器学习的文字识别方法主要包括图像预处理,特征提取和识别几个步骤,特征提取可以采用人工提取特征或者卷积神经网络来提取图像特征。卷积神经网络作为深度学习的一种实现模型,具有局部感知野和权值共享的特征,极大地减少了计算复杂度,在图文识别方面也得到了快速发展。但是针对质量差和复杂的图纸,传统的基于卷积神经网络的识别算法并不能取得较高的准确率。

发明内容

本发明的目的在于提供一种基于卷积神经网络的字符识别方法,在对传统的字符识别卷积神经网络进行了改进,简化了网络结构,采用合适的激励函数和池化方法,并增加替换和列表比较等纠错后处理操作,极大提高了识别的速度和准确率。此外,本方法采用最小二乘法对倾斜字符进行矫正,实现了多方向字符的识别,适应了工业图纸的复杂性,且能够满足识别准确率要求。因此,本发明采用的卷积神经网络的方法,相对于传统的识别方法,准确率更高,更加有效。

本发明的技术方案包括以下步骤:

步骤1,对工程图纸扫描文档二值化,将工程图纸扫描文档中的图文与背景分离;

步骤2,针对倾斜的扫描文档,找到二值图像的倾斜角,采用双线性插值对图像进行旋转矫正;

步骤3,采用数学形态学处理提取出步骤2矫正图像中的表格框线,将图像分割为图面区域、材料表区域和标题栏区域;

步骤4,搜索步骤2中矫正图像所有的连通区域,再依据图像中所标记连通区域的形状和近邻位置特征筛选、合并连通区域来定位单个字符;

步骤5,将单个字符组合成字符串,计算字符串中各字符外接矩形的中心点的拟合直线,依据拟合直线的斜率判断字符串的走向,将斜向字符串旋转相应的角度至水平方向;

步骤6,查找步骤2矫正图像中的圆圈,并提取工程图纸中的焊道号;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810332531.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top