[发明专利]一种文字识别方法及系统在审

申请号：	202210012424.4	申请日：	2022-01-07
公开（公告）号：	CN114067192A	公开（公告）日：	2022-02-18
发明（设计）人：	许占林;张宏杰;张健;刘树	申请（专利权）人：	北京许先网科技发展有限公司
主分类号：	G06V10/82	分类号：	G06V10/82;G06V10/774;G06V30/146;G06V30/148;G06V30/18;G06N3/04
代理公司：	北京专赢专利代理有限公司 11797	代理人：	李道志
地址：	100071 北京市丰台***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文字识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明适用于图像识别技术领域，尤其涉及一种文字识别方法及系统，所述方法包括：采集待识别图像，并对待识别图像进行预处理，得到增强图像；上传增强图像，对增强图像中的文字区域进行提取，得到文字区域图像；对文字区域图像进行背景处理，得到无背景文字图像；清理无背景文字图像的线段和点，并利用卷积神经网络进行识别，得到文字识别结果。本发明通过对图像进行预处理，并对其进行增强处理，使其包含的文字内容更加清洗，进而在去除背景后，利用卷积神经网络进行识别，得到文字识别结果，识别精度高，不仅能够识别印刷体，还能够对非印刷体进行精准识别。

技术领域

本发明属于图像识别技术领域，尤其涉及一种文字识别方法及系统。

背景技术

利用计算机自动识别字符的技术，是模式识别应用的一个重要领域。人们在生产和生活中，要处理大量的文字、报表和文本。为了减轻人们的劳动，提高处理效率，人们开始探讨一般文字识别方法，并研制出光学字符识别器。

随着科技的发展与进步，文字识别技术已经被广泛应用，例如有的软件通过对截图进行处理，就可以识别图片中包含的文字内容，特别是对于印刷体的文字，识别结果非常准确。

但是，对于非印刷体的文字，上述识别方式难以取得令人满意的识别精度，因此亟需一种针对非印刷体的文字识别方法，以解决上述问题。

发明内容

本发明实施例的目的在于提供一种文字识别方法，旨在解决背景技术第三部分中提出的问题。

本发明实施例是这样实现的，一种文字识别方法，所述方法包括：

采集待识别图像，并对待识别图像进行预处理，得到增强图像；

上传增强图像，对增强图像中的文字区域进行提取，得到文字区域图像；

对文字区域图像进行背景处理，得到无背景文字图像；