[发明专利]一种圆形印章文字识别方法在审

申请号：	201911335690.5	申请日：	2019-12-23
公开（公告）号：	CN111027553A	公开（公告）日：	2020-04-17
发明（设计）人：	王家奎;王旺	申请（专利权）人：	武汉唯理科技有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/34;G06N3/08
代理公司：	南京鼎傲知识产权代理事务所(普通合伙) 32327	代理人：	殷筛网
地址：	430000 湖北省武汉市东湖新技术***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种圆形印章文字识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种圆形印章文字识别方法，包括预测部分与训练部分；其中预测部分包括如下步骤：S1、制作训练集，收集和使用软件技术生成大量的圆形印章图片，并获取图片文字，称为标签；S2、通过整理标签的字符，将其进行统计并输入一个文件中用于制作字符集；S3、对图像和标签进行预处理，使其符合输入网络模型的要求；S4、将预处理过的图像和标签输入网络模型；S5、输出训练完成的网络模型，用于下一步的预测部分；S6：将需要预测的图片按照训练部分的方法进行预处理；本发明提供了一种无须标注文本框训练并且可以一次性识别多行文本，且网络模型简单，识别速度快、识别准确率高的圆形印章文字的方法。

技术领域

本发明涉及图像处理、文字识别技术领域，具体为一种圆形印章文字识别方法。

背景技术

OCR（OpticalCharacterRecognition，光学字符识别）技术已经是现在相当成熟的技术，再各个领域都有应用，但目前的传统的OCR识别技术在对圆形印章文字等弯曲文本的检测识别都是通过先检测旋转的文字框并做一个仿射变换，然后在featuremap上将文字区域抠出来使用crnn等方法识别，这样的方法由于crnn识别方法的限制，只能识别单行文本，所以对检测算法的要求非常高，在印章文本比较密集的情况下文字检测部分可能不够精准，对识别的结果有非常大的影响，而且在训练阶段的数据集标注非常消耗人工成本，所以现在需要一种流程更为简单，标注更为方便，准确率更高的圆形印章文字识别方法。

发明内容

本发明提供一种圆形印章文字识别方法，可以有效解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：一种圆形印章文字识别方法，包括预测部分与训练部分；其中预测部分包括如下步骤：

S1、制作训练集，收集和使用软件技术生成大量的圆形印章图片，并获取图片文字，称为标签；

S2、通过整理标签的字符，将其进行统计并输入一个文件中用于制作字符集；

S3、对图像和标签进行预处理，使其符合输入网络模型的要求；

S4、将预处理过的图像和标签输入网络模型；

S5、输出训练完成的网络模型，用于下一步的预测部分；

S6：将需要预测的图片按照训练部分的方法进行预处理；

S7：将seq个“<P>”填充如一个空白序列中，并且第一个字符为“<S>”作为data和步骤S6的图像一起输入网络；

S8：网络加载训练部分训练完成的权重模型，执行Encode部分；

S9：执行Decode部分。