[发明专利]一种圆形印章文字识别方法在审
| 申请号: | 201911335690.5 | 申请日: | 2019-12-23 |
| 公开(公告)号: | CN111027553A | 公开(公告)日: | 2020-04-17 |
| 发明(设计)人: | 王家奎;王旺 | 申请(专利权)人: | 武汉唯理科技有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06N3/08 |
| 代理公司: | 南京鼎傲知识产权代理事务所(普通合伙) 32327 | 代理人: | 殷筛网 |
| 地址: | 430000 湖北省武汉市东湖新技术*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 圆形 印章 文字 识别 方法 | ||
本发明公开了一种圆形印章文字识别方法,包括预测部分与训练部分;其中预测部分包括如下步骤:S1、制作训练集,收集和使用软件技术生成大量的圆形印章图片,并获取图片文字,称为标签;S2、通过整理标签的字符,将其进行统计并输入一个文件中用于制作字符集;S3、对图像和标签进行预处理,使其符合输入网络模型的要求;S4、将预处理过的图像和标签输入网络模型;S5、输出训练完成的网络模型,用于下一步的预测部分;S6:将需要预测的图片按照训练部分的方法进行预处理;本发明提供了一种无须标注文本框训练并且可以一次性识别多行文本,且网络模型简单,识别速度快、识别准确率高的圆形印章文字的方法。
技术领域
本发明涉及图像处理、文字识别技术领域,具体为一种圆形印章文字识别方法。
背景技术
OCR(OpticalCharacterRecognition,光学字符识别)技术已经是现在相当成熟的技术,再各个领域都有应用,但目前的传统的OCR识别技术在对圆形印章文字等弯曲文本的检测识别都是通过先检测旋转的文字框并做一个仿射变换,然后在featuremap上将文字区域抠出来使用crnn等方法识别,这样的方法由于crnn识别方法的限制,只能识别单行文本,所以对检测算法的要求非常高,在印章文本比较密集的情况下文字检测部分可能不够精准,对识别的结果有非常大的影响,而且在训练阶段的数据集标注非常消耗人工成本,所以现在需要一种流程更为简单,标注更为方便,准确率更高的圆形印章文字识别方法。
发明内容
本发明提供一种圆形印章文字识别方法,可以有效解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种圆形印章文字识别方法,包括预测部分与训练部分;其中预测部分包括如下步骤:
S1、制作训练集,收集和使用软件技术生成大量的圆形印章图片,并获取图片文字,称为标签;
S2、通过整理标签的字符,将其进行统计并输入一个文件中用于制作字符集;
S3、对图像和标签进行预处理,使其符合输入网络模型的要求;
S4、将预处理过的图像和标签输入网络模型;
S5、输出训练完成的网络模型,用于下一步的预测部分;
S6:将需要预测的图片按照训练部分的方法进行预处理;
S7:将seq个“<P>”填充如一个空白序列中,并且第一个字符为“<S>”作为data和步骤S6的图像一起输入网络;
S8:网络加载训练部分训练完成的权重模型,执行Encode部分;
S9:执行Decode部分。
优选的,所述步骤S2中包括如下步骤:
S21:统计全部标签中的字符,将其无重复的放入一个文件中,作为字符表,每个字符对应其所在序列的序号,该字符表的意义是,全部能够识别的字符范围全在该字符表中,其他字符不在能够识别范围内,如需扩展字符表,应该扩展图像训练集的字符多样性;
S22:在字符表开头添加几个字符,分别为代表语句开头的“<S>”、代表语句结尾的“<E>”和表示字符填充的“<P>”;
S23:将标签中的所有字符都通过查询字符表替换成对应的序号,以便在后续步骤中输入网络中进行训练。
优选的,所述步骤S3中包括如下步骤:
S31:将收集到的图像训练集转换为灰度图像;
S32:将所有图像尺寸转换为统一尺寸;
S33:将图像由numpy格式转为tensor格式并进行标准化处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉唯理科技有限公司,未经武汉唯理科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911335690.5/2.html,转载请声明来源钻瓜专利网。





