[发明专利]光学字符快速识别方法及系统有效
| 申请号: | 202110584533.9 | 申请日: | 2021-05-27 |
| 公开(公告)号: | CN113343967B | 公开(公告)日: | 2022-10-25 |
| 发明(设计)人: | 王琳;李小宁;张帆;王正中;耿世超;储敬;李昱 | 申请(专利权)人: | 山东师范大学 |
| 主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/25;G06V30/146 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
| 地址: | 250014 *** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 光学 字符 快速 识别 方法 系统 | ||
本公开公开了光学字符快速识别方法及系统,包括:获取待处理图像;对待处理图像进行预处理;将预处理后的图像进行文本检测,得到含有矩形文字包围框的图像;对矩形文字包围框内的矩形文字区域进行文本识别,得到识别文本;对识别后的文本进行文本规整,得到规整后的文本;对规整后的文本,进行文本纠正,得到最终光学字符识别结果。该方法将识别出的所有数据进行排列组合以及纠正,最终获取所需文本数据。
技术领域
本公开涉及文字检测和识别技术领域,特别是涉及光学字符快速识别方法及系统。
背景技术
本部分的陈述仅仅是提到了与本公开相关的背景技术,并不必然构成现有技术。
OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
发明人发现,现有的光学字符识别技术的识别准确率很低,识别速度很慢。
发明内容
为了解决现有技术的不足,本公开提供了光学字符快速识别方法及系统;该方法能够保证文字识别在正方向上就能达到很高的准确率,同时尽可能提高检测识别过程的性能。该方法采用了DB算法在识别之前进行文本检测,保证其准确率。同时,利用CRNN算法对检测后的图片进行识别。最后利用文本纠正算法提升OCR的识别准确率。
第一方面,本公开提供了光学字符快速识别方法;
光学字符快速识别方法,包括:
获取待处理图像;对待处理图像进行预处理;
将预处理后的图像进行文本检测,得到含有矩形文字包围框的图像;
对矩形文字包围框内的矩形文字区域进行文本识别,得到识别文本;
对识别后的文本进行文本规整,得到规整后的文本;
对规整后的文本,进行文本纠正,得到最终光学字符识别结果。
第二方面,本公开提供了光学字符快速识别系统;
光学字符快速识别系统,包括:
预处理模块,其被配置为:获取待处理图像;对待处理图像进行预处理;
文本检测模块,其被配置为:将预处理后的图像进行文本检测,得到含有矩形文字包围框的图像;
文本识别模块,其被配置为:对矩形文字包围框内的矩形文字区域进行文本识别,得到识别文本;
文本规整模块,其被配置为:对识别后的文本进行文本规整,得到规整后的文本;
文本纠正模块,其被配置为:对规整后的文本,进行文本纠正,得到最终光学字符识别结果。
第三方面,本公开还提供了一种电子设备,包括:
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,
其中,所述计算机可读指令被所述处理器运行时,执行上述第一方面所述的方法。
第四方面,本公开还提供了一种存储介质,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行第一方面所述方法的指令。
与现有技术相比,本公开的有益效果是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110584533.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种行道树保温层捆扎装置
- 下一篇:一种保温防震螺杆真空泵





