[发明专利]光学字符快速识别方法及系统有效
| 申请号: | 202110584533.9 | 申请日: | 2021-05-27 |
| 公开(公告)号: | CN113343967B | 公开(公告)日: | 2022-10-25 |
| 发明(设计)人: | 王琳;李小宁;张帆;王正中;耿世超;储敬;李昱 | 申请(专利权)人: | 山东师范大学 |
| 主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/25;G06V30/146 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
| 地址: | 250014 *** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 光学 字符 快速 识别 方法 系统 | ||
1.光学字符快速识别方法,其特征是,包括:
获取待处理图像;对待处理图像进行预处理;具体包括:将待处理图像的长和宽均处理成N的倍数,N为设定值,N为整数;得到第一处理图像;对第一处理图像进行降采样处理,得到第二处理图像;对第二处理图像进行标准化处理Normalization,得到标准化处理后的图像;
将预处理后的图像进行文本检测,得到含有矩形文字包围框的图像;
对矩形文字包围框内的矩形文字区域进行文本识别,得到识别文本;
对识别后的文本进行文本规整,得到规整后的文本;具体包括:
(1)对识别出的所有文本特征,提取每一列所有识别文本特征中每个识别文本特征的横坐标;其中,以整个图像左上角的点作为坐标原点,以水平方向作为坐标横轴,以垂直方向作为坐标纵轴,将每个识别文本特征的矩形文字包围框的左上角点在整个图像内的横坐标,作为当前识别文本特征的横坐标;
(2)给定第一阈值;按照从上往下顺序提取每一列的相邻两行的识别文本特征;
(3)判断每一列中相邻两行两个识别文本特征的横坐标差值是否大于设定第一阈值,若大于,则回到(2);否则,保存每一列的识别文本特征以及其纵坐标;然后进入(4);
(4):得到各列项的文本数据以后,提取每一行所有识别文本特征中每个识别文本特征的纵坐标;
(5):给定第二阈值,并按照从左到右的顺序,依次选取(3)所保存的每一行的相邻两列的识别文本特征;
(6):判断每一行中相邻两个识别文本特征的纵坐标差是否大于第二阈值,若大于则回到(5),否则保存组合后的各横行文本数据;
对规整后的文本,进行文本纠正,得到最终光学字符识别结果;具体包括:
将识别出的文本数据,与数据库中的文本之间的莱文斯坦比;其中,所述数据库中预存储若干个文本数据;
判断莱文斯坦比是否超出设定阈值;如果超出设定阈值,则将莱文斯坦比最大值对应的数据库中的文本作为最匹配文本输出;
如果小于设定阈值,则将识别出的文本作为新的文本补充到数据库中。
2.如权利要求1所述的光学字符快速识别方法,其特征是,将预处理后的图像进行文本检测,得到含有矩形文字包围框的图像;具体包括:
采用Differentiable Binarization文本检测算法,对预处理后的图像进行文本检测,得到含有矩形文字包围框的图像。
3.如权利要求1所述的光学字符快速识别方法,其特征是,对矩形文字包围框内的矩形文字区域进行文本识别,得到识别文本;具体包括:
采用训练后的CRNN网络模型,对矩形文字包围框内的矩形文字区域进行文本识别,得到文本识别结果;
所述文本识别结果,包括若干个识别文本特征,每个识别文本特征,包括:数字、数值范围或由文字组成的词汇。
4.如权利要求1所述的光学字符快速识别方法,其特征是,对第一处理图像进行降采样处理,得到第二处理图像;具体包括:对第一处理图像进行五次两倍降采样处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110584533.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种行道树保温层捆扎装置
- 下一篇:一种保温防震螺杆真空泵





