[发明专利]一种基于深度学习文字角度识别方法在审
申请号: | 202111234038.1 | 申请日: | 2021-10-22 |
公开(公告)号: | CN113963356A | 公开(公告)日: | 2022-01-21 |
发明(设计)人: | 石朵伟;陈淑华 | 申请(专利权)人: | 深圳前海环融联易信息科技服务有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/148 |
代理公司: | 深圳市中科创为专利代理有限公司 44384 | 代理人: | 谢志龙;徐方星 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 文字 角度 识别 方法 | ||
本发明公开一种基于深度学习文字角度识别方法,本发明通过根据字体、颜色、旋转类别以及仿射变换生成数据集,并将数据集按一定比例划分为训练数据集以及测试数据集,通过ResNet50网络多层卷积从特征较少的单个汉字中提取汉字图像的高阶特征,从而深度学习对验证图像中的文字进行识别,大大提高验证图像中文字的OCR识别精度。
技术领域
本发明涉及OCR文字识别技术领域,尤其涉及一种基于深度学习文字角度识别方法。
背景技术
OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。现在很多网站的登录过程中,基本需要输入验证码图像中的文字或数字以进行验证。这些文字或数字通常会进行一定角度的旋转,以避免被人工以外的方式进行自动化识别。因此,类似验证码图像中文字识别的技术,也是OCR文字识别领域中的难点之一。验证码图像中包含任意角度的单个汉字,直接对单个汉字图像进行OCR识别会影响汉字识别精度。因此在进行OCR文字识别之前,需要对单个汉字图像进行文字角度识别并对该图像进行图像旋转获得矫正后的图像。现有技术一般是利用点和线之间的对偶关系,将图像空间中的离散点转化为霍夫空间的曲线ρ=x1cosθ+y1 sinθ,并将曲线交点作为所述直线方程的参数,对参数进行统计。识别待检测图像的文字角度,拟合直线,并统计所述直线的斜率,依据众数方向θ作为图片的矫正方向。由于单字图像特征较小,对参数无法进行大量数据统计,角度检测效果较差。
因此,现有技术存在缺陷,需要改进。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于深度学习文字角度识别方法。
本发明的技术方案如下:提供一种基于深度学习文字角度识别方法,包括如下步骤:
步骤1:生成数据集;
步骤2:对生成的数据集进行划分;
步骤3:选用训练学习用的分类模型、优化器以及损失函数;
步骤4:设置识别模型的各项学习参数,根据所设定的参数进行迭代学习,直到损失函数值下降非常缓慢;
步骤5:完成训练,得到最终字体图像旋转分类模型。
进一步地,所述步骤1中数据集的具体生成方法为:选用3500个常用汉字,每个汉字用不同字体、不同颜色、不同旋转角度类别、以及不同仿射变换随机生成数据集。
进一步地,所述步骤2的具体步骤为:将生成的数据集按比例划分成训练数据集以及测试数据集,训练数据集在生成的数据集中的占比为75%-90%。
进一步地,所述步骤3的具体步骤如下:
步骤3.1:选用ResNet50卷积神经网络模型作为字体角度分类模型;
步骤3.2:选用Adam优化器作为汉字旋转角度识别模型训练的优化器;
步骤3.3:选用交叉熵损失函数作为汉字旋转角度识别模型训练的损失函数。
进一步地,所述步骤4中的学习参数包括:基础学习率、批次大小、Adam优化器参数以及最大迭代次数。
采用上述方案,本发明通过根据字体、颜色、旋转类别以及仿射变换生成数据集,并将数据集按一定比例划分为训练数据集以及测试数据集,通过ResNet50网络多层卷积从特征较少的单个汉字中提取汉字图像的高阶特征,从而深度学习对验证图像中的文字进行识别,大大提高验证图像中文字的OCR识别精度。
附图说明
图1为本发明的流程框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海环融联易信息科技服务有限公司,未经深圳前海环融联易信息科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111234038.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:血管介入器械推送装置及方法
- 下一篇:一种耐盐碱植物的筛选方法