[发明专利]一种图像文本检测与OCR识别方法、装置及存储介质在审
申请号: | 202111118174.4 | 申请日: | 2021-09-22 |
公开(公告)号: | CN113837168A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 陈坤龙;吴梁斌;章瑶;吕建进 | 申请(专利权)人: | 易联众智鼎(厦门)科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06K9/46;G06T3/40 |
代理公司: | 厦门加减专利代理事务所(普通合伙) 35234 | 代理人: | 杨泽奇;李强 |
地址: | 361008 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 文本 检测 ocr 识别 方法 装置 存储 介质 | ||
本发明涉及数据识别技术领域,特别涉及一种图像文本检测与OCR识别方法、装置及存储介质,其中方法包括以下步骤:对图片进行预处理获得训练数据;提取训练数据的初步特征得到返回结果并根据返回结果搭建训练网络;训练模型调用训练网络对训练数据进行训练以获得若干文本分割实例;通过分水岭分割方法对若干文本分割实例进行处理完成检测识别;通过上述步骤,且通过分水岭分割方法对若干文本分割实例进行后处理,有效将算法时间复杂度降低到O(N),解决了采用PSENet算法流程中的广度优先算法,对各文本分割实例进行逐像素的四邻域搜索与合并,会导致在该检测阶段的算法时间复杂度达到O(N2),检测速度慢、效率低的问题,从而提高了图像处理速度、加快了效率。
技术领域
本发明涉及数据识别技术领域,特别涉及一种图像文本检测与OCR识别方法、装置及存储介质。
背景技术
深度学习OCR方法的核心思想基本沿用深度目标检测算法策略,渐进式扩展网络PSENet是一种基于实例分割的方法,采用基于CNN的backbone进行图像特征提取,然后采用类似空间金字塔的网络对特征图像进行一系列特征下采样、特征融合与上采样操作,得到一组预定义数量的文本分割实例,最后采用广度优先算法对文本实例进行区域连通。
CN110008950A的专利《一种对形状鲁棒的自然场景中文本检测的方法》,申请公布日为2019.07.12,公开了一种对形状鲁棒的自然场景中文本检测的方法,包括如下步骤:步骤1,对文本数据集中的训练图片进行预处理;步骤2,搭建PSENet进步式尺度生长网络,利用所述进步式尺度生长网络完成对训练图片的特征提取、特征融合以及分割预测,得到多个预测尺度的分割结果;步骤3,对步骤2中搭建的PSENet进步式尺度生长网络进行监督训练得到检测器模型;步骤4,对待检测图片进行检测;步骤5,使用尺度生长算法得到最终检测结果。
然而对于文本检测目标较多,并且存在文本区域错位与重叠对现象的图像,采用PSENet算法流程中的广度优先算法,对各文本分割实例进行逐像素的四邻域搜索与合并,会导致在该检测阶段的算法时间复杂度达到O(N2),检测速度慢、效率低。
发明内容
为解决采用PSENet算法流程中的广度优先算法,对各文本分割实例进行逐像素的四邻域搜索与合并,会导致在该检测阶段的算法时间复杂度达到O(N2),检测速度慢、效率低的问题。
本发明提供的一种图像文本检测与OCR识别方法,包括以下步骤:
对图片进行预处理获得训练数据;
提取所述训练数据的初步特征得到返回结果并根据所述返回结果搭建训练网络;
训练模型调用所述训练网络对所述训练数据进行训练以获得若干文本分割实例;
通过分水岭分割方法对若干所述文本分割实例进行处理完成检测识别。
进一步的,在一个优选实施例中,标注图片的文本区域,标注有所述文本区域的图片为原始文本坐标标签;对所述原始文本坐标标签进行处理生成若干形状相似、中心点相同但尺寸不同的文本分割核作为所述训练网络的训练数据。
进一步的,在一个优选实施例中,所述训练网络为PSENet forward网络;
通过加载特征提取模型提取所述训练数据的初步特征得到返回结果并将所述返回结果输入PSEnet forward网络,按照top-down方式进行特征空间金字塔网络搭建PSENetforward网络。
进一步的,在一个优选实施例中,训练模型调用所述训练网络对所述训练数据进行训练以获得若干文本分割实例包括以下步骤:
训练准备:设置超参数、选择优化器,设置所述训练数据读入所述训练模型的方式;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易联众智鼎(厦门)科技有限公司,未经易联众智鼎(厦门)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111118174.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序