[发明专利]图像文本方向分类方法、装置、设备及存储介质在审
申请号: | 202110232357.2 | 申请日: | 2021-03-02 |
公开(公告)号: | CN112766418A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 杨帆;杨兆斌;车成富 | 申请(专利权)人: | 阳光财产保险股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/20;G06K9/32 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 衡滔 |
地址: | 101100 北京市通*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 文本 方向 分类 方法 装置 设备 存储 介质 | ||
本申请提供一种图像文本方向分类方法、装置、设备及存储介质,方法包括:获取已标注文本图像样本集合;根据已标注文本图像样本集合生成文本检测模型;根据已标注文本图像样本集合生成图像文本方向二分类模型;将输入图像输入文本检测模型,得到文本字段外接矩形框集合;从文本字段外接矩形框集合中筛选预设数量的外接矩形框,根据外接矩形框的宽高比获取输入图像中的文本的初步方向;初步方向为横向或纵向;根据外接矩形框的坐标从输入图像中裁剪得到对应的预测文本串图像集合;将预测文本串图像集合中的图像输入图像文本方向二分类模型,得到预测文本串图像二分类方向集合;根据预测文本串图像二分类方向集合和初步方向获取输入图像的文本方向。
技术领域
本申请涉及图像识别技术领域,具体而言,涉及一种图像文本方向分类方法、装置、设备及存储介质。
背景技术
目前,随着图像识别技术的发展,自动识别文本已经成为可能,文本利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。自动识别文本技术使得人们在生产和生活中需要处理大量的文字、报表和文本等场景下减轻人们的劳动,提高处理效率。
在各种实际的应用场景中,需要对大量的文本图像文件进行内容核验,而相当一部分文本图像文件并非水平方向,而是存在各个方向的旋转,主要包还含90度,180度,270度等方向,目前大量的机器学习算法在识别文本内容时都需要文本图像按照预定角度范围输入,因此在进行文本识别前需要首先对图像文本进行矫正,而已有的文本方向自动矫正算法都存在一定的精度损失,精度提升存在瓶颈,需要一定的人工介入矫正,浪费大量时间。
发明内容
本申请实施例的目的在于提供一种图像文本方向分类方法、装置、设备及存储介质。
第一方面,本申请实施例提供了一种图像文本方向分类方法,所述方法包括:
获取已标注文本图像样本集合;
根据所述已标注文本图像样本集合生成文本检测模型;
根据所述已标注文本图像样本集合生成图像文本方向二分类模型;
将输入图像输入所述文本检测模型,得到文本字段外接矩形框集合;
从所述文本字段外接矩形框集合中筛选预设数量的外接矩形框,根据所述外接矩形框的宽高比获取所述输入图像中的文本的初步方向;
所述初步方向为横向或纵向;
根据所述外接矩形框的坐标从输入图像中裁剪得到对应的预测文本串图像集合;
将所述预测文本串图像集合中的图像输入所述图像文本方向二分类模型,得到预测文本串图像二分类方向集合;
根据所述预测文本串图像二分类方向集合和所述初步方向获取所述输入图像的文本方向。
在上述实现过程中,分别建立了文本检测模型和图像文本方向二分类模型,所述文本检测模型和所述图像文本方向二分类模型是整个算法的关键。所述文本检测模型能对四个方向(0度,90度,180度,270度)的文本进行有效检测,所述图像文本方向二分类模型的输出结果准确率高,使整个模型的性能提升。将输入图像输入到所述文本检测模型之后得到文本字段外接矩形框集合,根据所述外接矩形框的宽高比,初步判定输入图像为横向或者纵向。所述外接矩形框集合还能有效地从输入图像中进一步获取所需要的预测文本串图像集合,最后将预测文本串图像输入所述图像文本方向二分类模型,通过图像文本方向二分类模型的二分类作用能得到预测文本串图像二分类方向集合,结合对所述输入图像的初步判定的结果,最终通过分析能判断出输入图像文本方向。
进一步地,在第一方面的一种可能的实施方式中,所述已标注文本图像样本集合中每张图像文本方向均为0度,且对应标注信息,所述标注信息包括文本字段外接矩形框位置坐标;
所述根据所述已标注文本图像样本集合生成文本检测模型包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阳光财产保险股份有限公司,未经阳光财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110232357.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序