[发明专利]文本检测方法、装置、电子设备和存储介质在审
申请号: | 202211304464.2 | 申请日: | 2022-10-24 |
公开(公告)号: | CN115620297A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 王努 | 申请(专利权)人: | 平安国际融资租赁有限公司 |
主分类号: | G06V30/146 | 分类号: | G06V30/146;G06V30/412 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 尹倩倩 |
地址: | 200131 上海市浦东新区中国(上海)*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 装置 电子设备 存储 介质 | ||
本发明涉及一种文本检测方法、装置、电子设备和存储介质,涉及文本检测技术领域,方法包括:获取待检测图像,待检测图像包括文本信息;基于待检测图像,得到覆盖文本信息的第一文本框;根据第一文本框的参数和预设的第一缩放系数和第一缩放公式,得到第二文本框;根据第一文本框的参数、第二文本框的参数和预设的第一缩放系数,得到第二缩放系数;根据第二文本框的参数、第二缩放公式和第二缩放系数,得到第三文本框;对第三文本框中的文本信息进行检测,得到检测结果。上述方法可以使得检测过程中对于不同长度的文本框,都能得到与其相适应的第二缩放系数,从而得到更加合理的文字检测框,提升文字识别的准确率。
技术领域
本申请涉及文本检测技术领域,尤其涉及一种文本检测方法、装置、电子设备和存储介质。
背景技术
光学字符识别(optical character recognition,OCR)可用于检测任意形状的文本,并且后处理简单,速度快。
目前,对文本进行检测的主流方法是采用DBNet基于分割的OCR文本检测算法,例如在保单、财报、法律文书等相关文书报表类OCR任务中,会遇到对规则长文本的文字检测需求,然而,在对现有技术的研究与实践中,本发明的发明人发现,目前业内开源的DB算法针对长文本检测对于不同长宽比的文本,都使用固定的参数,会导致对不同长宽比的文本检测效果差异性很大,例如当对短文本进行识别的文本框大小正合适时,会导致长文本的文本框较紧凑,严重时可能会导致长文本行的截断,影响后续文字内容的识别精度。
发明内容
有鉴于此,本申请的目的在于提出一种文本检测方法、装置、电子设备和存储介质,本申请能够针对性的解决现有的问题。
基于上述目的,第一方面,本申请提出了一种文本检测方法,所述方法包括:获取待检测图像,所述待检测图像包括文本信息;基于所述待检测图像,得到覆盖所述文本信息的第一文本框;根据所述第一文本框的参数和预设的第一缩放系数和第一缩放公式,得到第二文本框;根据所述第一文本框的参数、所述第二文本框的参数和预设的第一缩放系数,得到第二缩放系数;根据所述第二文本框的参数、第二缩放公式和所述第二缩放系数,得到第三文本框;对所述第三文本框中的文本信息进行检测,得到检测结果。
可选地,所述基于所述待检测图像,得到覆盖所述文本信息的第一文本框,包括:将所述待检测图像转化为灰度图;对所述灰度图进行二值化处理,得到二值化图像;根据所述二值化图像中文本信息的轮廓,得到所述第一文本框。
可选地,所述根据所述第一文本框的参数和预设的第一缩放系数和第一缩放公式,得到第二文本框包括:根据所述第一文本框的参数、所述第一缩放系数和所述第一缩放公式,得到第一距离;将所述第一文本框向内缩小所述第一距离,得到所述第二文本框。
可选地,所述第一文本框的参数包括第一文本框的宽高比、第二文本框的参数包括第二文本框的宽高比,所述根据所述第一文本框的参数、所述第二文本框的参数和预设的第一缩放系数,得到第二缩放系数,包括:计算所述第一文本框的宽高比与所述第二文本框的宽高比和所述第一缩放系数之间的关联关系;根据所述第二缩放公式和所述第一文本框的宽高比与所述第二文本框的宽高比和所述第一缩放系数之间的关联关系,得到所述第二缩放系数。
可选地,所述计算所述第一文本框的宽高比与所述第二文本框的宽高比和所述第一缩放系数之间的关联关系,包括:根据第一缩放公式以及所述第一文本框和第二文本框的几何关系,得到所述第一文本框的宽高比与所述第二文本框的宽高比和所述第一缩放系数之间的关联关系。
可选地,所述方法包括:在所述第三文本框的参数等于所述第一文本框的参数的情况下,根据所述第二缩放公式和所述第一文本框的宽高比与所述第二文本框的宽高比和所述第一缩放系数之间的关联关系,得到所述第二缩放系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际融资租赁有限公司,未经平安国际融资租赁有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211304464.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:脉冲神经网络训练方法、装置以及终端
- 下一篇:一种洗背机工作方法