[发明专利]检测区域合并方法、文字识别方法、系统、电子设备及存储介质在审
申请号: | 202110961823.0 | 申请日: | 2021-08-20 |
公开(公告)号: | CN113673516A | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 刘翔 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 洪铭福 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 区域 合并 方法 文字 识别 系统 电子设备 存储 介质 | ||
本申请实施例涉及人工智能,提供了一种检测区域合并方法、文字识别方法、系统、电子设备及存储介质,首先获取目标图像中的多个检测区域的倾斜角度,其次根据倾斜角度的相近程度对多个检测区域进行分类,然后检测每一个类别中的各个检测区域之间的重叠率,相较于传统计算重叠的方法,本方法首先将倾斜角度相近的若干检测区域划分成一类,然后提出了利用各个检测区域之间的重叠率来判断是否发生重叠,这样能够降低计算量,提高重叠判断的效率和质量。最后对重叠率符合设定条件的检测区域进行合并,能够对产生重叠的检测区域进行合并,有效降低因检测框重叠对整体性能带来的影响,本方法使用简单,通用性强,可以应对各种方向分布的文字区域。
技术领域
本申请实施例涉及人工智能技术领域,尤其涉及一种检测区域合并方法、文字识别方法、系统、电子设备及存储介质。
背景技术
在人工智能技术日新月异的今天,各类深度模型在过去无法想象的领域取得了惊人的突破,已然投入到工业应用中,为人们的生产和生活提供了各式各样的便利。以OCR技术为例,图像信息经过目标检测网络得到相应的文字区域,再由文字识别网络将各个区域的文字提取出来,搭配后续的文字处理,语义理解等功能,计算机代替人眼实现了文字阅读这一过程,在提高生产效率的同时,也降低了人力资源的消耗。
作为OCR技术中极为重要的环节之一,文字检测的可靠性直接影响着后续环节的准确率。但在一些文字排布较为密集的场景下,受制于检测模型的实现机制,OCR技术首先会对图像中的文字区域的识别出对应的检测区域,然后对通过检测框的形式标识出每一检测区域,但是对于文字检测的输出结果可能存在部分检测框之间有所重叠的情况,导致最终的识别结果出现重复的文字。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本申请实施例提供了一种检测区域合并方法、文字识别方法、系统、电子设备及存储介质,能够对产生重叠的检测区域进行合并,从而能有效降低因检测框重叠对整体性能带来的影响。
第一方面,本申请实施例提供一种检测区域合并方法,所述方法包括:
获取目标图像中的多个检测区域对应的倾斜角度,其中所述倾斜角度是指所述检测区域与水平或竖直方向之间的倾斜角度;
根据所述倾斜角度的相近程度对所述多个所述检测区域进行分类;
检测每一个类别中的各个所述检测区域之间的重叠率;
将每一个类别中的所述重叠率符合设定条件的所述检测区域进行合并。
在一可选的实现方式中,在所述检测每一个类别中的各个所述检测区域之间的重叠率之前,所述方法还包括:
根据每一个类别中的各个所述检测区域对应的所述倾斜角度,计算平均倾斜角度;
根据每一个类别的所述平均倾斜角度,对该类别中的各个所述检测区域进行旋转。
在一可选的实现方式中,所述检测每一个类别中的各个所述检测区域之间的重叠率,包括:
计算转动所述平均倾斜角度之后的各个所述检测区域对应的边界矩形的顶点坐标;
根据所述顶点坐标计算各个所述检测区域在x轴和y轴上的重叠率,其中所述x轴和所述y轴的原点是所述目标图像的左上顶点。
在一可选的实现方式中,所述重叠率的计算公式包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110961823.0/2.html,转载请声明来源钻瓜专利网。