[发明专利]文字检测方法、装置、电子设备及存储介质在审

专利信息
申请号: 202010055009.8 申请日: 2020-01-17
公开(公告)号: CN111291759A 公开(公告)日: 2020-06-16
发明(设计)人: 李楠;段晨;刘曦;张睿 申请(专利权)人: 北京三快在线科技有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/62;G06N3/04;G06T7/13
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 任亚娟
地址: 100083 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文字 检测 方法 装置 电子设备 存储 介质
【说明书】:

本申请实施例公开了一种文字检测方法、装置、电子设备及存储介质,该方法包括:将待检测图像输入卷积神经网络,提取多层级特征;根据所述多层级特征,生成金字塔特征;针对所述金字塔特征的每层特征图,提取各个特征点之间的关联关系,得到相关性金字塔特征;确定所述相关性金字塔特征中每层相关性特征图对应的文字边界框;根据每层相关性特征图对应的文字边界框,确定所述待检测图像中的文字边界框。本申请实施例通过提取金字塔特征中每层特征图各个特征点之间的关联关系,得到的相关性金字塔特征中包括了全局信息,从而结合全局信息和局部信息,可以减少特征点回归错误的情况,从而可以提高检测结果的准确性。

技术领域

本申请实施例涉及目标检测技术领域,特别是涉及一种文字检测方法、装置、电子设备及存储介质。

背景技术

文字检测领域中常用的框架都是基于锚点(anchor-based)的,比如CTPN、FasterR-CNN等。基于锚点的检测方法在通过卷积得到的特征图上进行滑窗操作,滑窗的中心点在原图上的映射点称为锚点,以锚点为中心,生成k个不同大小、不同长宽比的目标候选区域。基于锚点的检测方法受锚点的数量,目标候选区域的长宽比及形状的限制,很难进行更深层次的提高。而anchor-free方法摆脱锚点的限制,是对每个特征点进行分类和回归,直接学习目标存在的可能性和边界框(bounding box)的坐标。

目前采用anchor-free检测方法的框架有FCOS,如图1所示,FCOS方法包括四个组件:1)特征提取主干网络,采用卷积神经网络(Convolutional Neural Networks,CNN)和特征金字塔网络(Feature Pyramid Networks,FPN)提取图片特征;2)分类分支,对特征金字塔网络中每层特征图上的特征点进行分类,用于区分是正样本还是负样本;3)回归分支,对分类分支判断为正样本的特征点进行坐标回归,估计目标对象的位置;(4)中心点(Centerness)分支,用于计算每个目标框内的点和目标框中心点的距离,使中心点的预测尽可能位于目标区域的中心。在训练与预测过程中,图片首先进入特征提取主干网络,提取出特征图;然后在每层特征图上通过分类分支、回归分支和中心点分支实现目标的分类与回归。

现有技术直接在金字塔特征的每层特征图上对每个特征点进行分类和回归,容易导致特征点分类回归错误,导致文字检测结果准确性低。

发明内容

本申请实施例提供一种文字检测方法、装置、电子设备及存储介质,有助于提高文字检测结果准确性。

为了解决上述问题,第一方面,本申请实施例提供了一种文字检测方法,包括:

将待检测图像输入卷积神经网络,提取多层级特征;

根据所述多层级特征,生成金字塔特征;

针对所述金字塔特征的每层特征图,提取各个特征点之间的关联关系,得到相关性金字塔特征;

确定所述相关性金字塔特征中每层相关性特征图对应的文字边界框;

根据每层相关性特征图对应的文字边界框,确定所述待检测图像中的文字边界框。

第二方面,本申请实施例提供了一种文字检测装置,包括:

多层级特征提取模块,用于将待检测图像输入卷积神经网络,提取多层级特征;

金字塔特征生成模块,用于根据所述多层级特征,生成金字塔特征;

关联关系提取模块,用于针对所述金字塔特征的每层特征图,提取各个特征点之间的关联关系,得到相关性金字塔特征;

层级边界框确定模块,用于确定所述相关性金字塔特征中每层相关性特征图对应的文字边界框;

检测结果确定模块,用于根据每层相关性特征图对应的文字边界框,确定所述待检测图像中的文字边界框。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010055009.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top