[发明专利]一种基于分割的多尺度特征金字塔文本检测方法有效

专利信息
申请号: 202010138891.2 申请日: 2020-03-03
公开(公告)号: CN111461114B 公开(公告)日: 2023-05-02
发明(设计)人: 高学;韩思怡 申请(专利权)人: 华南理工大学;华南理工大学珠海现代产业创新研究院
主分类号: G06V20/62 分类号: G06V20/62;G06V30/146;G06V30/148;G06V30/18;G06V30/19;G06V10/82
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 王东东
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 分割 尺度 特征 金字塔 文本 检测 方法
【说明书】:

发明公开了一种基于分割的多尺度特征金字塔文本检测方法,包括获取数据;构建金字塔特征提取模型,从获取数据中提取特征;对输入数据进行采样,得到不同尺度的输入图像,然后分别输入金字塔特征提取模型,提取文本特征,再通过多尺度检测网络对不同尺度输入图像的文本特征进行融合,处理后得到特征图,并进行预测;对预测的结果进行处理,得到文本区域的轮廓边界线。本发明具有较强鲁棒性,可以直接应用于自然场景下任意形状的文本检测,实现较高准确率、召回率和F值。

技术领域

本发明属于图像文本分析领域,特别涉及一种基于分割的多尺度特征金字塔文本检测方法。

背景技术

随着计算机视觉技术的发展,图像理解技术的应用越来越广泛。文本作为图像中重要的组成部分,蕴含了丰富的语义信息,是图像理解的关键,准确进行文本检测则是图像中提取关键信息的第一步。自然场景图像的文本检测由于背景的多样性,大小、方向的不确定性,面临着诸多挑战:(1)文本格式的多样性,以及文本行排列的多样性;(2)文本方向多样性(3)文本大小尺寸多样性(4)文本背景多样性。

目前利用深度学习进行文本框检测的方法主要有两种:

(1)利用基于anchor的目标检测框架(Faster R-CNN,SSD,YOLO等),将文本视为一种特殊的物体目标进行检测定位;

(2)基于像素分割的思想,使用全卷积网络模型(FCN),MaskR-CNN等,将文本检测任务转化为分割任务,通过预测像素得到检测结果。

其中,基于anchor的方法由于场景文本尺寸大小的多样性,不同于通用物体固定的长宽比,使得网络对于文本的尺寸不敏感,准确率较低;另外现有的基于anchor的文本检测大多是基于四边形或旋转矩形,针对任意形状的文本则不能进行很好的定位。基于像素分割的方法则容易受到感受野的限制,对小目标检测效果不好,并且对于一些比较接近的文本实例,不能很好地区分边界。

发明内容

为了克服现有技术在自然场景下文本检测方法的不足,本发明利用深度网络模型的特征学习能力和分类性能,结合像素分割的思想,提出一种基于分割的多尺度特征金字塔文本检测方法。

本发明目的通过以下技术方案实现:

一种基于分割的多尺度特征金字塔文本检测方法,包括如下:

获取数据;

构建金字塔特征提取模型,从获取数据中提取特征;

对输入数据进行采样,得到不同尺度的输入图像,然后分别输入金字塔特征提取模型,提取文本特征,再通过多尺度检测网络对不同尺度输入图像的文本特征进行融合,处理后得到特征图,并进行预测;

对预测的结果进行处理,得到文本区域的轮廓边界线。

所述数据为文本检测数据集。

所述构建金字塔特征提取模型,从获取数据中提取特征,具体为:

输入图像经过backbone的数层卷积操作提取特征,得到特征金字塔;

特征金字塔依次通过自顶向下和自底向上两条路径,将回向传递的高层语义信息和经过数层卷积操作被丢失的低层位置信息进行融合,对文本特征进行增强,得到这一阶段的最后特征。

所述特征金字塔依次通过自顶向下和自底向上两条路径,将回向传递的高层语义信息和经过数层卷积操作被丢失的低层位置信息进行融合,对文本特征进行增强,得到这一阶段的最后特征,具体为:

在自顶向下路径中,首先对高层级的特征进行上采样,再通过横向连接获取同级的特征信息,最后进行融合,融合后的特征依次经过一个3*3的卷积核以及一个1*1的卷积核,得到原图大小1/4,1/8,1/16,1/32的特征图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;华南理工大学珠海现代产业创新研究院,未经华南理工大学;华南理工大学珠海现代产业创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010138891.2/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top