[发明专利]基于Faster R-CNN的自然场景文本检测算法在审
申请号: | 202210275327.4 | 申请日: | 2022-04-14 |
公开(公告)号: | CN114648753A | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 李斌;张信杰;尹芳 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/25;G06V10/46;G06V10/764;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 faster cnn 自然 场景 文本 检测 算法 | ||
本发明针对二阶段算法(R‑CNN)无法有效的检测弯曲文本的缺陷。提出了一种基于FasterR‑CNN的自然场景文本检测算法。首先,在特征提取阶段使用残差网络提取深度特征;其次,结合改进的Inception网络使提取的深度特征更适用于文本检测中长宽比较大的情况;最后,融合无锚框思想对RPN进行改进,将传统的基于区域预测的RPN结构改成基于点预测的anchor‑freeRPN。实验表明,该算法在数据集上比普通的二阶段算法有很好的检测效果。
技术领域
本发明属于目标检测技术领域,主要是对文本检测中的弯曲文本检测进行改进优化。具体是一种基于FasterR-CNN的自然场景文本检测算法,可应用于无人驾驶、智能交通等领域。
背景技术
场景文本检测算法作为目标检测的一个分支,主要分为两大类:单阶段检测方法和二阶段检测方法。单阶段检测方法直接获得文本类别得分和位置坐标,速度快,但是准确度低。二阶段检测方法首先生成候选框然后再进行精细分类,分两步进行检测,速度,但是准确度高。在机器学习、图像处理等领域取得了广泛研究与应用。
到目前为止,已经有很多种检测算法被提出。如R-CNN系列算法,SSD算法,YOLO系列算法等。
2015年何凯明等提出了一种在FastR-CNN基础上添加RPN候选框的检测算法,即:FasterR-CNN算法,该算法性能优越且可优化点多,近几年一直是热门研究内容。
发明内容
首先使用卷积神经网络(CNN)用于文本检测的算法由Jaderberg等提出,该算法通过CNN提取场景图像的深度特征,以此区分文本区域和背景区域。紧接着,R-CNN系列算法也相继问世,该算法通过Selective Search方法从场景图像中提取出多个候选框,将提取出的候选框作为CNN的输入对候选框进行处理,最后将所有候选框经过CNN处理得到的特征输入到支持向量机进行分类,该算法相较于传统算法来说有着更快的检测速度以及更高的检测准确率,但是在使用CNN对候选框的特征提取阶段需要耗费大量时间。因此后续的FastR-CNN使用SPP-Net代替了传统的CNN,使得检测效率大大提高。
在此基础上,FasterR-CNN引入了RPN网络来提取候选框,加快了从场景图像中提取候选框的速度,从而进一步提高了检测效率。Tian等在FasterR-CNN的基础上加入了双向循环神经网络(BRNN),使得水平排列文本的上下信息得到利用。
SSD是一个经典的单阶段目标检测算法。SSD基于预设框(defaultbox)进行目标检测,其网络结构如图1所示,输入图像首先通过卷积网络进行特征提取,在卷积网络中,不同的卷积层经过采样后输出的featuremap尺寸不同,SSD提取了不同尺度的featuremap来做检测,通过在不同尺寸的特征图上分配不同大小的defaultbox,然后对defaultbox进行边框回归(得到边框的中心坐标{x,y}以及宽高{w,h})和分类得到检测结果。
Faster R-CNN是一个出色的两阶段目标检测算法。其内容可以分为四个主要部分:
特征提取:Faster R-CNN使用卷积神经网络进行特征提取,经过基础的卷积层+激活函数层+池化层的逐层操作,提取到输入图片的特征,得到特征图用于后续的区域生成网络和全连接层。
区域生成网络(Region Proposal Networks,RPN):经典的检测方法都非常耗时,如选择性搜索(Selective Search)等。Faster R-CNN抛弃了传统的做法,提出使用区域生成网络用于生成候选区域(proposals)。区域生成网络分为两个分支,一个分支使用softmax分类器对锚框(anchor)进行分类,判断其属于正样本还是负样本。另一分支进行回归计算,即计算每个锚框相对于真实值文本框(groundtruthbox)的偏移量,获得更加精确的候选区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210275327.4/2.html,转载请声明来源钻瓜专利网。