[发明专利]文字检测方法、装置以及终端有效
申请号: | 201910593977.1 | 申请日: | 2019-07-02 |
公开(公告)号: | CN110309824B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 章成全 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/34 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 王珺;徐瑞红 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 检测 方法 装置 以及 终端 | ||
本发明实例提出一种文字检测方法、装置以及终端,方法包括:获取包含有待检测文字的图像中的至少一条文字区域中心线;根据各文字区域中心线像素所在检测框的顶点偏移量,得到第一中心点;根据各文字区域中心线上的像素点和与各文字区域中心线像素所在检测框的中心偏移量,得到第二中心点;判断第一中心点与所述第二中心点之间的距离是否小于阈值,若是,则将第二中心点合并于所述第一中心点上,得到文字区域实例分割结果;根据文字区域实例分割结果和各文字区域中心线对应的文字边界区域偏移量,得到文字检测结果。使得检测速度加快,满足实时应用场景,同时还能够解决不规则文字和任意弯曲文字的检测问题。
技术领域
本发明涉及文字检测技术领域,尤其涉及一种文字检测方法、装置以及终端。
背景技术
在自然场景下中的文字会有多样的形态,除了水平、竖直、倾斜这几种常见的形态以外,还会有弯曲、波浪式等形态。文字检测和识别一直是计算机视觉领域中诸多学者研究的热门课题。随着深度学习时代的变革,OCR(Optical Character Recognition,光学字符识别)检测方法,由传统的单字检测出发到向基于卷积神经网络直接输出整个文本行包围盒的检测方法转变。
OCR文字检测方法可以分为三大类:基于字符或部件组合方法,基于文本行检测方法,以及基于语义分割方法。基于字符或部件组合的方法往往需要先检测文字的基本组成部件字符或者笔画出发,然后设计先验的聚合规则将隶属于同一个文本行的字符或部件组合成在一起。这种做法由于是多步骤实现且引入过多的先验规则,精度一般比较低且可维护性差。基于文本行检测方法是受通用目标检测的启发,将文字作为一种特定的目标,针对文字的特性对神经网络进行了改良。上述三种方法可以从端到端,一步到位直接输出文字区域的包围盒,而且训练和预测流程都相对比较简单。基于检测方法的检测器对于规则形态的文字(水平或倾斜)检测能力比较好,但是对于复杂场景下的任意形状(弯曲或波浪等)的文字区域无法很好给出准确的几何表示。基于分割的方法将文字区域的检测作为语义分割的问题。这一类方法从像素细粒度级别出发把落在文字条内部的像素标记为1,背景区域标记为0,该方法可以较好地对任意形状的文字进行相应。但仍然存在两个比较突出的问题:(1)距离较近的文字区域很容易发生粘连,不利于后续的文字条实例的分割。上述方法要么选择响应文本条的中心线,要么增加文本边界类别来辅助分割出每个文字实例。(2)这类方法严重依赖于模型在像素级别(细粒度)的区分能力。如果响应不连续有断续或者效果不佳,往往会带来精度的严重损耗,因此对与主体网络的表征能力的提升显得尤为重要。另外,上述方法一般是由计算机视觉领域通用的语义分割框架发展而来,是一种多阶段的方法。计算量与其区域建议网络的输出结果密切相关,且存在较多的重复计算。因此,该类方法虽然对自然场景下任意形状的文字可以较好地检测,但模型结构复杂、运算量大、速度较慢,难以满足实时应用场景。
发明内容
本发明实施例提供一种文字检测方法、装置以及终端,以解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种文字检测方法,包括:
获取包含有待检测文字的图像中的至少一条文字区域中心线;
根据各文字区域中心线像素所在检测框的顶点偏移量,得到第一中心点;
根据各文字区域中心线上的像素点和与各文字区域中心线像素所在检测框的中心偏移量,得到第二中心点;
判断所述第一中心点与所述第二中心点之间的距离是否小于阈值,若是,则将所述第二中心点合并于所述第一中心点上,得到文字区域实例分割结果;
根据所述文字区域实例分割结果和各文字区域中心线对应的文字边界区域偏移量,得到文字检测结果。
在一种实施方式中,获取包含有待检测文字的图像中至少一条文字区域中心线,包括:
将包含有待检测文字的图像输入至特征提取网络模型中,输出图像特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910593977.1/2.html,转载请声明来源钻瓜专利网。