[发明专利]基于弱监督的字符检测器训练方法、装置、系统及介质有效
| 申请号: | 201711460633.0 | 申请日: | 2017-12-28 |
| 公开(公告)号: | CN108052937B | 公开(公告)日: | 2019-05-31 |
| 发明(设计)人: | 章成全;刘家铭;韩钧宇;丁二锐 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34 |
| 代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 张臻贤;徐瑞红 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 监督 字符 检测器 训练 方法 装置 系统 介质 | ||
本发明提出一种基于弱监督的字符检测器训练方法、装置、文字检测系统及计算机可读存储介质,其中基于弱监督的字符检测器训练方法包括:输入待处理对象的粗粒度标注信息,粗粒度标注信息包括待处理对象的基于词、文本条和/或行的标注信息;对粗粒度标注信息的多边形进行分割,获得所述待处理对象的字符的粗包围盒;根据粗粒度标注信息,通过神经网络模型获得所述待处理对象的字符的预测包围盒;根据粗包围盒和所述预测包围盒确定所述待处理对象的字符的精细包围盒,将所述精细包围盒的标注信息作为所述待处理对象的字符标注。本发明提供的实施例能够使文字字符检测器利用更多的文字检测数据集进行训练,使模型在字符级别的检测精度显著提高。
技术领域
本发明涉及信息技术领域,尤其涉及一种基于弱监督的字符检测器训练方法、装置、文字检测系统及计算机可读存储介质。
背景技术
在OCR(Optical Character Recognition,光学字符识别)文字检测和识别领域中,由于单个字符级别标注方式(如字符位置的标注)所需花费的人力和物力非常巨大,所以现有的开源的一些真实场景数据集合倾向于标注整个词或者文本条的整体外包围轮廓和整词、整条的文本信息。这样的标注方式,一定程度上缓解了标注的难度和成本,但是也带来了一些负面的影响,如使得一些经典的基于字符级别的文字检测方法没法有效地在这些基于词、文本条标注的真实场景数据上进行训练和调整。从视觉的角度出发,无论语种如何变化,字符是文字的最基准单元。基于字符单元出发的文字检测方法,更容易构建通用场景下(包含水平、多方向、扭曲和透射等)的文字检测引擎。因此根据现有的标注数据集中基于词、文本条或行标注信息自动生成字符标注信息是目前需要解决的问题。
发明内容
本发明实施例提供一种基于弱监督的字符检测器训练方法、装置、文字检测系统及计算机可读存储介质,以至少解决现有技术中的以上技术问题。
第一方面,本发明实施例提供了一种基于弱监督的字符检测器训练方法,包括:输入待处理对象的粗粒度标注信息,所述粗粒度标注信息包括待处理对象的基于词、文本条和/或行的标注信息;对所述粗粒度标注信息的多边形进行分割,获得所述待处理对象的字符的粗包围盒;根据所述粗粒度标注信息,通过神经网络模型获得所述待处理对象的字符的预测包围盒;根据所述粗包围盒和所述预测包围盒确定所述待处理对象的字符的精细包围盒,将所述精细包围盒的标注信息作为所述待处理对象的字符标注。
结合第一方面,本发明在第一方面的第一种实施方式中,所述基于词、文本条和/或行的标注信息为词、文本条和/或行的整体外包围轮廓,所述整体外包围轮廓包括多边形或矩形框。
结合第一方面,本发明在第一方面的第二种实施方式中,对所述粗粒度标注信息的多边形进行分割,获得所述待处理对象的字符的粗包围盒,包括:将所述粗粒度标注信息的多边形进行N等分,其中,与所述多边形的长轴垂直的方向为分割线的方向,N为所述粗粒度标注信息中的字符个数,或者N为所述多边形长轴长度除以最短边长度的商的四舍五入式取整数值。
结合第一方面,本发明在第一方面的第三种实施方式中,根据所述粗包围盒和所述预测包围盒确定所述待处理对象的字符的精细包围盒,包括:判断第一条件和第二条件是否同时满足,所述第一条件为所述预测包围盒的置信度大于预设的置信度阈值,所述第二条件为所述粗包围盒和所述预测包围盒的交叠比大于预设的交叠比阈值;若所述第一条件和所述第二条件同时满足,则根据所述预测包围盒调整所述粗包围盒,生成所述精细包围盒;若所述第一条件不满足或所述第二条件不满足,则将所述粗包围盒赋值给所述精细包围盒。
结合第一方面的第二种实施方式,本发明在第一方面的第四实施方式中,根据所述预测包围盒调整所述粗包围盒,生成所述精细包围盒,包括:判断所述粗粒度标注信息的多边形长轴与横轴的夹角是否小于等于45°;若是则将所述粗包围盒的上下边界作为所述精细包围盒的上下边界,将所述预测包围盒的左右边界作为所述精细包围盒的左右边界;若否则将所述粗包围盒的上下边界作为所述精细包围盒的左右边界,将所述预测包围盒的左右边界作为所述精细包围盒的上下边界。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711460633.0/2.html,转载请声明来源钻瓜专利网。





