[发明专利]PSENet网络渐进式扩展后处理出现文本粘连的解决方法在审
申请号: | 202010294908.3 | 申请日: | 2020-04-15 |
公开(公告)号: | CN111401319A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 丛建亭;侯进;黄贤俊 | 申请(专利权)人: | 深源恒际科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/42 |
代理公司: | 北京智沃律师事务所 11620 | 代理人: | 吴志宏 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | psenet 网络 渐进 扩展 处理 出现 文本 粘连 解决方法 | ||
本发明提供了一种PSENet网络渐进式扩展后处理出现文本粘连的解决方法,包括如下步骤:a1.定义一个零图像A作为被融合的小尺寸文本目标图像;a2.从文本目标面积相对最小的kernel图像开始搜索,找出尺寸宽度和高度中的最小值不大于4的文本目标;a3.按照步骤a2的流程进行循环迭代,从最小的kernel图像迭代到文本目标面积相对最大的kernel图像,从而得到图像A的最终值;a4.将图像A与所有的kernel图像分别做下图像或操作,把所有的kernel图像进行修改。本发明实现了降低耗时要求,从而保证了工业应用的计算耗时要求,为人们节省更多时间,同时解决了文本粘连现象,达到了下一步识别模块的识别效果要求,并且本发明构思独特,想法新颖,具有可操作性。
技术领域
本发明涉及深度学习技术领域,具体来说,涉及PSENet网络渐进式扩展后处理出现文本粘连的解决方法。
背景技术
与其他物体检测技术手段大致相同,文字检测的深度学习技术多数也是anchor-base模式,该模式衍生到OCR领域就有很多缺陷,比如:倾斜(或扭曲)文字检测不准、过长文字串检测不全、过短文字串容易遗漏、距离较近的无法分开等缺点。
形状鲁棒性文本检测面临的问题主要有两个方面:1)现有的基于四边形边界盒的文本检测方法很难找到任意形状的文本,很难完全封闭在矩形中;2)大多数基于像素的分割检测器可能不会将彼此非常接近的文本实例分开。
PSENet是一种新的实例分割网络,它有两方面的优势。首先,PSENet作为一种基于分割的方法,能够对任意形状的文本进行定位。其次,该模型提出了一种渐进的尺度扩展算法,该算法可以成功地识别相邻文本实例。
该方法对任意形状具有鲁棒性,最新的结果是ICDAR2015和ICDAR2017,MLT基准进一步证实了PSENet的巨大有效性。但该方法的渐进式尺寸扩展后处理过程运算速度比较慢,为了提升模型的预测速度,通常采用方案是将模型预测后的输出图的尺寸做降采样,例如scale等于2或scale等于4,才可以达到工业耗时应用要求,但在降采样过程中,最邻近插值方法有一定概率会将宽度或高度不大于1或2的文本目标丢失掉,从而导致渐进式尺寸扩展后处理过程出现其它文本目标粘连了丢失目标文本的现象,急需一种既可以让模型预测速度提升,也不带来降采样出现的文本粘连现象的方法出现。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
本发明的目的在于提供了一种PSENet网络渐进式扩展后处理出现文本粘连的解决方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
PSENet网络渐进式扩展后处理出现文本粘连的解决方法,包括如下步骤:
a1.定义一个零图像A作为被融合的小尺寸文本目标图像;
a2.从文本目标面积相对最小的kernel图像开始搜索,找出尺寸宽度和高度中的最小值不大于4的文本目标;
a3.按照步骤a2的流程进行循环迭代,从最小的kernel图像迭代到文本目标面积相对最大的kernel图像,从而得到图像A的最终值;
a4:将图像A与所有的kernel图像分别做下图像或操作,把所有的kernel图像进行修改。
进一步地,所述步骤a1中的图像尺寸与PSENet网路的各个kernel图像尺寸相同。
进一步地,步骤a3中图像A位置处的像素和等于0时,将步骤a3中最小的kernel图像中的这类文本目标的像素赋值到图像A中。
进一步地,所述PSENet网络是基于分割的检测器,对每个文本实例进行多个预测的网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深源恒际科技有限公司,未经深源恒际科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010294908.3/2.html,转载请声明来源钻瓜专利网。