[发明专利]文本检测方法、装置、电子设备及计算机可读存储介质有效
申请号: | 202110821804.8 | 申请日: | 2021-07-21 |
公开(公告)号: | CN113269280B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 秦勇 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06N3/04 |
代理公司: | 北京北汇律师事务所 11711 | 代理人: | 马亚坤 |
地址: | 100086 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本公开提供了一种文本检测方法、装置电子设备及计算机可读存储介质,包括:获取待检测文本图像;获取待检测文本图像的第一特征映射;将第一特征映射输入至特征金字塔增强模块,生成第二特征映射;对第二特征映射进行第一卷积处理,生成预测目标的中心点得分图;将中心点得分图与所述第一特征映射逐通道逐点相乘,得到一组合并特征映射;对一组合并特征映射进行第二卷积处理,生成预测目标的定位得分图;根据目标的定位得分图定位预测目标的中心点;根据中心点定位文本框。通过本公开提升了密集文本检测的速度和精度。
技术领域
本发明涉及图像处理技术领域,尤其涉及文本检测方法、装置电子设备及计算机可读存储介质。
背景技术
文本检测应用范围广泛,是很多计算机视觉任务的前置步骤,比如图像搜索、文字识别,身份认证和视觉导航等,文本检测的主要目的是定位文本行或字符在图像中的位置,文本的精准定位既十分重要又具备挑战,因为相较于通用目标检测来说,文字具有多方向、不规则形状、极端长宽比、字体、颜色、背景多样等特点,因此,往往在通用目标检测上较为成功的算法无法直接迁移到文字检测中。
发明内容
根据本公开的一方面,提供了一种文本检测方法,包括:
获取待检测文本图像;
获取所述待检测文本图像的第一特征映射;
将所述第一特征映射输入至特征金字塔增强模块,生成第二特征映射;
对所述第二特征映射进行第一卷积处理,生成预测目标的中心点得分图;
将所述中心点得分图与所述第一特征映射逐通道逐点相乘,得到一组合并特征映射;
对所述一组合并特征映射进行第二卷积处理,生成预测目标的定位得分图;
根据所述定位得分图定位预测目标的中心点;
根据所述中心点定位文本框。
根据本公开的另一方面,提供了一种文本检测装置,包括:
第一获取模块,用于获取待检测文本图像;
第二获取模块,用于获取所述待检测文本图像的第一特征映射;
第一生成模块,用于将所述第一特征映射输入至特征金字塔增强模块,生成第二特征映射;
第二生成模块,用于对所述第二特征映射进行第一卷积处理,生成预测目标的中心点得分图;
第一处理模块,用于将所述中心点得分图与所述第一特征映射逐通道逐点相乘,得到一组合并特征映射;
第二处理模块,用于对所述一组合并特征映射进行第二卷积处理,生成预测目标的定位得分图;第一定位模块,用于根据所述定位得分图定位预测目标的中心点;
第二定位模块,用于根据所述中心点定位文本框。
根据本公开的另一方面,提供了一种电子设备,包括:
处理器;以及
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据上述方面中任一项所述的文本检测方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述方面中任一项所述的文本检测方法。
本申请实施例中提供的一个或多个技术方案,提升了密集文本检测的速度和精度。
附图说明
在下面结合附图对于示例性实施例的描述中,本公开的更多细节、特征和优点被公开,在附图中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110821804.8/2.html,转载请声明来源钻瓜专利网。