[发明专利]一种图像文本检测方法、装置、系统及介质在审
申请号: | 202110118979.2 | 申请日: | 2021-01-28 |
公开(公告)号: | CN112883961A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 李天驰;孙悦;王帅 | 申请(专利权)人: | 深圳点猫科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 广东良马律师事务所 44395 | 代理人: | 张柯 |
地址: | 518000 广东省深圳市前海深港合作区南山街道兴海大道3044号信*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 文本 检测 方法 装置 系统 介质 | ||
1.一种图像文本检测方法,其特征在于,包括如下步骤:
获取待检测文本图像,对所述待检测文本图像进行特征提取后输出共享文本特征图;
根据所述共享文本特征图迭代生成覆盖所述共享文本特征图中全部文本区域的全覆盖文本候选框;
根据所述全覆盖文本候选框估计所述共享文本特征图中全部文本区域的几何属性,并根据所述几何属性输出全部文本区域的文本定位检测结果。
2.根据权利要求1所述的图像文本检测方法,其特征在于,所述对所述待检测文本图像进行特征提取后输出共享文本特征图,包括:
将所述待检测文本图像输入至具有残差模块的特征提取网络中;
通过所述具有残差模块的特征提取网络对所述待检测文本图像进行多次下采样与特征融合后输出共享文本特征图。
3.根据权利要求2所述的图像文本检测方法,其特征在于,所述通过所述具有残差模块的特征提取网络对所述待检测文本图像进行多次下采样与特征融合后输出共享文本特征图,具体包括:
通过所述具有残差模块的特征提取网络对所述待检测文本图像进行多次下采样,每次下采样均经过预设大小的卷积核进行卷积运算,得到具有最小核值的共享文本特征图。
4.根据权利要求1所述的图像文本检测方法,其特征在于,所述根据所述共享文本特征图迭代生成覆盖所述共享文本特征图中全部文本区域的全覆盖文本候选框,包括:
对所述共享文本特征图进行文本候选框预测后输出初级文本候选框;
对所述初级文本候选框进行迭代优化处理后输出覆盖所述共享文本特征图中全部文本区域的全覆盖文本候选框。
5.根据权利要求4所述的图像文本检测方法,其特征在于,所述对所述初级文本候选框进行迭代优化处理后输出覆盖所述共享文本特征图中全部文本区域的全覆盖文本候选框,包括:
对所述初级文本候选框进行感兴趣区域转换后获得所述初级文本候选框对应的特征块;
根据所述特征块生成相应的角点预测图,并根据所述共享文本特征图对所述角点预测图进行多次迭代运算,调节其中预测角点的位置;
当预测角点与共享文本特征图中全部文本区域的真实角点的偏移量小于预设阈值时生成全覆盖文本候选框。
6.根据权利要求1-5任意一项所述的图像文本检测方法,其特征在于,所述获取待检测文本图像,对所述待检测文本图像进行特征提取后输出共享文本特征图之前,还包括:
构建并训练文本检测模型,所述文本检测模型包括依次连接的特征提取网络、回归预测网络、迭代优化网络和形状表达网络。
7.根据权利要求1-5任意一项所述的图像文本检测方法,其特征在于,所述几何属性包括文本区域、文本中心线以及边界偏移量。
8.一种图像文本检测装置,其特征在于,所述装置包括:
特征提取模块,用于对获取到的待检测文本图像进行特征提取后输出具有最小核值的共享文本特征图;
预测迭代模块,用于根据所述共享文本特征图迭代生成覆盖所述共享文本特征图中全部文本区域的全覆盖文本候选框;
估计识别模块,用于根据所述全覆盖文本候选框估计所述共享文本特征图中全部文本区域的几何属性,并根据所述几何属性输出全部文本区域的文本定位检测结果。
9.一种图像文本检测系统,其特征在于,所述系统包括至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7任一项所述的图像文本检测方法。
10.一种非易失性计算机可读存储介质,其特征在于,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行权利要求1-7任一项所述的图像文本检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳点猫科技有限公司,未经深圳点猫科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110118979.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无源耐温抗菌阻垢防腊防腐蚀组件
- 下一篇:新风控制方法、装置及空调器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序