[发明专利]文本检测方法、装置、电子设备及计算机可读存储介质有效
申请号: | 202110821804.8 | 申请日: | 2021-07-21 |
公开(公告)号: | CN113269280B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 秦勇 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06N3/04 |
代理公司: | 北京北汇律师事务所 11711 | 代理人: | 马亚坤 |
地址: | 100086 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 装置 电子设备 计算机 可读 存储 介质 | ||
1.一种文本检测方法,包括:
获取待检测文本图像;
获取所述待检测文本图像的第一特征映射;
将所述第一特征映射输入至特征金字塔增强模块,生成第二特征映射;
对所述第二特征映射进行第一卷积处理,生成预测目标的中心点得分图;
将所述中心点得分图与所述第一特征映射逐通道逐点相乘,得到一组合并特征映射;
对所述一组合并特征映射进行第二卷积处理,生成预测目标的定位得分图,所述定位得分图上每个像素点的值表示这个像素点是物体唯一中心点的概率;
根据所述定位得分图定位预测目标的中心点;
根据所述中心点定位文本框;
所述获取所述待检测文本图像的第一特征映射,包括:将所述待检测文本图像输入至Resnet18网络模型,得到M组特征映射,将所述M组特征映射作为所述第一特征映射;其中所述Resnet18网络模型包括M个块串联构建;
所述将所述中心点得分图与所述第一特征映射逐通道逐点相乘,得到一组合并特征映射,包括:对所述M组特征映射,通过上下采样的方式全部变为所述待检测文本图像的1/8大小并串联叠加,将所述中心点得分图缩放到所述待检测文本图像的1/8大小并与叠加后得到的特征映射逐通道逐点相乘,得到一组合并特征映射。
2.如权利要求1所述的文本检测方法,其中,所述方法还包括:
对所述第二特征映射进行第三卷积处理,生成预测目标的中心点偏移量;
将所述定位得分图中大于预设阈值的像素点作为所述中心点;
根据所述中心点偏移量确定所述中心点的坐标;
根据所述中心点的坐标定位文本框。
3.如权利要求2所述的文本检测方法,其中,所述方法还包括:
对所述第二特征映射进行第四卷积处理,得到预测目标的旋转角度;
对所述第二特征映射进行第五卷积处理,得到预测目标的高度和宽度;
根据所述中心点的坐标、所述旋转角度、所述高度和宽度定位所述文本框。
4.如权利要求1所述的文本检测方法,其中,对所述一组合并特征映射进行第二卷积处理,生成预测目标的定位得分图包括:
将所述一组合并特征映射输入神经网络模型进行一次反卷积操作和二次卷积操作,得到所述定位得分图;
其中,所述神经网络模型通过使用二分类交叉熵损失函数对一次反卷积层和二次卷积层的参数进行训练得到;所述一次反卷积层与所述一次反卷积操作对应,所述二次卷积层与所述二次卷积操作对应。
5.如权利要求1所述的文本检测方法,其中,将所述第一特征映射输入至特征金字塔增强模块,得到第二特征映射包括:
将所述第一特征映射中的N组大小不同的多通道特征映射按照从大到小的次序分为正向第1、2、3…N组特征映射;
将正向第N组特征映射作为反向第一组特征映射,将正向第N组特征映射进行上采样之后,与正向第N-1组特征映射按照通道逐点相加并进行第六卷积处理,得到反向第二组特征映射;
将所述反向第二组特征映射进行上采样之后,与所述正向第N-2组特征映射按照通道逐点相加并进行第七卷积处理,得到反向第二组特征映射;依次对每一组正向特征映射进行同样的操作,得到反向第N组特征映射;
将反向第N组特征映射作为目标第一组特征映射,对所述反向第N组特征映射进行下采样之后,与反向第N-1组特征映射按照通道逐点相加并进行第八卷积处理,得到目标第二组特征映射;
将所述目标第二组特征映射进行下采样之后,与所述反向第N-2组特征映射按照通道逐点相加并进行第九卷积处理,得到目标第二组特征映射;依次对每一组反向特征映射进行同样的操作,得到目标第N组特征映射;
将所述目标第N组特征映射作为所述第二特征映射;
N为正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110821804.8/1.html,转载请声明来源钻瓜专利网。