[发明专利]文本检测方法、装置、电子设备及存储介质在审
申请号: | 202111057748.1 | 申请日: | 2021-09-09 |
公开(公告)号: | CN113936128A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 袁梦轲;刘航;王彤;严冬明 | 申请(专利权)人: | 中国科学院自动化研究所;东华大学 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/46;G06V10/80;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王治东 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 装置 电子设备 存储 介质 | ||
本发明提供一种文本检测方法、装置、电子设备及存储介质,该方法包括:通过特征金字塔将原始光照图像转化为对应的参数矩阵,基于参数矩阵调整原始光照图像的图像亮度,得到原始光照图像对应的待处理暗光图像;基于特征提取网络对原始光照图像对应的原始暗光图像,及待处理暗光图像分别进行多层特征提取,分别得到原始暗光图像对应的原始特征和补充特征;基于补充特征对原始特征进行特征补全,得到特征补全的原始暗光图像;基于输出网络输出特征补全的原始暗光图像的热力图和文本预测框,基于热力图和文本预测框进行文本检测。本发明通过合成暗光图像及原始暗光图像的特征补全,直接检测暗光环境下的文本,提升了暗光环境下文本检测的准确性。
技术领域
本发明涉及图像处理领域,尤其涉及一种文本检测方法、装置、电子设备及存储介质。
背景技术
目前的文本检测相关工作基本都是针对正常光照情况进行,暗光环境下的文本检测工作十分稀缺。现阶段暗光文本检测主要是先增强图片亮度再进行检测的技术方法,即先利用传统图像处理方法增强图像亮度,然后利用MSER预测含有误检对象的候选结果,再结合手工特征和卷积神经网络对亮度增强文本的分布进行学习,剔除非文本候选对象,得到最终的检测结果。然而,在此方法中,通过无参照的图像亮度增强方法,使得放大图像中的噪声。同时需要通过人工方式引入手工特征,从而降低了暗光环境下文本检测的准确性。
发明内容
本发明提供一种文本检测方法、装置、电子设备及存储介质,旨在提升暗光环境下文本检测的准确性。
本发明提供一种文本检测方法,包括:
通过特征金字塔将原始光照图像转化为对应的参数矩阵,并基于所述参数矩阵调整所述原始光照图像的图像亮度,得到所述原始光照图像对应的待处理暗光图像;
基于特征提取网络对所述原始光照图像对应的原始暗光图像,以及所述待处理暗光图像分别进行多层特征提取,分别得到所述原始暗光图像对应的原始特征和补充特征;
基于所述补充特征对所述原始特征进行特征补全,得到特征补全的原始暗光图像;
基于输出网络输出所述特征补全的原始暗光图像的热力图和文本预测框,并基于所述热力图和所述文本预测框进行文本检测。
根据本发明提供的一种文本检测方法,所述基于所述热力图和所述文本预测框进行文本检测的步骤包括:
基于所述热力图确定所述特征补全的原始暗光图像中,各个像素点对应的像素分值;
基于各个所述像素分值确定对应的正样本区域,并基于所述正样本区域和所述文本预测框进行文本检测。
根据本发明提供的一种文本检测方法,所述原始特征包括第一部分原始特征和第二部分原始特征,
所述基于所述补充特征对所述原始特征进行特征补全,得到特征补全的原始暗光图像的步骤包括:
将所述补充特征和所述第一部分原始特征,输入至第一特征融合模块,其中,所述第一特征融合模块包括第一合并函数和第一卷积层;
基于所述第一合并函数和所述第一卷积层,将所述补充特征补全至所述第一部分原始特征中;
将所述第二部分原始特征及其对应的上一级特征进行特征融合,得到所述特征补全的原始暗光图像。
根据本发明提供的一种文本检测方法,所述第二部分原始特征包括第一特征和第二特征,所述第一特征在所述第二特征的底层,
所述将所述第二部分原始特征及其对应的上一级特征进行特征融合,得到所述特征补全的原始暗光图像的步骤包括:
获取所述第一特征对应的第一上一级特征,将所述第一特征和所述第一上一级特征输入至第二特征融合模块,其中,所述第二特征融合模块包括第二合并函数和第二卷积层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所;东华大学,未经中国科学院自动化研究所;东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111057748.1/2.html,转载请声明来源钻瓜专利网。