[发明专利]文字图像高光去除、文字识别方法及装置在审

专利信息
申请号: 202110779127.8 申请日: 2021-07-09
公开(公告)号: CN113628127A 公开(公告)日: 2021-11-09
发明(设计)人: 全卫泽;侯诗玉;王超群;江敬恩;严冬明 申请(专利权)人: 中国科学院自动化研究所
主分类号: G06T5/00 分类号: G06T5/00;G06K9/00;G06K9/62;G06N3/04
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 李文清
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文字 图像 去除 识别 方法 装置
【说明书】:

发明提供一种文字图像高光去除、文字识别方法及装置,所述文字图像高光去除方法包括:确定带有高光的文字图像;将带有高光的文字图像输入至高光去除模型,得到高光去除模型输出的高光去除后的文字图像。本发明通过高光去除模型提取带有高光的文字图像对应的高光区域掩膜特征,从而可以准确定位文字图像的高光区域,聚焦于文字图像中被高光区域遮挡的文字信息。然后,高光去除模型对带有高光的文字图像特征以及高光区域掩膜特征进行融合,得到融合特征,并对融合特征进行编码和解码后,从而可以准确恢复高光区域的文字信息,以得到高光去除后的文字图像。

技术领域

本发明涉及图像处理技术领域,尤其涉及一种文字图像高光去除、文字识别方法及装置。

背景技术

受周围环境和物体表面材质的影响,高光在自然图像中广泛存在。高光去除技术可以改善图像质量并有利于许多视觉任务,如立体匹配、文字识别、图像分割以及图像一致性等。

传统方法中对图像进行高光去除主要包括如下方法:(1)基于双色反射模型对图像进行高光去除,双色反射模型假设图像的亮度可以用漫反射和镜面反射的线性组合来表示。(2)基于最大色度-强度空间中漫反射点和镜面反射点的分布,通过识别漫反射的最大色度,然后采用镜面反射-漫反射机制分离反射分量。(3)观察到彩色图像中局部的漫反射最大色度平滑变化,通过采用双边滤波提升了色度估计的实时性和鲁棒性。(4)基于强度比的高光去除方法,通过在伪色度空间中将像素划分为不同的簇来分离高光。(5)为了利用彩色图像的全局信息进行镜面反射分离,基于双色反射模型的全局颜色线约束方法(6)利用面部图像的物理先验和统计先验共同估计光照环境,并从不同光照颜色的人脸中去除高光。(7)将图像中漫反射和镜面反射的估计重新定义为可以近似求解的具有稀疏约束的能量最小化。然而,这个过程是相对低效的。(8)基于一种凸优化框架,可以有效地去除自然图像的彩色和单色区域的暗高光。这些基于双色反射模型的方法在处理具有不同颜色和复杂纹理的图像时往往性能有限,并且由于需要预处理操作导致效率较低、实用性弱。(9)基于图像修复的方法主要是借鉴图像修复界的技术,通过无高光污染区域的信息来恢复图像的高光区域背后的原始图像内容。通过结合基于光照的约束来去除高光。(10)基于矢量滤波器,将其整合到修复过程中,以消除镜面反射。(11)基于颜色线投影的高光修复方法,但是这种方法需要两张不同曝光时间的图像。(12)针对医学图像如内窥镜、阴道镜等,也有使用基于图像修复方法进行高光去除的技术。然而,这些基于图像修复的方法仅对具有小区域高光污染的图像有效。(13)考虑到单幅图像高光去除的复杂性,传统方法中也提出了基于深度神经网络的方法进行高光去除,如卷积神经网络(Convolutional Neural Network,CNN)和生成对抗网络(Generative Adversarial Network,GAN)。(14)通过感知器人工神经网络来检测牙齿图像的镜面反射,然后使用平滑空间滤波器递归校正镜面反射。(15)由于缺乏成对的训练数据,采用循环GAN框架,并引入了一种自正则化损失,用于减少非镜面区域的图像修改。(17)采用GAN框架,提出一种多类鉴别器,对真实图像和原始输入图像生成的漫反射图像进行分类。(18)采用两种深度模型(Spec-Net和Spec-CGAN)用于去除面部高光。其中Spec-Net以强度通道作为输入,Spec-CGAN以RGB图像作为输入。然而,这些基于深度学习的方法需要大规模的训练数据,特别是需要对真实世界的图像进行必要的标注,这非常耗时,甚至难以收集。

此外,现有的高光去除方法主要对医学图像、自然图像和特定物体图像进行处理,缺乏聚焦于文本图像的工作,由于文本图像具有不同形状以及不同方向,因此基于现有的高光去除方法无法准确对带有高光的文本图像进行高光去除。

发明内容

本发明提供一种文字图像高光去除、文字识别方法及装置,用以解决现有技术中无法高精度对文本图像进行高光去除的缺陷。

本发明提供一种文字图像高光去除方法,包括:

确定带有高光的文字图像;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110779127.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top