[发明专利]一种文本图像超分辨率方法在审
申请号: | 201910732571.7 | 申请日: | 2019-08-09 |
公开(公告)号: | CN110415176A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 李革;林凯;李宏;刘珊 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06K9/34 |
代理公司: | 北京京万通知识产权代理有限公司 11440 | 代理人: | 万学堂;魏振华 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 超分辨率 文本图像 高分辨率图像 背景图层 前景图 图层 送入 预处理 低分辨率图像 图像预处理 低分辨率 高清图像 过程应用 机器视觉 空域特征 对抗 滤波 三层 网络 分解 融合 转换 转化 | ||
1.一种文本图像超分辨率方法,包括以下步骤:
(1)对低分辨率图像抠图,将其分解成前景图层、背景图层和alpha图层;
(2)对所述前景图层、所述背景图层和所述alpha图层分别施行超分辨操作;
(3)用文本信息监督信息,优化更新网络参数。
2.根据权利要求1所述的文本图像超分辨率方法,其特征在于,所述步骤(1)包括:对于输入的低分辨率图像,使用深度抠图技术,将所述低分辨率图像分成所述前景图层、所述背景图层和所述alpha图层。
3.根据权利要求1所述的文本图像超分辨率方法,其特征在于,所述步(2)包括:通过超分辨率网络施行所述超分辨操作。
4.根据权利要求3所述的文本图像超分辨率方法,其特征在于,所述超分辨率网络为深度空域特征转换生成对抗网络(SFTGAN)和增强超分生成对抗网络(ESRGAN),对于所述alpha图层,先使用Teager滤波对其进行预处理以增强边缘,再送入所述深度空域特征转换生成对抗网络(SFTGAN)进行超分辨率处理;对于所述前景图层和所述背景图层,直接送入所述增强超分生成对抗网络(ESRGAN)进行超分辨率处理;最后,对于网络输出的三张高清图像进行逆向抠图融合,即得到最终高清结果图像。
5.根据权利要求3所述的文本图像的超分辨率方法,其特征在于,所述步骤(3)包括:在训练过程中,对于步骤(2)中得到的所述高清结果图像,对其用光学字符识别(OCR)进行识别,将识别结果与字符标签进行比对,对于比对结果不同的每个字符,均向损失函数添加一定的损失值;最后,将此损失值回传到步骤(2)中的所述两个超分辨率网络进行权重更新。
6.根据权利要求5所述的文本图像的超分辨率方法,其特征在于,在对步骤(2)中得到的所述高清结果图像进行识别之前,首先使用图像字符分割网络将所述高清结果图像分割剪切成多张单字符子图片,然后,对每张单字符子图片使用字符识别技术进行识别。
7.根据权利要求5所述的文本图像的超分辨率方法,其特征在于,向损失函数添加0.5的损失值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910732571.7/1.html,转载请声明来源钻瓜专利网。