[发明专利]一种基于生成对抗网络的倾斜图像的矫正方法及装置有效
| 申请号: | 201910059151.7 | 申请日: | 2019-01-22 |
| 公开(公告)号: | CN109829857B | 公开(公告)日: | 2021-07-06 |
| 发明(设计)人: | 韩波;陈龙 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06T3/60 | 分类号: | G06T3/60 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 生成 对抗 网络 倾斜 图像 矫正 方法 装置 | ||
1.一种基于生成对抗网络的倾斜图像的矫正方法,其特征在于,包括:
步骤S1:从预设开源库中获取原始图片数据,对原始图片数据进行预处理;
步骤S2:对预处理后的图片数据建立数据集合,从数据集合中划分出训练集;
步骤S3:基于生成对抗网络,建立用于倾斜图像矫正的TiltGAN模型;
步骤S4:通过训练集对TiltGAN模型进行训练,获得训练后的TiltGAN模型;
步骤S5:将原始倾斜图像输入所述训练后的TiltGAN模型,获得矫正后的第一图像;
步骤S6:根据矫正后的第一图像与原始倾斜图像的灰度值变化,计算原始倾斜图像的倾斜角度,并基于所述倾斜角度,对原始倾斜图像进行矫正;
其中,步骤S1中对原始图片数据进行预处理,具体包括:
统一数据格式、数据净化以及数据倾斜处理;
步骤S3所述的用于倾斜图像矫正的TiltGAN模型,包括三个部分,第一部分为提取图像内容特征的编码器,包括四个残差块;第二部分为提取图像变换特征的编码器,包括五个卷积层、一个池化层和一个全连接层;第三部分是解码器,包括四个残差块,用于对图像变换编码器提取到的变换特征进行转化,然后将变换特征与内容特征进行合并,最后输出图像;
其中,步骤S2具体包括:
步骤S2.1:按照预处理后的数据是否倾斜分成正常图像集合Normal{n_1,n_2…n_n}和倾斜图像Tilt{t_1,t_2…t_n},其中,n_1、n_2和n_n表示正常图像集合中的图像元素,t_1、t_2和t_n表示倾斜图像集合中的图像元素;
步骤S2.2:按照预设比例将正常图像集合划分为第一训练集Normal_Train与第一验证集Normal_Test,按照预设比例将倾斜图像集合划分为第二训练集Tilt_Train与第二验证集Tilt_Test,其中训练集包括第一训练集和第二训练集;
步骤S4具体包括:
步骤S4.1:构建TiltGAN模型的损失函数,损失函数由四部分构成,图像重建损失部分图像内容学习损失部分图像变换学习损失部分以及对抗损失部分其中,四部分的定义分别如下:
其中,表示图像类别x1在其真实分布p下的期望,分别表示图像类别x1的内容域和特征域的期望,表示图像类别x1的生成器G1在内容域为c1,特征域为s1的情况下生成的图片;表示内容域c1在其真实分布p下与特征域s2在其生成器G2中学习到的分布q下的期望,表示图像类别x2的生成器G2在内容域为c1,特征域为s2下生成的图片的内容域的期望值;表示图像类别x2的生成器G2在内容域为c1,特征域为s2下生成的图片的特征域的期望值;D2(G2(c1,s2))表示图像类别x2的判别器D2对图像类别x2的生成器G2在内容域为c1,特征域为s2下生成的图片的判别结果,属于x2这一类则结果为1,否则结果为0;表示、图像类别x2在其真实分布p下的期望;D2(x2)表示图像类别x2的判别器D2对图像类别x2中的图像的判别结果;
步骤S4.2:通过训练集对模型进行训练,当损失函数的值达到阈值后,停止训练,获得训练后的TiltGAN模型;
步骤S6具体包括:
步骤S6.1:根据灰度区间λ计算矫正后的第一图像与原始倾斜图像的灰度差值score1;
步骤S6.2:将原始倾斜图像分别向左旋转θ1、向右旋转θ1,并计算向左旋转θ1后的图像的第一灰度值和向右旋转θ1后的图像的第二灰度值,然后计算向左旋转θ1后的图像与矫正后的第一图像的灰度差值score2、和向右旋转θ1后的图像与矫正后的第一图像的灰度差值score3;
步骤S6.3:比较score1、score2和score3,取三者中的最小值,如果最小值为score2或score3,则将原始倾斜图像按score2或score3所旋转的角度进行矫正,重复执行步骤S6.1~步骤S6.2;如果最小值为score1,若θ1大于0.5度,则将θ1更新为原始值的二分之一,重复执行步骤S6.2,若θ1不大于0.5度,则执行步骤S6.4;
步骤S6.4:将灰度区间λ更新为当前的四分之一,重新计算矫正后的第一图像与原始倾斜图像的灰度值,并计算二者的灰度差值score1′ ;
步骤S6.5:将原始倾斜图像分别向左旋转θ1′ 、向右旋转θ1′,并计算向左旋转θ1′后的图像的第一灰度值和向右旋转θ1′后的图像的第二灰度值,然后计算向左旋转θ1′后的图像与矫正后的第一图像的灰度差值score2′、和向右旋转θ1′后的图像与矫正后的第一图像的灰度差值score3′;
步骤S6.6:对比score1′,score2′,score3′ ,取其中的最小值,其中,最小值对应的图像为最终矫正后的图像;
步骤S2中数据倾斜处理,包括:左右各倾斜30度,每倾斜2度保存一次。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910059151.7/1.html,转载请声明来源钻瓜专利网。





