[发明专利]一种基于双尺度循环生成对抗的人脸灰度图像着色方法在审
申请号: | 202211412711.0 | 申请日: | 2022-11-11 |
公开(公告)号: | CN116188652A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 王奔;陈亮锜 | 申请(专利权)人: | 杭州师范大学 |
主分类号: | G06T15/00 | 分类号: | G06T15/00;G06T7/90;G06V10/56;G06V10/80;G06V10/82;G06N3/044;G06N3/0475;G06N3/0464;G06N3/048 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 邬赵丹 |
地址: | 311121 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 循环 生成 对抗 灰度 图像 着色 方法 | ||
1.一种基于双尺度循环生成对抗的人脸灰度图像着色方法,其特征在于:具体包括如下步骤:
步骤1、数据收集与预处理:获取大量的人脸彩色图像,统一图像尺寸大小;将数据集划分为训练集和验证集;对训练集数据进行数据增强;使用cv库函数将图像转换为CIE Lab颜色空间,并提取L通道作为模型的输入;
步骤2、构建人脸灰度图像着色模型:该模型选用循环生成网络的结构,包括两对生成器-判别器;使用改进过的U-Net作为生成器,采用双尺度卷积模块进行特征的提取,增加模型对不同尺度信息的适应性,提取多维度的特征信息;在跳跃连接中,通过CBAM注意力模块提取带有注意力权重的信息,将之与上采样阶段进行融合,关注待着色图像的显著区域,抑制不必要区域;在判别器上,沿用PatchGAN,采用全卷积的形式,最终输出一个特征图,表示输入图像的多区域的真假概率值,考虑了更多区域的着色效果;
步骤3、训练人脸灰度图像着色模型:将步骤1提取的L通道灰度图像作为模型的输入,余下的ab通道作为模型的标签;结合对抗性损失、循环一致性损失、身份认证损失和灰度损失,通过加权计算得出最终的损失函数对模型进行优化训练,按照先训练判别器,后训练生成器的策略进行模型训练;
步骤4、对人脸灰度图像进行上色:将待着色的人脸灰度图像输入到训练好的模型中,即可输出着色后的彩色人脸图像。
2.如权利要求1所述的基于双尺度循环生成对抗的人脸灰度图像着色方法,其特征在于:所述循环生成网络包括两对生成器-判别器,即四个子网络,G网络是生成器,负责将图像A转换为图像B,DB是判别器,负责判别通过G网络生成的图像的真假概率;F网络也是生成器,负责将图像B转换为图像A,DA是判别器,负责判别通过F网络生成的图像的真假概率。
3.如权利要求1所述的基于双尺度循环生成对抗的人脸灰度图像着色方法,其特征在于:所述的双尺度卷积模块采用3×3和7×7大小的卷积核相融合的形式;将输入特征图分别经过两个大小的卷积操作之后,在通道维度进行融合,之后使用一个1×1的卷积核进行降维,减少因大卷积核带来的额外模型参数而导致的效率降低。
4.如权利要求1所述的基于双尺度循环生成对抗的人脸灰度图像着色方法,其特征在于:在所述的跳跃连接中,结合融合通道注意力和空间注意力的CBAM注意力模块,两者并行,关注特征图的“什么”和“哪里”是有意义的,将下采样阶段的有用的信息与上采样阶段进行共享,减少因采样导致的信息损失,抑制不必要的信息,提升着色效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211412711.0/1.html,转载请声明来源钻瓜专利网。