[发明专利]一种生成器、生成器训练方法及避免图像坐标粘连方法有效
申请号: | 202211438643.5 | 申请日: | 2022-11-17 |
公开(公告)号: | CN115496989B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 司马华鹏;张茂林;王培雨 | 申请(专利权)人: | 南京硅基智能科技有限公司 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/40;G06N3/0464;G06N3/048;G06N3/0475;G06N3/08 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;占园 |
地址: | 210012 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生成器 训练 方法 避免 图像 坐标 粘连 | ||
1.一种基于门控网络的生成器,其特征在于,所述生成器包括:图像输入层、特征编码层、特征解码层和图像输出层,其中,
所述图像输入层被配置为将待处理图像处理为图像序列,并将所述图像序列输入至所述特征编码层;所述待处理图像中包括至少一个目标人物;
所述特征编码层被配置为使用门控卷积网络对所述图像序列进行编码处理,得到图像编码;其中,所述门控卷积网络包括特征过滤单元、膨胀卷积单元和归一化层,所述特征过滤单元被配置为将从所述图像序列中提取的图像特征进行过滤,得到过滤结果;
所述膨胀卷积单元被配置为按照膨胀参数对所述图像特征进行卷积处理,得到膨胀卷积结果;所述膨胀参数为膨胀卷积单元在进行卷积处理时,对每个图像特征对应的数值之间填充的空白数值数量;
所述归一化层被配置为将所述过滤结果与所述膨胀卷积结果的乘积进行归一化处理,得到归一化结果;
所述特征解码层被配置为使用逆门控卷积网络对所述图像编码进行解码处理,得到目标图像序列;
所述图像输出层被配置为将所述目标图像序列进行拼接处理,得到目标图像,并输出所述目标图像。
2.根据权利要求1所述的基于门控网络的生成器,其特征在于,所述特征过滤单元包括2D卷积单元和激活函数;
所述2D卷积单元被配置为过滤所述图像特征中的深层次特征;
所述激活函数被配置在所述深层次特征中引入非线性属性,得到所述过滤结果。
3.根据权利要求1所述的基于门控网络的生成器,其特征在于,所述待处理图像中包括至少一个目标人物执行说话动作;所述生成器还包括第一特征编码区、第二特征编码区和音频输入层,其中,
所述第一特征编码区和第二特征编码区分别包括预设数量的所述特征编码层;
所述音频输入层被配置为提取待处理音频的音频特征序列,并将所述音频特征序列输入至所述第二特征编码区;其中,所述待处理音频为所述待处理图像中目标人物执行所述说话动作的音频;
所述第一特征编码区被配置为使用门控卷积网络对所述图像序列进行预设数量次的编码处理;
所述第二特征编码区被配置为按照时间序列合并所述音频特征序列和经过所述第一特征编码区编码处理后的所述图像序列,得到图音序列;并使用门控卷积网络对所述图音序列进行编码处理,得到样本图音编码。
4.根据权利要求1所述的基于门控网络的生成器,其特征在于,所述逆门控卷积网络包括:差值采样单元和门控卷积单元;
所述差值采样单元被配置为根据差值方法对所述图像编码中的数组进行上采样操作以及下采样操作,得到采样数据;
所述门控卷积单元被配置为输出所述采样数据。
5.一种生成器的训练方法,用于训练权利要求1-4中任意一项所述的基于门控网络的生成器,其特征在于,所述方法包括:
从样本视频中提取样本图像;所述样本视频为预设人物按照预设话术说话的视频;所述样本图像为所述样本视频中至少一帧所对应的图像;
对所述样本图像进行预处理,得到样本图像序列;
将所述样本图像序列输入至未训练的生成器中,使用门控卷积网络进行编码处理,得到样本图像编码;
使用逆门控卷积网络对所述样本图像编码进行解码处理,得到训练图像序列;
对所述训练图像序列进行拼接处理,得到训练图像;
根据损失函数计算所述样本图像与所述训练图像之间的图像偏差,如果所述图像偏差小于偏差阈值,得到训练好的生成器。
6.根据权利要求5所述的生成器的训练方法,其特征在于,所述根据损失函数计算所述样本图像与所述训练图像之间的图像偏差的步骤包括:
获取所述样本图像的预测标签;
获取所述训练图像的实际标签;
计算所述实际标签与所述预测标签的偏差;
根据所述偏差,通过自适应矩估计算法更新所述生成器的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京硅基智能科技有限公司,未经南京硅基智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211438643.5/1.html,转载请声明来源钻瓜专利网。