[发明专利]一种网络模型的训练方法以及相关装置有效
申请号: | 201910331313.8 | 申请日: | 2019-04-23 |
公开(公告)号: | CN110222705B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 陈汉亭;舒晗;王云鹤;许春景 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06V10/74;G06N3/0475;G06N3/094;G06N3/0464;G06N3/045 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 模型 训练 方法 以及 相关 装置 | ||
1.一种网络模型的训练方法,其特征在于,所述方法包括:
获取第一生成网络和第二生成网络,其中,所述第一生成网络为待训练的小型网络,所述第二生成网络为执行过训练操作的大型网络,所述第一生成网络中的参数量小于所述第二生成网络中的参数量;
将待转换图像输入所述第一生成网络,得到第一转换后图像;
将所述待转换图像输入所述第二生成网络,得到第二转换后图像;
根据所述第一转换后图像和所述第二转换后图像,对所述第一生成网络进行迭代训练,直至所述第一生成网络输出的所述第一转换后图像和所述第二生成网络输出的所述第二转换后图像的相似度达到所述预设阈值;
获取第三生成网络,所述第三生成网络为所述第一生成网络执行过所述迭代训练后得到的网络。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一转换后图像和所述第二转换后图像,对所述第一生成网络进行迭代训练,直至所述第一生成网络输出的所述第一转换后图像和所述第二生成网络输出的所述第二转换后图像的相似度达到预设阈值,包括:
获取所述第一转换后图像的第一图像矩阵;
获取所述第二转换后图像的第二图像矩阵;
根据所述第一图像矩阵和所述第二图像矩阵,采用第一损失函数对所述第一生成网络进行迭代训练,直至所述第一生成网络输出的所述第一转换后图像和所述第二生成网络输出的所述第二转换后图像的相似度达到所述预设阈值。
3.根据权利要求2所述的方法,其特征在于,
所述第一损失函数具体表现为:
其中,所述GT(x)表示所述第一图像矩阵,所述GS(x)表示所述第二图像矩阵,所述||GT(x)-GS(x)||1表示所述第一图像矩阵与所述第二图像矩阵的差值的一范数,所述表示所述||GT(x)-GS(x)||1的平方,所述LL1(GS)表示所述第一损失函数。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一转换后图像和所述第二转换后图像,对所述第一生成网络进行迭代训练,直至所述第一生成网络输出的所述第一转换后图像和所述第二生成网络输出的所述第二转换后图像的相似度达到预设阈值,包括:
获取第一判别网络以及第二判别网络,所述第一判别网络为待训练网络,所述第二判别网络为执行过训练操作的网络,所述第一判别网络与所述第一生成网络归属于同一第一生成对抗网络,所述第二判别网络与所述第二生成网络归属于同一第二生成对抗网络;
将所述第一转换后图像输入所述第一判别网络,得到所述第一转换后图像的第一特征信息集合;
将所述第二转换后图像输入所述第二判别网络,得到所述第一转换后图像的第二特征信息集合;
根据所述第一特征信息集合和所述第二特征信息集合,采用第二损失函数对所述第一生成网络进行迭代训练,直至所述第一生成网络输出的所述第一转换后图像和所述第二生成网络输出的所述第二转换后图像的相似度达到所述预设阈值。
5.根据权利要求4所述的方法,其特征在于,
所述第二损失函数具体表现为:
其中,DT(GT(x))表示将所述第二转换后图像输入所述第二判别网络后得到的值,所述表示将所述DT(GT(x))去掉最后一层得到的所述第二特征信息集合,DS(GS(x))表示将所述第一转换后图像输入所述第一判别网络后得到的值,所述表示将所述DS(GS(x))去掉最后一层后得到的所述第一特征信息集合,所述表示所述第二特征信息集合与所述第一特征信息集合的差值的一范数,所述表示所述的平方,所述Lprec(GS)表示所述第二损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910331313.8/1.html,转载请声明来源钻瓜专利网。