[发明专利]一种基于Spark框架的生成对抗网络分布式实现方法有效

专利信息
申请号: 201810047494.7 申请日: 2018-01-18
公开(公告)号: CN108268638B 公开(公告)日: 2020-07-17
发明(设计)人: 王万良;张兆娟;高楠;吴菲;李卓蓉;赵燕伟 申请(专利权)人: 浙江工业大学
主分类号: G06F16/182 分类号: G06F16/182;G06N3/04;G06N3/08
代理公司: 杭州之江专利事务所(普通合伙) 33216 代理人: 林蜀
地址: 310014 浙江省杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于Spark框架的生成对抗网络分布式实现方法,采用以下步骤:主节点随机初始化网络配置并产生参数集;将数据文件直接上传至分布式文件系统;构造Spark的弹性分布式数据集;针对每个训练数据子集RDD,主节点将参数、配置、网络的更新态传递到所有从节点;每个从节点训练部分数据,并更新参数;通过数据并行的方式并行训练生成对抗网络模型,直至达到纳什均衡,训练完成。本方法是面向海量数据时生成对抗网络模型的分布式训练。同时,充分利用Spark基于内存计算框架、适用于递归计算的优势,能够加速生成对抗网络模型的训练,提高效率,并且有较好的可扩展性。
搜索关键词: 一种 基于 spark 框架 生成 对抗 网络 分布式 实现 方法
【主权项】:
1.一种基于Spark框架的生成对抗网络分布式实现方法,采用以下步骤:步骤1:主节点随机初始化网络配置并产生参数集,确定生成对抗网络模型的相关参数;步骤1.1:生成对抗网络模型分布式训练目标函数:将用于生成对抗网络模型训练标定好的真实数据进行归一化,使得每个值在范围[0,1]内,生成器的训练是尽量去学习真实的数据分布;判别器被训练用来区分样本来自于真实的数据分布还是生成器,生成对抗网络模型的训练在生成器生成样本和实际样本的训练判别之间交替进行,通过保持判别器权重恒定,并且通过判别器反向传播误差来更新生成器的权重;生成对抗网络模型训练的目标函数如下:式中,可微分函数D和G分别表示判别器和生成器,x表示输入的真实数据,Pdata(x)表示真实数据集分布,D(x)代表x来源于真实数据而非生成数据的概率,z表示随机变量,pz(z)表示先验分布,G(z)为由G生成的尽量服从真实数据分布的样本,E(.)表示计算期望值;步骤1.2:生成对抗网络模型训练分布式并行化训练:同时训练几组生成对抗网络,并令每个判别器周期性地对其他生成对抗网络的生成器所生成的样本进行判别;步骤2:将海量数据文件直接上传至分布式文件系统(HadoopDistributedFileSystem,HDFS)进行存储;步骤3:构造Spark的弹性分布式数据集(ResilientDistributedDatasets,RDD):将原始输入数据分成多个批次,每次输入一批样本而不是一个单独的样本;通过相似性度量确保过于相似的样本不被放在同一个批次中;将数据缓存至Spark平台的RDD缓存中,然后广播到参与生成对抗网络模型算法分布式处理的Spark工作节点中;步骤4:针对每个训练数据子集RDD,主节点将参数、配置、网络的更新态传递到所有从节点;步骤5:每个从节点训练部分数据,并更新参数;每次迭代之后,所有参数和状态返回到主节点,主节点通过综合所有从节点的参数,并将参数进行平均,从而开始下一次迭代训练;平均值被传递到所有从节点,再进行进一步的训练;通过数据并行的方式并行训练生成对抗网络模型,直至达到纳什均衡,训练完成;步骤5.1:生成对抗网络模型主节点工作流程:主节点首先将用于训练的数据集参照上述步骤3进行数据分块,然后广播参数给从节点,从节点进行部分模型的训练后将参数返回给主节点,主节点综合从节点学习到的部分生成对抗网络模型,并将学习到的参数进行平均,来重建一个主控深度模型(又名Reduce步骤),再将平均到的参数广播给每个从节点,然后根据更新的参数开始下一轮的迭代,直至其达到纳什均衡,生成对抗网络模型训练完成;5.2:生成对抗网络模型从节点工作流程:每个从节点接收主节点广播的参数、网络、配置等信息,读取创建好的数据集分区数据RDD,然后计算梯度,每个工作节点基于RDD来计算其梯度的更新,并更新参数,直至其收敛,从节点将传递部分生成对抗网络模型学习而得的计算参数给主节点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810047494.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top