[发明专利]一种基于数据分离的联合模型训练方法及系统在审
申请号: | 202210157979.8 | 申请日: | 2022-02-21 |
公开(公告)号: | CN115544536A | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 闫军;刘毅 | 申请(专利权)人: | 超级视线科技有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 河北省张家口市桥东区站前东大街*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 分离 联合 模型 训练 方法 系统 | ||
1.一种基于数据分离的联合模型训练方法,其特征在于,所述方法包括:
S1:中心节点建立中心模型并进行初始化赋值,得到初始化模型,所述初始化模型设为分支节点的初始分支模型;
S2:分支节点接收初始分支模型,并在此基础上开始新一轮分支模型训练,读取训练数据,计算分支模型梯度,得到优化后的分支模型;
S3:获取优化后的分支模型与初始分支模型的差值;
S4:中心节点接收分支模型的差值,根据分支模型的差值更新中心模型;
S5:中心节点根据训练中止条件评估更新后的中心模型;若更新后的中心模型满足训练指标,则训练结束,保存更新后的中心模型,若不满足,则跳转至S2。
2.根据权利要求1所述的基于数据分离的联合模型训练方法,其特征在于,分支节点接收初始分支模型,并在此基础上开始新一轮分支模型训练,读取训练数据,计算分支模型梯度,得到优化后的分支模型,具体包括:
读取第一批训练数据作为分支模型的输入;并执行前向计算,输出模型计算结果;
将模型计算结果和真值数据输入损失函数,计算模型损失;
根据模型损失结果计算分支模型梯度,
分支节点根据梯度优化分支模型。
3.根据权利要求2所述的基于数据分离的联合模型训练方法,其特征在于,所述方法还包括:分支节点在训练数据集上不断更新分支模型,评估是否遍历数据集上的所有可用数据,然后得到本轮优化分支模型。
4.根据权利要求3所述的基于数据分离的联合模型训练方法,其特征在于,分支节点在训练数据集上不断更新分支模型,评估是否遍历数据集上的所有可用数据,然后得到本轮优化分支模型具体包括:分支节点读取下一批训练数据作为模型输入,并执行前向计算,输出模型计算结果;
将模型计算结果和真值数据输入损失函数,计算模型损失;
根据模型损失结果计算分支模型梯度,
分支节点根据梯度优化分支模型。
5.根据权利要求4所述的基于数据分离的联合模型训练方法,其特征在于,所述方法还包括:评估训练数据集上的可用数据是否全部遍历,若已经全部遍历,则结束本轮分支模型训练,然后计算本轮分支模型与初始分支模型的差值,将该差值发送给中心节点;若未全部遍历,则跳转至S2。
6.根据权利要求5所述的基于数据分离的联合模型训练方法,其特征在于,中心节点接收分支模型的差值,根据分支模型的差值更新中心模型具体包括;
中心节点接收k个分支模型的模型差值,
根据模型差值更新中心模型。
7.根据权利要求6所述的基于数据分离的联合模型训练方法,其特征在于,所述方法还包括:评估所述更新后的中心模型是否符合模型中止条件,若更新后的中心模型在测试数据集上的准确率Acc不小于0.95,则中止模型训练,若小于0.95,则跳转至S2。
8.一种基于数据分离的联合模型训练系统,其特征在于:所述系统包括:
初始化模块,用于对中心节点建立的中心模型并进行初始化赋值,得到初始化模型,所述初始化模型设为分支节点的初始分支模型;
训练模块,接收初始分支模型,并在此基础上开始新一轮分支模型训练,读取训练数据,计算分支模型梯度,得到优化后的分支模型;
获取模块,用于获取优化后的分支模型与初始分支模型的差值;
更新模块,用于根据分支模型的差值更新中心模型;
评估模块,用于根据训练中止条件评估更新后的中心模型;若更新后的中心模型满足训练指标,则训练结束,保存更新后的中心模型,若不满足,则跳转至S2。
9.根据权利要求8所述的基于数据分离的联合模型训练系统,其特征在于,所述训练模块还用于:读取第一批训练数据作为分支模型的输入;并执行前向计算,输出模型计算结果;
将模型计算结果和真值数据输入损失函数,计算模型损失;
根据模型损失结果计算分支模型梯度,
分支节点根据梯度优化分支模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超级视线科技有限公司,未经超级视线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210157979.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置