[发明专利]一种模型参数更新方法及装置在审
申请号: | 202111307114.7 | 申请日: | 2021-11-05 |
公开(公告)号: | CN114037045A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 阴嘉伟;邓建全 | 申请(专利权)人: | 光大科技有限公司 |
主分类号: | G06N3/02 | 分类号: | G06N3/02;G06N3/04;G06N3/08;G06N20/20 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 张秀英 |
地址: | 100040 北京市石景*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 参数 更新 方法 装置 | ||
1.一种模型参数更新方法,应用于服务端,其特征在于,包括:
获取多个客户端根据训练次数确定的本地模型的梯度与梯度权重;
根据多个本地模型的梯度与梯度权重对服务端总模型的模型参数进行更新,得到更新后的模型参数。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过以下方式根据所述多个本地模型的梯度与梯度权重对服务端总模型的模型参数进行更新,得到更新后的模型参数:其中,θ*为所述更新后的模型参数,θ为初始模型参数,为本地模型i的梯度,ωi为所述本地模型i的梯度权重,ε为所述服务端总模型的学习率。
3.根据权利要求1或2所述的方法,其特征在于,在根据所述多个本地模型的梯度与梯度权重对服务端总模型的模型参数进行更新,得到更新后的模型参数之后,所述方法还包括:
向所述多个客户端发送已更新模型参数的通知消息,其中,所述通知消息用于指示所述多个客户端将所述本地模型的训练次数清零。
4.一种模型参数更新方法,应用于客户端,其特征在于,包括:
根据训练次数确定本地模型的梯度与梯度权重;
将所述本地模型的梯度与梯度权重发送给服务端,以使所述服务端根据所述本地模型的梯度与梯度权重对服务端总模型的模型参数进行更新,得到更新后的模型参数。
5.根据权利要求4所述的方法,其特征在于,在确定本地模型的梯度与梯度权重之前,所述方法还包括:
从所述服务端下载模型;
根据本地数据对所述模型进行训练,得到所述本地模型,并记录所述本地模型的训练次数。
6.根据权利要求5所述的方法,其特征在于,确定本地模型的梯度与梯度权重包括:
获取当前训练完成之后所述本地模型的目标模型参数;
根据所述目标模型参数与初始模型参数确定所述本地模型的梯度;
根据所述本地模型的训练次数确定所述梯度权重。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
通过以下方式根据所述模型参数与初始模型参数确定所述本地模型的梯度:
▽θi=(θ0-θt)/εi,其中,▽θi为本地模型i的梯度,θ0为所述初始模型参数,θt为所述目标模型参数,εi为所述本地模型i的学习率;
通过以下方式根据所述本地模型的训练次数确定所述梯度权重:
ωi=(2+2α)sigmoid(Ti-1)+2α-1,α为常数,Ti为所述训练次数。
8.根据权利要求4至7中任一项所述的方法,其特征在于,在将所述本地模型的梯度与梯度权重发送给服务端之后,所述方法还包括:
向多个客户端发送已更新模型参数的通知消息,其中,所述通知消息用于指示所述多个客户端将所述本地模型的训练次数清零。
9.一种模型参数更新装置,应用于服务端,其特征在于,包括:
获取模块,用于获取多个客户端根据训练次数确定的本地模型的梯度与梯度权重;
更新模块,用于根据多个本地模型的梯度与梯度权重对服务端总模型的模型参数进行更新,得到更新后的模型参数。
10.一种模型参数更新装置,应用于客户端,其特征在于,包括:
确定模块,用于根据训练次数确定本地模型的梯度与梯度权重;
发送模块,用于将所述本地模型的梯度与梯度权重发送给服务端,以使所述服务端根据所述本地模型的梯度与梯度权重对服务端总模型的模型参数进行更新,得到更新后的模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于光大科技有限公司,未经光大科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111307114.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便于多角度调节的观片灯
- 下一篇:一种四氢姜黄素的合成方法