[发明专利]多智能体模型的训练方法、装置、电子设备及存储介质在审
申请号: | 202110982120.6 | 申请日: | 2021-08-25 |
公开(公告)号: | CN113673711A | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 何元钦;骆家焕;康焱;刘洋 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种多智能体模型的训练方法,其特征在于,基于联邦学习系统,所述系统包括参数聚合设备及至少两个参与方设备,所述方法包括:
参数聚合设备接收各所述参与方设备发送的第一数量的参数值组,所述参数值组包含至少一个不可预测参数的参数值;
对各所述参与方设备发送的参数值组进行汇总,并将汇总得到的第二数量的参数值组分别发送至各所述参与方设备;
接收各所述参与方设备返回的第二数量的损失值,所述损失值是,所述参与方设备基于接收到的参数值组及所述多智能体模型的损失函数所确定;
基于各所述参与方设备返回的第二数量的损失值,从所述第二数量的参数值组中选取第一数量的参数值组作为目标参数值组;
将所述目标参数值组分别发送至各所述参与方设备,以使各所述参与方设备基于所述目标参数值组,更新所述多智能体模型的模型参数。
2.根据权利要求1所述的方法,其特征在于,所述基于各所述参与方设备返回的第二数量的损失值,从所述第二数量的参数值组中选取第一数量的参数值组作为目标参数值组,包括:
基于各所述参与方设备返回的第二数量的损失值,确定所述第二数量的参数值组中各参数值组对应的第三数量的损失值,所述第三数量为所述参与方设备的数量;
基于各所述参数值组对应的第三数量的损失值,确定各所述参数值组对应的参考损失值;
依据所述参考损失值从小到大的顺序,对所述第二数量的参数值组进行排序,并依据排序结果从第一个参数值组开始选取,直至选取第一数量的参数值组作为目标参数值组。
3.根据权利要求2所述的方法,其特征在于,基于各所述参数值组对应的第三数量的损失值,确定各所述参数值组对应的参考损失值,包括:
针对所述第二数量的参数值组中各参数值组分别执行以下处理:
对所述参数值组对应的第三数量的损失值进行求和处理,得到求和结果;
将所述求和结果作为所述参数值组对应的参考损失值。
4.根据权利要求2所述的方法,其特征在于,基于各所述参数值组对应的第三数量的损失值,确定所述参数值组对应的参考损失值,包括:
针对所述第二数量的参数值组中各参数值组分别执行以下处理:
对所述参数值组对应的第三数量的损失值进行求平均处理,得到损失均值;
将所述损失均值作为所述参数值组对应的参考损失值。
5.根据权利要求1所述的方法,其特征在于,所述基于各所述参与方设备返回的第二数量的损失值,从所述第二数量的参数值组中选取第一数量的参数值组作为目标参数值组,包括:
分别对各所述参与方设备返回的第二数量的损失值进行排序,得到各参与方设备对应的损失值序列;
分别获取各参数值组对应的损失值在各所述损失值序列中的排序;
基于各所述参数值组在各所述损失值序列中的排序,从所述第二数量的参数值组中选取第一数量的参数值组作为目标参数值组。
6.根据权利要求5所述的方法,其特征在于,所述基于各所述参数值组在各所述损失值序列中的排序,从所述第二数量的参数值组中选取第一数量的参数值组作为目标参数值组,包括:
针对各所述参数值组,分别对所述参数值组在各所述损失值序列中的排序进行求平均处理,得到排序平均值;
根据各所述参数值组在各所述损失值序列中的排序平均值,从所述第二数量的参数值组中选取第一数量的参数值组作为目标参数值组。
7.根据权利要求5所述的方法,其特征在于,所述基于各所述参数值组在各所述损失值序列中的排序,从所述第二数量的参数值组中选取第一数量的参数值组作为目标参数值组,包括:
针对各所述参数值组,分别对所述参数值组在各所述损失值序列中的排序进行求和处理,得到排序的和;
根据各所述参数值组在各所述损失值序列中排序的和,从所述第二数量的参数值组中选取第一数量的参数值组作为目标参数值组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110982120.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通信车流体控制设备
- 下一篇:一种VR现实沉浸式体验的浴缸泳池