[发明专利]一种模型的处理方法、装置及设备在审
申请号: | 202210974842.1 | 申请日: | 2022-08-15 |
公开(公告)号: | CN115345233A | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 傅欣艺;肖凯;王维强;徐恪;周广猛;姚苏 | 申请(专利权)人: | 清华大学;支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 朱文杰 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 处理 方法 装置 设备 | ||
本说明书实施例公开了一种模型的处理方法、装置及设备,该方法应用于终端设备,包括:接收服务器发送的第一模型,获取第一训练样本数据,以对第一模型进行训练,并对第一模型的模型结构进行调整,得到目标模型,将目标模型对应的模型更新数据发送给服务器,以使服务器确定得到目标模型所使用的时长,并基于不同终端设备提供的模型更新数据对当前的模型进行更新,得到第二模型,并在确定第二模型需要裁剪时,确定对第二模型的裁剪程度和对第二模型进行训练所使用的时长,获取第二训练样本数据,并结合对第二模型进行训练所使用的时长对第二模型进行训练,并通过该裁剪程度对第二模型进行调整,得到第三模型,将第三模型发送给服务器。
技术领域
本文件涉及计算机技术领域,尤其涉及一种模型的处理方法、装置及设备。
背景技术
人工智能通过从大量的数据中学习到特定的知识,再通过学习到的特定知识执行相应的业务处理,人工智能技术为社会的发展带来很大便利。但随着互联网中数据量的快速增长,以及人们对于数据隐私的日益关注,数据往往需要进行本地化存储,而仅依靠部分节点(联邦学习中的终端设备)的数据来学习到相应的特定知识,这样学习到的特定知识是不充分而且有偏的。为解决上述问题衍生了在数据本地化的情况下多节点之间的协作学习机制。在实际应用中,不同节点的能力(包括通信能力和计算能力等)往往存在差异。
目前,联邦学习通常采用的是完全同步的处理方式,该处理方式下服务器需要等待所有预先选择的终端设备提交相应模型的更新数据,之后,服务器才能够更新服务器中当前的模型,此时,计算能力和通信能力较差的终端设备就成了上述模型训练的“拖累者”,从而造成联邦学习的效率降低。基于此,需要提供一种能够使得联邦学习的效率更高的技术方案。
发明内容
本说明书实施例的目的是提供一种能够使得联邦学习的效率更高的技术方案。
为了实现上述技术方案,本说明书实施例是这样实现的:
本说明书实施例提供的一种模型的处理方法,应用于终端设备,所述方法包括:接收服务器发送的第一模型,获取用于训练所述第一模型的第一训练样本数据,使用所述第一训练样本数据对所述第一模型进行训练,并对所述第一模型的模型结构进行调整,得到训练后的目标模型,所述目标模型与所述第一模型的模型结构相同,或者,所述目标模型是将所述第一模型的模型结构进行裁剪后得到的模型。将所述目标模型对应的模型更新数据发送给所述服务器,所述目标模型对应的模型更新数据用于触发所述服务器确定得到所述目标模型所使用的时长,并基于不同终端设备提供的所述目标模型对应的模型更新数据对所述服务器中当前的模型进行更新,得到第二模型,以及判断所述第二模型的模型结构是否需要再次裁剪,并在确定所述第二模型的模型结构需要进行裁剪时,确定不同终端设备对所述第二模型的模型结构的裁剪程度和对所述第二模型进行训练所使用的时长。接收所述服务器发送的对所述第二模型的模型结构的裁剪程度和对所述第二模型进行训练所使用的时长,以及所述第二模型。获取用于训练所述第二模型的第二训练样本数据,基于所述第二训练样本数据和对所述第二模型进行训练所使用的时长对所述第二模型进行训练,并通过对所述第二模型的模型结构的裁剪程度对所述第二模型的模型结构进行调整,得到训练后的第三模型,将所述第三模型对应的模型更新数据作为目标模型对应的模型更新数据发送给所述服务器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;支付宝(杭州)信息技术有限公司,未经清华大学;支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210974842.1/2.html,转载请声明来源钻瓜专利网。