[发明专利]模型训练方法、装置、电子设备及存储介质在审
申请号: | 202210065282.8 | 申请日: | 2022-01-20 |
公开(公告)号: | CN116502079A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 许晓东;王怡宁;韩书君;董辰;王碧舳 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06N3/096 |
代理公司: | 北京市通商律师事务所 11951 | 代理人: | 许念如 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 电子设备 存储 介质 | ||
本发明涉及通信技术领域,尤其涉及模型训练方法、装置、电子设备及存储介质。具体实现方案为:第一节点获取第二节点发送的模型训练请求,模型训练请求包括所述第二节点的工作任务所需的目标性能;第一节点根据模型训练请求查询本地模型库内是否存储有符合目标性能的第一模型;响应于第一节点的本地模型库内存储有符合目标性能的第一模型,第一节点利用第一模型训练出能够执行第二节点的工作任务的第二模型,并传输给第二节点。本发明旨通过计算能力强的节点帮助不具备模型训练能力的节点进行模型训练,一方面提高了模型的性能;另一方面保护了用户的隐私,同时模型的传输量通常远小于数据的传输量,提升了通信效率。
技术领域
本发明涉及通信技术领域,尤其涉及模型训练方法、装置、电子设备及存储介质。
背景技术
在未来的万物智联网络中,网络节点趋向于智能化,网络节点智能化导致了信息空间快速扩张、甚至维度灾难,加剧了表征信息承载空间的难度,导致传统的网络服务能力与高维信息空间难以匹配,通信传输的数据量过大,信息业务服务系统无法持续满足人们复杂、多样和智能化信息传输的需求。而通过人工智能模型来编码、传播、解码业务信息,可显著降低通信业务中的数据传输量,极大地提升了信息传输效率。这些模型相对稳定,并具有复用性、传播性。模型的传播和复用将有助于增强网络智能,同时降低开销和资源浪费,形成节点极智、网络极简的智简网络。
目前绝大多数的用户节点不具备模型训练能力,但因为其本地存储的模型可能无法执行一些目标性能较高的人工智能任务,因此多采用将用户节点中的数据全部或部分卸载到边缘节点或云服务器进行处理,一方面大量数据传输带来了延迟,这对一些时延要求严格的业务来说是非常受影响的,另一方面,将用户数据上传至边缘节点或云服务器也会带来隐私安全方面的问题。因此,现亟需一种辅助用户节点训练模型的方法,使得用户节点能够利用训练好的模型执行某些目标性能较高的人工智能任务,保护用户的隐私安全。
发明内容
本发明提供了一种用于在智简网络中进行模型训练的方法、装置、电子设备以及存储介质。
根据本发明的一方面,提供了一种模型训练方法,包括:
第一节点获取第二节点发送的模型训练请求,所述模型训练请求包括所述第二节点的工作任务所需的目标性能;
所述第一节点根据所述模型训练请求查询本地模型库内是否存储有符合所述目标性能的第一模型;
响应于所述第一节点的本地模型库内存储有符合所述目标性能的所述第一模型,所述第一节点利用所述第一模型训练出能够执行所述第二节点的工作任务的第二模型,并传输给所述第二节点。
可选的,模型训练方法还包括:
响应于所述第一节点的本地模型库内没有存储符合所述目标性能的所述第一模型,所述第一节点向第三节点发起模型传输请求;
所述第一节点接收所述第三节点传输的符合所述目标性能的第三模型,并利用所述第三模型训练得到所述第二模型传输给所述第二节点。
可选的,所述第一节点训练出所述第二模型的方法包括:
所述第一节点利用所述第二节点的原始数据对所述第一模型进行训练得到所述第二模型;或者
所述第一节点利用所述第一模型对所述第二节点的原始模型进行知识蒸馏,将所述第一模型中提取的特征与所述原始模型进行融合得到所述第二模型。
可选的,所述第一节点训练出所述第二模型的方法包括:
所述第一节点利用所述第二节点的原始数据对所述第三模型进行训练得到所述第二模型;或者
所述第一节点利用所述第三模型对所述第二节点的原始模型进行知识蒸馏,将所述第三模型中提取的特征与所述原始模型进行融合得到所述第二模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210065282.8/2.html,转载请声明来源钻瓜专利网。