[发明专利]一种模型分发方法、装置、及电子设备在审
申请号: | 202111110669.2 | 申请日: | 2021-09-18 |
公开(公告)号: | CN115841131A | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 鲍媛媛;孔德群;徐青青;马帅 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N3/08 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 张博 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 分发 方法 装置 电子设备 | ||
本申请公开了一种模型分发方法、装置及电子设备,涉及通信技术领域,以解决现有通用模型分发机制易导致终端设备宕机,影响实际业务体验问题。该方法包括:云服务器接收终端设备发送的请求信息,其中,所述请求信息包括需求模型信息和使用场景信息;所述云服务器从通用模型集合中确定与所述需求模型信息匹配的目标通用模型;所述云服务器根据所述使用场景信息,对所述目标通用模型进行适应性调整,得到调整后的目标适配模型;所述云服务器向所述终端设备发送所述目标适配模型。本申请实施例可保证下发的目标适配模型能够较好地适配终端设备的实际需求场景,进而可避免终端设备宕机,保障实际业务体验。
技术领域
本申请涉及通信技术领域,尤其涉及一种模型分发方法、装置及电子设备。
背景技术
深度学习模型的结构通常较为复杂且参数众多,需要大规模标注数据和大量的计算资源来支撑模型训练,因此深度学习模型的训练过程通常在云服务器侧进行。现有技术中的模型分发方案,通过云服务器基于海量训练数据进行通用模型的训练,并将训练得到的通用模型分发到各个雾计算节点或终端设备。然而,这种通用模型分发机制未考虑实际业务场景中的差异,容易导致终端设备宕机,影响实际业务体验。
发明内容
本申请实施例提供一种模型分发方法、装置及电子设备,以解决现有通用模型分发机制易导致终端设备宕机,影响实际业务体验的问题。
第一方面,本申请实施例提供了一种模型分发方法,包括:
云服务器接收终端设备发送的请求信息,其中,所述请求信息包括需求模型信息和使用场景信息;
所述云服务器从通用模型集合中确定与所述需求模型信息匹配的目标通用模型;
所述云服务器根据所述使用场景信息,对所述目标通用模型进行适应性调整,得到调整后的目标适配模型;
所述云服务器向所述终端设备发送所述目标适配模型。
可选地,所述云服务器接收终端设备发送的请求信息,包括:
所述云服务器接收所述终端设备发送的携带有所述需求模型信息的模型请求;
所述从通用模型集合中确定与所述需求模型信息匹配的目标通用模型之后,所述方法还包括:
所述云服务器向所述终端设备发送模型检索结果,其中,所述模型检索结果用于指示存在与所述需求模型信息匹配的所述目标通用模型;
所述云服务器接收终端设备发送的请求信息,还包括:
所述云服务器接收所述终端发送的所述使用场景信息。
可选地,所述通用模型集合中存储有多个通用模型的标识信息和模型文件,所述标识信息包括模型用途信息,所述需求模型信息包括需求模型用途信息;
所述云服务器从通用模型集合中确定与所述需求模型信息匹配的目标通用模型,包括:
所述云服务器确定所述通用模型集合中模型用途信息与所述需求模型用途信息的相似度大于预设阈值的所述目标通用模型。
可选地,所述云服务器根据所述使用场景信息,对所述目标通用模型进行适应性调整,包括:
所述云服务器从预定义的搜索空间中选择不同取值策略,并测试所述目标通用模型在使用不同取值策略时的目标参数信息是否符合所述使用场景信息,根据测试结果,确定目标取值策略;其中,所述搜索空间包括M类模型取值集合,一个取值策略包括M个模型取值,不同模型取值属于不同类模型取值集合,M为正整数;
所述云服务器使用所述目标取值策略调整所述目标通用模型。
可选地,所述使用场景信息包括所述终端设备的业务需求信息,所述业务需求信息包括准确率要求;所述目标通用模型的数量为N个,N为正整数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团有限公司,未经中国移动通信有限公司研究院;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111110669.2/2.html,转载请声明来源钻瓜专利网。