[发明专利]一种模型分发方法、装置、及电子设备在审
申请号: | 202111110669.2 | 申请日: | 2021-09-18 |
公开(公告)号: | CN115841131A | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 鲍媛媛;孔德群;徐青青;马帅 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N3/08 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 张博 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 分发 方法 装置 电子设备 | ||
1.一种模型分发方法,其特征在于,包括:
云服务器接收终端设备发送的请求信息,其中,所述请求信息包括需求模型信息和使用场景信息;
所述云服务器从通用模型集合中确定与所述需求模型信息匹配的目标通用模型;
所述云服务器根据所述使用场景信息,对所述目标通用模型进行适应性调整,得到调整后的目标适配模型;
所述云服务器向所述终端设备发送所述目标适配模型。
2.根据权利要求1所述的方法,其特征在于,所述云服务器接收终端设备发送的请求信息,包括:
所述云服务器接收所述终端设备发送的携带有所述需求模型信息的模型请求;
所述从通用模型集合中确定与所述需求模型信息匹配的目标通用模型之后,所述方法还包括:
所述云服务器向所述终端设备发送模型检索结果,其中,所述模型检索结果用于指示存在与所述需求模型信息匹配的所述目标通用模型;
所述云服务器接收终端设备发送的请求信息,还包括:
所述云服务器接收所述终端发送的所述使用场景信息。
3.根据权利要求1所述的方法,其特征在于,所述通用模型集合中存储有多个通用模型的标识信息和模型文件,所述标识信息包括模型用途信息,所述需求模型信息包括需求模型用途信息;
所述云服务器从通用模型集合中确定与所述需求模型信息匹配的目标通用模型,包括:
所述云服务器确定所述通用模型集合中模型用途信息与所述需求模型用途信息的相似度大于预设阈值的所述目标通用模型。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述云服务器根据所述使用场景信息,对所述目标通用模型进行适应性调整,包括:
所述云服务器从预定义的搜索空间中选择不同取值策略,并测试所述目标通用模型在使用不同取值策略时的目标参数信息是否符合所述使用场景信息,根据测试结果,确定目标取值策略;其中,所述搜索空间包括M类模型取值集合,一个取值策略包括M个模型取值,不同模型取值属于不同类模型取值集合,M为正整数;
所述云服务器使用所述目标取值策略调整所述目标通用模型。
5.根据权利要求4所述的方法,其特征在于,所述使用场景信息包括所述终端设备的业务需求信息,所述业务需求信息包括准确率要求;所述目标通用模型的数量为N个,N为正整数;
所述云服务器从预定义的搜索空间中选择不同取值策略对所述目标通用模型进行调整之前,所述方法还包括:
所述云服务器从N个目标通用模型中筛选出模型准确率信息符合所述准确率要求的初步适配模型。
6.根据权利要求4所述的方法,其特征在于,所述根据测试结果,确定目标取值策略,包括:
所述云服务器确定使所述目标通用模型的目标参数信息符合所述使用场景信息的多个待定取值策略,并确定所述目标通用模型分别使用每个待定取值策略时的模型准确率;
所述云服务器将使用时模型准确率最高的一个待定取值策略确定为所述目标取值策略。
7.根据权利要求4所述的方法,其特征在于,所述使用场景信息包括所述终端设备的业务需求信息,所述业务需求信息包括业务时延要求,所述目标参数信息包括模型运行时间;
和/或,所述使用场景信息包括所述终端设备的设备状态信息,所述设备状态信息包括空闲内存,所述目标参数信息包括模型大小;
和/或,所述使用场景信息包括所述终端设备的设备状态信息,所述设备状态信息包括剩余电量,所述目标参数信息包括模型需求电量。
8.根据权利要求4所述的方法,其特征在于,所述搜索空间包括模型精度取值集合和模型剪枝率取值集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团有限公司,未经中国移动通信有限公司研究院;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111110669.2/1.html,转载请声明来源钻瓜专利网。