[发明专利]一种基于小样本的网络模型压缩云端服务方法和装置有效
申请号: | 202110287729.1 | 申请日: | 2021-03-17 |
公开(公告)号: | CN112906870B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 胡文政;李磊;王建强;张长水;陈道昌 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N3/063;G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 样本 网络 模型 压缩 云端 服务 方法 装置 | ||
1.一种基于小样本的网络模型压缩云端服务方法,应用于车载设备,其特征在于,包括以下步骤:
获取用户通过车载设备端上传的数据信息,所述数据信息包括待压缩模型的信息、第一样本集合和压缩要求;
根据所述待压缩模型的信息和所述压缩要求确定压缩方案,并根据所述第一样本集合生成第二样本集合,并计算所述第二样本集合中各个样本的初始置信度,其中,所述第二样本集合包括具有与所述第一样本集合中第一样本的第一标签相关联的第二标签的第二样本;
根据所述压缩方案和所述各个样本的初始置信度对待压缩模型进行迭代式压缩优化,以获得初步压缩模型;
根据所述第一样本集合对所述初步压缩模型进行微调,以得到目标压缩模型,
在得到所述目标压缩模型之后,还包括:
在所述车载设备端下载所述目标压缩模型供用户使用,
其中,所述待压缩模型的信息包括模型结构,所述根据所述待压缩模型的信息和所述压缩要求确定压缩方案包括:
根据所述模型结构搜索相同模型在其他任务上的压缩结果,获取其他任务上满足所述压缩要求的模型各层保留通道数,将所述模型各层保留通道数作为任务上的历史模型压缩经验;
所述模型各层保留通道数为:
其中,L为模型层数,M为检索到满足要求的相关模型的数量。
2.如权利要求1所述的方法,其特征在于,所述根据所述第一样本集合生成第二样本集合包括:
根据所述第一样本集合,搜索与所述第一样本的第一标签的相似度高于预设阈值的第二标签,并将具有所述第二标签的第二样本加入至第二样本集合。
3.如权利要求1所述的方法,其特征在于,所述计算所述第二样本集合中各个样本的初始置信度包括:
根据所述第二样本集合及待压缩模型的信息获取模型的最后特征层的输出,通过下述公式计算所述第二样本集合中各个样本的初始置信度:
其中F(xi;Θ)表示所述待压缩模型信息包含的待压缩模型特征层的输出,F(xi;Θ)j表示F(xi;Θ)的第j个值,τ为给定的数值平滑常数,该公式表示对于任意xi∈D1,属于第j类的概率,D1表示所述第二样本集合。
4.如权利要求1所述的方法,其特征在于,所述根据所述压缩方案和所述各个样本的初始置信度对待压缩模型进行迭代式压缩优化,包括:
根据所述历史模型压缩经验初始化保留通道数;
优化初始化后的保留通道数,根据优化后的各层保留通道数进行优化压缩模型,生成初步压缩模型。
5.如权利要求4所述的方法,其特征在于,根据所述历史模型压缩经验,通过下述公式初始化保留通道数:
其中d为各层保留通道数,M为检索到满足要求的相关模型的数量,i为自变量,i=0,...,M。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110287729.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:磁集成器件
- 下一篇:电极片及其制备方法以及电池