[发明专利]基于深度学习的模型压缩训练的方法、装置和设备在审
| 申请号: | 202111676487.1 | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN116432737A | 公开(公告)日: | 2023-07-14 |
| 发明(设计)人: | 请求不公布姓名 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
| 主分类号: | G06N3/082 | 分类号: | G06N3/082;G06N3/0495;G06N3/0464;G06N3/048 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 宋兴;黄健 |
| 地址: | 201306 上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 模型 压缩 训练 方法 装置 设备 | ||
1.一种基于深度学习的模型压缩训练的方法,其特征在于,所述深度学习模型包括多个算子,所述方法包括:
在对深度学习模型进行训练的迭代过程中,当运行至目标算子时,获取所述目标算子的输入数据,所述目标算子为数据待压缩的算子;
从映射关系存储文件中获取与所述目标算子对应的压缩参数,其中,所述映射关系存储文件中包括与每一目标算子对应的压缩参数;
基于与所述目标算子对应的压缩参数,对所述目标算子的输入数据进行压缩,以得到压缩数据;
根据所述压缩数据对所述深度学习模型进行训练。
2.根据权利要求1所述的方法,其特征在于,从映射关系存储文件中获取与所述目标算子对应的压缩参数,包括:
以所述目标算子的算子标识符为键值在映射关系存储文件中进行映射,获得与所述目标算子的算子标识符对应的压缩参数,作为与所述目标算子对应的压缩参数。
3.根据权利要求1所述的方法,其特征在于,基于与所述目标算子对应的压缩参数,对所述目标算子的输入数据进行压缩,以得到压缩数据,包括:
若基于预设策略确定与所述目标算子对应的压缩参数无需更新,则根据与所述目标算子对应的压缩参数,对所述目标算子的输入数据进行压缩,以得到压缩数据;
若基于预设策略确定与所述目标算子对应的压缩参数需要更新,则根据所述目标算子的输入数据计算新的压缩参数,根据所述新的压缩参数,对所述目标算子的输入数据进行压缩,以得到压缩数据。
4.根据权利要求3所述的方法,其特征在于,在根据所述目标算子的输入数据计算新的压缩参数之后,还包括:
将所述映射关系存储文件中与所述目标算子对应的压缩参数,更新为所述新的压缩参数。
5.根据权利要求3所述的方法,其特征在于,所述预设策略为所述目标算子的输入数据经过与所述目标算子对应的压缩参数的压缩之后得到的数据范围,是否在预设范围之内;
基于预设策略确定与所述目标算子对应的压缩参数无需更新,包括:若所述数据范围在所述预设范围之内,则确定与所述目标算子对应的压缩参数无需更新;
基于预设策略确定与所述目标算子对应的压缩参数需要更新,包括:若所述数据范围不在所述预设范围之内,则确定与所述目标算子对应的压缩参数需要更新。
6.根据权利要求3所述的方法,其特征在于,在若基于预设策略确定与所述目标算子对应的压缩参数无需更新之前,还包括:
在确定达到预设的更新间隔次数时,基于预设策略确定与所述目标算子对应的压缩参数是否需要更新。
7.根据权利要求6所述的方法,其特征在于,还包括:
当基于预设策略确定与所述目标算子对应的压缩参数连续预设次数无需更新时,调整所述预设的更新间隔次数,调整后的更新间隔次数大于所述预设的更新间隔次数;
在确定达到调整后的更新间隔次数时,基于预设策略确定与所述目标算子对应的压缩参数是否需要更新。
8.根据权利要求1-7中任一项所述的方法,其特征在于,还包括:
以算子标识符为键值、以压缩参数为映射值,建立算子标识符与压缩参数的映射关系;
通过序列化对所述映射关系进行存储,获得映射关系存储文件。
9.根据权利要求8所述的方法,其特征在于,从映射关系存储文件中获取与所述目标算子对应的压缩参数,包括:
通过反序列化对所述映射关系存储文件进行重建,获得算子标识符与压缩参数的映射关系;
基于所述目标算子的算子标识符在所述映射关系中进行匹配,将匹配到的压缩参数确定为与所述目标算子对应的压缩参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111676487.1/1.html,转载请声明来源钻瓜专利网。





