[发明专利]一种压缩和解压缩神经网络模型的方法及设备在审
申请号: | 202010843266.8 | 申请日: | 2020-08-20 |
公开(公告)号: | CN114077893A | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 夏文;胡甄博;邹翔宇;曹建龙;陶喆 | 申请(专利权)人: | 华为技术有限公司;哈尔滨工业大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 李杭 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 压缩 和解 神经网络 模型 方法 设备 | ||
本申请实施例公开了一种压缩和解压缩神经网络模型的方法及设备,用于降低神经网络模型对存储资源的占用。本申请实施例方法包括:获取M个待压缩数据集合,每个待压缩数据集合中包含神经网络模型的至少一个参数的实际值,M为大于1的整数;根据M个不同的目标压缩参数对M个待压缩数据集合中各参数的实际值进行压缩,以得到M个压缩数据集合,每个压缩数据集合中包含神经网络模型的至少一个参数的压缩值,M个不同的目标压缩参数与M个待压缩数据集合一一对应。
技术领域
本申请实施例涉及人工智能技术领域,尤其涉及一种压缩和解压缩神经网络模型的方法及设备。
背景技术
随着科学技术的进步与发展,人工智能的影响越来越大。近些年来,伴随着相关技术的进步,人工智能技术也迈进了快速发展的阶段。相比于其他人工智能技术,神经网络方法的精度更高,但也存在不足。例如,神经网络模型的结构较复杂,神经网络模型的参数较多,导致神经网络模型需要占用大量的存储资源。
因此,需要一种压缩神经网络模型的方法,以降低神经网络模型对存储资源的占用。
发明内容
本申请实施例提供了一种压缩和解压缩神经网络模型的方法及设备,用于降低神经网络模型对存储资源的占用。
本申请实施例第一方面提供了一种压缩神经网络模型的方法,可以应用于训练神经网络模型的服务器或终端设备中,包括:
获取M个待压缩数据集合,每个待压缩数据集合中包含神经网络模型的至少一个参数的实际值,M为大于1的整数,神经网络模型的参数可以是神经元的权值,M的取值可以根据实际需要进行调整;根据M个不同的目标压缩参数对M个待压缩数据集合中各参数的实际值进行压缩,以得到M个压缩数据集合,每个压缩数据集合中包含神经网络模型的至少一个参数的压缩值,M个不同的目标压缩参数与M个待压缩数据集合一一对应,目标压缩参数是指压缩过程中使用的参数,例如,该目标压缩参数可以为相对误差,也可以是绝对误差。
根据M个不同的目标压缩参数对M个待压缩数据集合中各参数的实际值进行压缩,能够在保证神经网络模型的性能不明显下降的情况下,提高压缩比,以提升压缩效果,减少神经网络模型对存储资源的占用。
在一种实现方式下,神经网络模型由N层神经元构成,N为大于1的整数;每个待压缩数据集合中包含N层神经元中一层或多层神经元的参数的实际值。
在该实现方式下,压缩同一层神经元的参数的实际值所使用的目标压缩参数相同。
在一种实现方式下,M个待压缩数据集合包括第一待压缩数据集合;第一待压缩数据集合包含多层神经元的参数的实际值,且第一待压缩数据集合包含的多层神经元在神经网络模型中的位置是连续的。
由于位置相近的参数的改变对神经网络模型的影响程度相近,所以将位置连续的多层神经元的参数的实际值组成一个待压缩数据集合,从而实现采用同一目标压缩参数对位置连续的多层神经元的参数的实际值进行压缩。
在一种实现方式下,M个待压缩数据集合包括第二待压缩数据集合,第二待压缩数据集合与M个不同的目标压缩参数中的第一目标压缩参数对应;根据M个不同的目标压缩参数对M个待压缩数据集合中各参数的实际值进行压缩,以得到M个压缩数据集合包括:根据第一目标压缩参数对第二待压缩数据集合包含的X层神经元的参数的实际值进行层层压缩,以得到X组参数的压缩值,X组参数的压缩值与X层神经元一一对应,且构成一个压缩数据集合,X为小于N的正整数。
在该实现方式下,每压缩一层神经元的参数的实际值,得到一组参数的压缩值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;哈尔滨工业大学,未经华为技术有限公司;哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010843266.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:触控面板及触控设备
- 下一篇:一种植物基纤维素纳米纤丝及其制备方法与应用