[发明专利]神经网络量化方法、装置及设备在审
申请号: | 202211274626.2 | 申请日: | 2022-10-18 |
公开(公告)号: | CN115952855A | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 陈辉;罗佳;王康 | 申请(专利权)人: | 展讯通信(上海)有限公司 |
主分类号: | G06N3/082 | 分类号: | G06N3/082;G06N3/0464;G06N3/048 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张海明;黄健 |
地址: | 201203 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 量化 方法 装置 设备 | ||
本申请提供一种神经网络量化方法、装置及设备,该方法包括:在预训练神经网络模型中,确定每层的权重和激活值的值域范围;根据值域范围,确定备选量化算法以及初始量化参数;备选量化算法中包括至少一种预设量化算法;基于备选量化算法训练初始量化参数,得到第一量化参数以及第一量化模型;若第一量化模型的精度大于或者等于预设精度阈值,将第一量化参数确定为目标量化参数,并且将第一量化模型确定为目标量化模型。这样,通过综合各层的值域范围来选取至少一种预设量化算法进行组合优化,并在量化训练基于精度判断确定出目标量化模型,能够提高量化模型整体的精度,降低量化误差。
技术领域
本申请涉及神经网络技术领域,尤其涉及一种神经网络量化方法、装置及设备。
背景技术
随着人工智能技术的不断发展,神经网络技术的应用越来越广泛。神经网络模型通常是采用浮点进行训练的,具有较大的参数量和计算量,并且内存占用也较大。而模型量化可以是指将信号的连续取值近似为有限多个离散值的过程。模型量化可以为神经网络模型压缩参数、提升速度以及降低内存占用,能够有效提升神经网络的性能。
相关技术通常采用训练后量化(Post Training Quantization,PTQ)等方式对神经网络进行量化,这种量化方式基于每层数值进行量化,量化后的神经网络模型整体精度不高,量化误差较大。
发明内容
本申请提供一种神经网络量化方法、装置及设备,能够提高神经网络量化后模型的整体精度,降低量化误差。
第一方面,本申请实施例提供一种神经网络量化方法,包括:
在预训练神经网络模型中,确定每层的权重和激活值的值域范围;
根据所述值域范围,确定备选量化算法以及初始量化参数;所述备选量化算法中包括至少一种预设量化算法;
基于所述备选量化算法训练所述初始量化参数,得到第一量化参数以及第一量化模型;
若所述第一量化模型的精度大于或者等于预设精度阈值,将所述第一量化参数确定为目标量化参数,并且将所述第一量化模型确定为目标量化模型。
在一种可能的实施方式中,所述确定每层的权重和激活值的值域范围,包括:
以预设校准数据集为输入,对所述预训练神经网络模型进行浮点推理,确定每层的第一数值分布;
根据所述第一数值分布,确定出每层的权重和激活值的值域范围。
在一种可能的实施方式中,所述基于所述备选量化算法训练所述初始量化参数,得到第一量化参数以及第一量化模型,包括:
确定训练数据集;
以所述训练数据集为输入,采用初始量化参数对所述预训练神经网络模型进行训练,得到所述第一量化参数以及所述第一量化模型。
在一种可能的实施方式中,所述方法还包括:
若所述第一量化模型的精度小于预设精度阈值,重新确定备选量化算法以及初始量化参数并进行训练,直至所述第一量化模型满足预设精度阈值。
在一种可能的实施方式中,所述方法还包括:
确定验证数据集,并以验证数据集为输入,统计所述目标量化模型每层的第二数值分布;
基于所述第二数值分布与所述第一数值分布,确定量化误差并生成误差分布表。
在一种可能的实施方式中,所述方法还包括:
以验证数据集为输入,对目标量化模型进行推理,获取推理结果;
确定推理结果错误时对应的错误样本,并确定所述错误样本在所述目标量化模型中的第一逐层计算结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于展讯通信(上海)有限公司,未经展讯通信(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211274626.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种资金安全数字化管控方法及平台
- 下一篇:塑料文具表面镜面油墨印刷方法