[发明专利]神经网络数据的量化方法、装置、系统及可读存储介质在审

专利信息
申请号: 202211350986.6 申请日: 2022-10-31
公开(公告)号: CN115640840A 公开(公告)日: 2023-01-24
发明(设计)人: 霍成海;张楠赓 申请(专利权)人: 杭州嘉楠耘智信息科技有限公司
主分类号: G06N3/08 分类号: G06N3/08;G06N3/0495
代理公司: 北京市中伦律师事务所 11410 代理人: 操寒
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 神经网络 数据 量化 方法 装置 系统 可读 存储 介质
【说明书】:

发明提供了神经网络数据的量化方法、装置、系统及可读存储介质,该方法包括:获取神经网络的校准输出数据;根据校准输出数据的概率分布信息选取量化边界值,确定神经网络的目标量化范围;根据目标量化范围,对神经网络的输出进行量化。利用上述方法,能够降低神经网络输出数据的量化精度损失。

技术领域

本发明属于数据量化领域,具体涉及一种神经网络数据的量化方法、装置、系统及可读存储介质。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

神经网络模型的量化是指把神经网络模型中的参数,从高精度数据转换成低精度数据,使得神经网络模型的大小变小,运行速度变快,且准确率与量化前相近。其中,神经网络模型的量化包括两个阶段,即权重数据的量化和输出数据的量化。常用的量化技术有Int8量化,Int8量化是指将神经网络数据,例如双精度(64位)、单精度(32位)或半精度(16位)和输入数据(双进度、单精度或半精度),通过线性或者非线性方法映射为8位的量化数据。

现有技术中,通常采用均匀映射量化(UNIFORM AFFINE QUANTIZER)方式对神经网络数据进行量化,也即将根据原始浮点数据的最大浮点值和最小浮点值确定原始量化范围,并将原始量化范围内的原始浮点数据按缩放系数统一地映射为均匀分布的整型数据。然而,上述均匀映射量化在实际量化过程中通常会导致较大的神经网络数据的量化误差,降低了神经网络模型的精度。

因此,如何降低神经网络数据的量化误差是一个亟待解决的问题。

发明内容

针对上述现有技术中存在的问题,提出了一种神经网络数据的量化方法、装置、系统及计算机可读存储介质,利用这种方法、装置、系统及计算机可读存储介质,能够解决上述问题。

本发明提供了以下方案。

第一方面,提供一种神经网络数据的量化方法,包括:获取神经网络的校准输出数据;根据校准输出数据的概率分布信息选取量化边界值,确定神经网络的目标量化范围;根据目标量化范围,对神经网络的输出进行量化。

在一种实施方式中,确定神经网络的目标量化范围,还包括:根据校准输出数据的概率分布信息,得到概率密度函数;根据概率密度函数的累积分布函数选取量化边界值,确定神经网络的目标量化范围。

在一种实施方式中,根据概率密度函数的累积分布函数选取量化边界值,还包括:根据累积分布函数的斜率,确定量化边界值。

在一种实施方式中,从累积分布函数的端点向中心逐点计算每个点的斜率;当检测到斜率超过预设阈值的目标点,根据目标点确定量化边界值。

在一种实施方式中,还包括:从累积分布函数的端点向中心逐点计算每个点的斜率;当连续检测到N个点的斜率超过预设阈值时,确定N个点中靠近端点的目标点,根据目标点确定量化边界值;N为大于1的整数。

在一种实施方式中,还包括:若量化为对称量化,从累积分布函数的任意一侧端点向中心逐点计算每个点的斜率。

在一种实施方式中,还包括:若量化为非对称量化,从累积分布函数的两端分别向中心逐点计算每个点的斜率。

在一种实施方式中,根据累积分布函数的斜率,确定量化边界值,还包括:从累积分布函数的最小值端点,正向逐点搜索斜率超过预设阈值的最小目标点,根据最小目标点确定目标量化范围的最小量化边界值;和/或,从累积分布函数的最大值端点,反向逐点搜索斜率超过预设阈值的最大目标点,根据最大目标点确定目标量化范围的最大量化边界值。

在一种实施方式中,还包括:对累积分布函数进行归一化处理;按照累积分布函数的设定比例区间,去除累积分布函数的最大值区间和/或最小值区间。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州嘉楠耘智信息科技有限公司,未经杭州嘉楠耘智信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211350986.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top