[发明专利]神经网络数据的量化方法、装置、系统及可读存储介质在审
申请号: | 202211350986.6 | 申请日: | 2022-10-31 |
公开(公告)号: | CN115640840A | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 霍成海;张楠赓 | 申请(专利权)人: | 杭州嘉楠耘智信息科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/0495 |
代理公司: | 北京市中伦律师事务所 11410 | 代理人: | 操寒 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 数据 量化 方法 装置 系统 可读 存储 介质 | ||
本发明提供了神经网络数据的量化方法、装置、系统及可读存储介质,该方法包括:获取神经网络的校准输出数据;根据校准输出数据的概率分布信息选取量化边界值,确定神经网络的目标量化范围;根据目标量化范围,对神经网络的输出进行量化。利用上述方法,能够降低神经网络输出数据的量化精度损失。
技术领域
本发明属于数据量化领域,具体涉及一种神经网络数据的量化方法、装置、系统及可读存储介质。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
神经网络模型的量化是指把神经网络模型中的参数,从高精度数据转换成低精度数据,使得神经网络模型的大小变小,运行速度变快,且准确率与量化前相近。其中,神经网络模型的量化包括两个阶段,即权重数据的量化和输出数据的量化。常用的量化技术有Int8量化,Int8量化是指将神经网络数据,例如双精度(64位)、单精度(32位)或半精度(16位)和输入数据(双进度、单精度或半精度),通过线性或者非线性方法映射为8位的量化数据。
现有技术中,通常采用均匀映射量化(UNIFORM AFFINE QUANTIZER)方式对神经网络数据进行量化,也即将根据原始浮点数据的最大浮点值和最小浮点值确定原始量化范围,并将原始量化范围内的原始浮点数据按缩放系数统一地映射为均匀分布的整型数据。然而,上述均匀映射量化在实际量化过程中通常会导致较大的神经网络数据的量化误差,降低了神经网络模型的精度。
因此,如何降低神经网络数据的量化误差是一个亟待解决的问题。
发明内容
针对上述现有技术中存在的问题,提出了一种神经网络数据的量化方法、装置、系统及计算机可读存储介质,利用这种方法、装置、系统及计算机可读存储介质,能够解决上述问题。
本发明提供了以下方案。
第一方面,提供一种神经网络数据的量化方法,包括:获取神经网络的校准输出数据;根据校准输出数据的概率分布信息选取量化边界值,确定神经网络的目标量化范围;根据目标量化范围,对神经网络的输出进行量化。
在一种实施方式中,确定神经网络的目标量化范围,还包括:根据校准输出数据的概率分布信息,得到概率密度函数;根据概率密度函数的累积分布函数选取量化边界值,确定神经网络的目标量化范围。
在一种实施方式中,根据概率密度函数的累积分布函数选取量化边界值,还包括:根据累积分布函数的斜率,确定量化边界值。
在一种实施方式中,从累积分布函数的端点向中心逐点计算每个点的斜率;当检测到斜率超过预设阈值的目标点,根据目标点确定量化边界值。
在一种实施方式中,还包括:从累积分布函数的端点向中心逐点计算每个点的斜率;当连续检测到N个点的斜率超过预设阈值时,确定N个点中靠近端点的目标点,根据目标点确定量化边界值;N为大于1的整数。
在一种实施方式中,还包括:若量化为对称量化,从累积分布函数的任意一侧端点向中心逐点计算每个点的斜率。
在一种实施方式中,还包括:若量化为非对称量化,从累积分布函数的两端分别向中心逐点计算每个点的斜率。
在一种实施方式中,根据累积分布函数的斜率,确定量化边界值,还包括:从累积分布函数的最小值端点,正向逐点搜索斜率超过预设阈值的最小目标点,根据最小目标点确定目标量化范围的最小量化边界值;和/或,从累积分布函数的最大值端点,反向逐点搜索斜率超过预设阈值的最大目标点,根据最大目标点确定目标量化范围的最大量化边界值。
在一种实施方式中,还包括:对累积分布函数进行归一化处理;按照累积分布函数的设定比例区间,去除累积分布函数的最大值区间和/或最小值区间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州嘉楠耘智信息科技有限公司,未经杭州嘉楠耘智信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211350986.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置