[发明专利]神经网络量化、应用方法、装置和计算设备在审
| 申请号: | 201811286005.X | 申请日: | 2018-10-31 |
| 公开(公告)号: | CN111126557A | 公开(公告)日: | 2020-05-08 |
| 发明(设计)人: | 沈旭;杨继伟;邓兵;黄建强;华先胜 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 孟玉洁;谢建云 |
| 地址: | 开曼群岛大开曼*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 神经网络 量化 应用 方法 装置 计算 设备 | ||
1.一种神经网络量化方法,包括:
获取待量化的神经网络模型,从所述神经网络模型的参数中确定多个待量化的参数;
将每个所述待量化的参数转化为一个公共因子和一个量化因子的乘积,其中,所述公共因子为第一数据类型的数值,所述量化因子为第二数据类型的数值,且第一数据类型所占用的存储空间大于第二数据类型所占用的存储空间;
采用所述第一数据类型存储所述多个待量化的参数的公共因子,以及采用所述第二数据类型分别存储所述多个待量化的参数的量化因子。
2.如权利要求1所述的方法,其中,所述待量化的神经网络模型的参数采用第一数据类型存储。
3.如权利要求1所述的方法,其中,所述待量化的参数为神经网络模型的权重。
4.如权利要求1所述的方法,其中,所述第一数据类型为32位浮点型,所述第二数据类型为8位整型。
5.如权利要求1所述的方法,其中,所述将每个所述待量化的参数转化为一个公共因子和一个量化因子的乘积的步骤包括:
在所述神经网络模型中设置第一量化函数,所述第一量化函数包括待定参数,所述第一量化函数的输入为第一数据类型的待量化的参数,输出为该待量化的参数所对应的公共因子和量化因子的乘积;
采用第一样本集对包含第一量化函数的神经网络模型进行训练,以确定所述第一量化函数的待定参数,其中,所述第一样本集为用于训练所述神经网络模型所采用的训练样本集合的子集;
根据训练好的第一量化函数来确定待量化的参数所对应的公共因子和量化因子。
6.如权利要求5所述的方法,其中,在所述将每个所述待量化的参数转化为一个公共因子和一个量化因子的乘积的步骤之后,还包括:在神经网络模型中删除所述第一量化函数。
7.如权利要求5所述的方法,还包括:
在所述神经网络模型中设置第二量化函数,所述第二量化函数包括待定参数,所述第二量化函数的输入为第一数据类型的节点的输出值,输出为该节点的输出值所对应的公共因子和量化因子的乘积;
采用第一样本集对包含第二量化函数的神经网络模型进行训练,以确定所述第二量化函数的待定参数,其中,所述第一样本集为用于训练所述神经网络模型所采用的训练样本集合的子集;
根据训练好的第二量化函数来确定节点的输出值所对应的公共因子和量化因子。
8.如权利要求5所述的方法,其中,所述第一量化函数z1为:
其中,α1、β1、o1为待定参数,n、si、T、bi为预设的常数,σ()为预设的基函数,α1为公共因子,为量化因子,w为待量化的参数值。
9.如权利要求7所述的方法,其中,所述第二量化函数z2为:
其中,α2、β2、o2为待定参数,n、si、T、bi为预设的常数,σ()为预设的基函数,α2为公共因子,为量化因子,h为节点的输出值。
10.如权利要求8或9所述的方法,其中,n为预设的量化值集合中所包括的量化值的个数,si为量化值集合中第i+1个量化值与第i个量化值之差。
11.如权利要求8或9所述的方法,其中,所述基函数为全定义域可微且值域具有上下限的函数。
12.如权利要求11所述的方法,其中,σ()为sigmoid函数或tanh函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811286005.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:疼痛治疗膏及其制备方法
- 下一篇:集成散热系统的充电口





