[发明专利]神经网络量化、应用方法、装置和计算设备在审

申请号：	201811286005.X	申请日：	2018-10-31
公开（公告）号：	CN111126557A	公开（公告）日：	2020-05-08
发明（设计）人：	沈旭;杨继伟;邓兵;黄建强;华先胜	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08;G06N20/00
代理公司：	北京思睿峰知识产权代理有限公司 11396	代理人：	孟玉洁;谢建云
地址：	开曼群岛大开曼***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	神经网络量化应用方法装置计算设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种神经网络量化方法，包括：

获取待量化的神经网络模型，从所述神经网络模型的参数中确定多个待量化的参数；

将每个所述待量化的参数转化为一个公共因子和一个量化因子的乘积，其中，所述公共因子为第一数据类型的数值，所述量化因子为第二数据类型的数值，且第一数据类型所占用的存储空间大于第二数据类型所占用的存储空间；

采用所述第一数据类型存储所述多个待量化的参数的公共因子，以及采用所述第二数据类型分别存储所述多个待量化的参数的量化因子。

2.如权利要求1所述的方法，其中，所述待量化的神经网络模型的参数采用第一数据类型存储。

3.如权利要求1所述的方法，其中，所述待量化的参数为神经网络模型的权重。

4.如权利要求1所述的方法，其中，所述第一数据类型为32位浮点型，所述第二数据类型为8位整型。

5.如权利要求1所述的方法，其中，所述将每个所述待量化的参数转化为一个公共因子和一个量化因子的乘积的步骤包括：

在所述神经网络模型中设置第一量化函数，所述第一量化函数包括待定参数，所述第一量化函数的输入为第一数据类型的待量化的参数，输出为该待量化的参数所对应的公共因子和量化因子的乘积；

采用第一样本集对包含第一量化函数的神经网络模型进行训练，以确定所述第一量化函数的待定参数，其中，所述第一样本集为用于训练所述神经网络模型所采用的训练样本集合的子集；

根据训练好的第一量化函数来确定待量化的参数所对应的公共因子和量化因子。

6.如权利要求5所述的方法，其中，在所述将每个所述待量化的参数转化为一个公共因子和一个量化因子的乘积的步骤之后，还包括：在神经网络模型中删除所述第一量化函数。

7.如权利要求5所述的方法，还包括：

在所述神经网络模型中设置第二量化函数，所述第二量化函数包括待定参数，所述第二量化函数的输入为第一数据类型的节点的输出值，输出为该节点的输出值所对应的公共因子和量化因子的乘积；

采用第一样本集对包含第二量化函数的神经网络模型进行训练，以确定所述第二量化函数的待定参数，其中，所述第一样本集为用于训练所述神经网络模型所采用的训练样本集合的子集；

根据训练好的第二量化函数来确定节点的输出值所对应的公共因子和量化因子。

8.如权利要求5所述的方法，其中，所述第一量化函数z₁为：

其中，α₁、β₁、o₁为待定参数，n、s_i、T、b_i为预设的常数，σ()为预设的基函数，α₁为公共因子，为量化因子，w为待量化的参数值。

9.如权利要求7所述的方法，其中，所述第二量化函数z₂为：

其中，α₂、β₂、o₂为待定参数，n、s_i、T、b_i为预设的常数，σ()为预设的基函数，α₂为公共因子，为量化因子，h为节点的输出值。

10.如权利要求8或9所述的方法，其中，n为预设的量化值集合中所包括的量化值的个数，s_i为量化值集合中第i+1个量化值与第i个量化值之差。

11.如权利要求8或9所述的方法，其中，所述基函数为全定义域可微且值域具有上下限的函数。

12.如权利要求11所述的方法，其中，σ()为sigmoid函数或tanh函数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司，未经阿里巴巴集团控股有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811286005.X/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载