[发明专利]一种浮点数据反量化及量化的方法和设备有效
申请号: | 202010028998.1 | 申请日: | 2020-01-12 |
公开(公告)号: | CN111240746B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 刘海威;张新;赵雅倩;董刚;杨宏斌;尹文枫 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F9/302 | 分类号: | G06F9/302;G06F9/38;G06N3/04 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 张涛 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 浮点 数据 量化 方法 设备 | ||
1.一种浮点数据反量化及量化的方法,其特征在于,包括以下步骤:
将存储器中的INT8数据转换成浮点数据;
提取所述浮点数据中的指数得到指数矩阵并将所述指数矩阵中的最大值存储到数据存储器;
响应于所述指数矩阵中的值不均为0,基于所述最大值得到移位矩阵;
基于所述移位矩阵计算得到用于卷积计算的尾数矩阵;
基于所述尾数矩阵进行卷积乘累加计算得到格式为FINT32的结果;
将所述格式为所述FINT32的结果转换成格式为fp32的数据以用于卷积输入通道的累加计算,其中将所述格式为所述FINT32的结果转换成格式为所述fp32的数据包括将格式为所述FINT32的数据的符号位保留作为最终数据的符号位,在FINT[23:0]这些bit中,从高位向低位寻找第一个1并记下索引,所述索引后的8bit即为新的尾数的高8bit,如果所述索引位置后不足8bit,则高位用0补足8bit,响应于找不到所述1,或者所述最大值中有一个数为0,则最终指数为0,根据公式计算得到新的符号位、指数和尾数以得到格式为所述fp32的最终结果。
2.根据权利要求1所述的方法,其特征在于,将存储器中的INT8数据转换成浮点数据包括:
从所述存储器中读取格式均为INT8的feature数据和filter数据,通过查找表的方式将格式为所述INT8的所述feature数据和filter数据转换为格式为fp32的浮点数据。
3.根据权利要求1所述的方法,其特征在于,还包括:
响应于所述指数矩阵中的值为0,得到尾数结果为8`b0。
4.根据权利要求1所述的方法,其特征在于,基于所述最大值得到移位矩阵包括:
用所述最大值减去所述指数矩阵得到移位矩阵。
5.根据权利要求1所述的方法,其特征在于,基于所述移位矩阵计算得到用于卷积计算的尾数矩阵包括:
取量化后的格式为所述fp32的所述浮点数据的尾数部分,前面加1`b1;
按照所述移位矩阵右移,然后取高7bit后,在前面添加1bit的符号位以得到用于计算的所述尾数矩阵。
6.根据权利要求1所述的方法,其特征在于,还包括:
将格式为所述fp32的数据转换成格式为所述INT8的数据。
7.根据权利要求6所述的方法,其特征在于,将格式为所述fp32的数据转换成格式为所述INT8的数据包括:
将格式为所述fp32数据的数值范围分为若干个区间,每个区间分配对应的量化值;
在FPGA中通过IP核计算出格式为所述fp32的整数部分Int和小数部分Frac;
利用Int即可找到对应的量化区间,然后计算格式为所述fp32数值在量化区间的位置,最后可得到格式为所述INT8的最终结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010028998.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:共识交易发送方法、设备和存储介质
- 下一篇:一种恶意软件行为检测方法和装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置