[发明专利]全精度及部分精度数值的计算方法及装置有效
申请号: | 201710499092.6 | 申请日: | 2017-06-27 |
公开(公告)号: | CN107315710B | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 张淮声;梁达成;陈博明;卞仁玉 | 申请(专利权)人: | 上海兆芯集成电路有限公司 |
主分类号: | G06F15/80 | 分类号: | G06F15/80;G06T1/20 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王新宇 |
地址: | 201203 上海市张*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 精度 部分 数值 计算方法 装置 | ||
1.一种全精度及部分精度数值的计算方法,由一指令解码单元执行,包含:
解码从一编译器传来的一指令请求;以及
依据上述指令请求中的一指令模式执行m次循环以产生m个计算一第一类型数据的微指令或执行n次循环以产生n个计算一第二类型数据的微指令,使得多个算术逻辑组完成一个线程的多个通道计算,
其中,m小于n,并且上述第一类型数据的精度低于上述第二类型数据的精度;
其中,每一上述算术逻辑组包含:
一第一类运算通道;以及
多个第二类运算通道,
其中,当上述指令模式为一第一模式时,上述第一类运算通道及上述第二类运算通道中的每一者独立完成一组第一类型数据的计算;以及,当上述指令模式为一第二模式时,上述第二类运算通道的每一者计算一组第二类型数据的一部份以产生部分结果,并且上述第一类运算通道合并上述第二类运算通道输出的上述部分结果并使用上述合并结果完成上述组第二类型数据的计算。
2.如权利要求1所述的全精度及部分精度数值的计算方法,其中,上述指令模式记 录于上述指令请求的最高比特。
3.如权利要求1所述的全精度及部分精度数值的计算方法,其中,上述第一类型数据为使用24比特表示的一部分精度数据,上述第二类型数据为使用32比特表示的一全精度数据,m为2,以及n为8。
4.如权利要求1所述的全精度及部分精度数值的计算方法,其中,每一上述算术逻辑组包含:组控制器,依据一微指令类型指示上述第一类运算通道及上述第二类运算通道中的每一者运行于上述第一模式或上述第二模式。
5.如权利要求1所述的全精度及部分精度数值的计算方法,其中,上述第一类运算通道及上述第二类运算通道中的每一者,运行于上述第一模式时,独立完成一计算:
dest=Src0xSrc 1+Src2,
Src0、Src1及Scr2 代表三个来源存储装置中的上述第一类型数据,以及dest代表即将储存于一目的地存储装置的上述第一类型数据,或即将输出至一后处理单元的上述第一类型数据。
6.如权利要求1所述的全精度及部分精度数值的计算方法,其中,运行于上述第二模式时,上述第一类运算通道及上述第二类运算通道合作完成一计算:
dest=Src0xSrc 1+Src2,
Src0、Src1及Scr2 代表三个来源存储装置中的上述第二类型数据,及dest代表即将储存于一目的地存储装置的上述第二类型数据,或即将输出至一后处理单元的上述第二类型数据。
7.如权利要求6所述的全精度及部分精度数值的计算方法,其中,Src0、Src1及Scr2 中的每一者为包含一24比特尾数的一浮点数,以及上述第二类运算通道包含一第一运算单元、一第二运算单元及一第三运算单元,
其中,上述第一运算单元将Src0的尾数的高8比特乘以Src1的尾数的低16比特以产生一第一结果,上述第二运算单元将Src0的尾数的低16比特乘以Src1的尾数的高8比特以产生一第二结果,上述第三运算单元将Src0的尾数的高8比特乘以Src1的尾数的高8比特以产生一第三结果,上述第一类运算通道计算Src0的尾数的低16比特乘以Src1的尾数的低16比特以产生一第四结果,
其中,上述第一类运算通道将上述第三结果左移16比特,将上述第四结果右移16比特,加总上述第一结果、上述第二结果、位移后第三结果及位移后第四结果以产生Src0xSrc1的一尾数,
其中,上述第一类运算通道计算Src0xSrc1的一指数,将Src0xSrc1的上述尾数加上Src2的一尾数以产生dest的一尾数,将Src0xSrc1的上述指数及Src2的一指数中的较大者选择为dest的一指数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海兆芯集成电路有限公司,未经上海兆芯集成电路有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710499092.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:RJ45型双网四串口服务器
- 下一篇:一种自适应的外生变量识别方法