[发明专利]用于执行指令的处理器、归一化加法运算的方法、通信设备、机器可读介质、用于处理指令的设备和设备有效

申请号：	201380061966.X	申请日：	2013-06-27
公开（公告）号：	CN104823153B	公开（公告）日：	2018-02-13
发明（设计）人：	S·卢巴诺维奇;T·庞斯;A·格雷德斯廷;Z·斯波伯	申请（专利权）人：	英特尔公司
主分类号：	G06F9/305	分类号：	G06F9/305;G06F9/06
代理公司：	上海专利商标事务所有限公司31100	代理人：	张东梅
地址：	美国加利***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	引导变化预测逻辑
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

各实施例一般涉及浮点运算。

背景技术

现代的处理器包括用于对数据执行运算的各种电路。此电路可包括浮点单元(FPU)，该浮点单元可包括对浮点数字执行运算的功能。例如，浮点运算可包括加法、减法、乘法、除法以及平方根。这样的浮点运算可以大量地用于某些应用中，诸如图形、游戏、科学，以及工程应用中。

附图说明

图1A-1B是根据一个或多个实施例的系统的框图。

图2是根据一个或多个实施例的框图。

图3是根据一个或多个实施例的序列。

图4是根据一个或多个实施例的处理器的框图。

图5是根据一个或多个实施例的多域处理器的框图。

图6是包括多个核的处理器的实施例的框图。

图7是根据本发明的一个或多个实施例的系统的框图。

图8是根据本发明的一个或多个实施例的系统的框图。

具体实施方式

一般而言，浮点单元(FPU)可以表示使用三个元素(即二进制符号位、二进制编码的指数以及二进制编码的尾数)的浮点数。在类加法运算中，尾数可以被移位，以校准指数。如此处所使用的，除加法运算之外，术语“类加法”运算还包括减法运算、最小函数、最大函数，及其他，诸如整数到浮点，以及浮点到整数转换，以及双精度到单精度以及单精度到双精度转换，以及浮点比较指令。

在某些情况下，由类加法运算所产生的尾数可包括引导零(在正结果的情况下)或引导1(在负结果的情况下)。通常，引导零预测器(LZA)可以与加法器并行地使用，以预测加法器的输出尾数中的引导零的数量。可以将引导零的此数量提供到移位器，然后，该移位器可以移位输出尾数，以删除任何引导零。类似地，引导1预测器(LOA)可以预测引导1的数量，如此，可以和移位器一起使用，以从输出尾数中删除任何引导1。引导1或零的这样的删除可以被称为“归一化”输出尾数。

由于这样的LZA和LOA通常被实现为单独的电路，因此，检测引导1 和引导零可能需要大量的可用的处理器资源(例如，处理器管芯上的面积)。进一步，可能需要选择器以对于每一个运算，确定要使用LZA或LOA中的哪一个。此外，LZA、LOA，和/或选择器可能会对完成浮点运算产生时间延迟，由此，降低处理器性能。

根据一些实施例，可以提供引导预测器变化(LCA)。在一个或多个实施例中，LCA可以是预测类加法浮点运算的输出中的引导1和0两者的单一电路，并可以被用来归一化这样的输出。在某些实施例中，LCA可以比其他技术(例如，LZA、LOA以及选择器)消耗较少的处理器资源。进一步，LCA可以提供引导零/1预测，而不会对浮点运算产生时间延迟，由此提高处理器性能。

参考图1A，所示是根据一个或多个实施例的系统100的框图。在某些实施例中，系统100可以是电子设备或组件的全部或一部分。例如，系统100可以被包括在蜂窝电话、计算机、服务器、网络设备、处理器、片上系统(SoC)、控制器、无线收发器、电源单元等等中。

如图1A所示，系统100可以包括耦合到存储器140的处理器110。处理器110可包括浮点单元(FPU)120。在某些实施例中，FPU 120可包括执行浮点运算(例如，加法、减法、乘法、除法等等)的功能。

尽管本发明的范围在这方面不受限制，但是，在许多实现中，FPU 120可以适应给定格式或标准(例如，给定的电气与电子工程师学会(IEEE)标准) 的操作数。进一步，给定实现可以被用来处理各种类型的传入的数据，包括可以是单精度以及双精度浮点格式的操作数。

如图所示，FPU 120可包括加法单元125。在某些实施例中，加法单元125 可以表示包括执行类加法的浮点运算的功能的任何单元。例如，加法单元125 可以是加法器。在另一个示例中，加法单元125可以是熔合乘法-加法(FMA) 单元，包括乘法器、加法器，以及舍入器。下面参考图1B讨论了加法单元125 的示例实施例。

在其中加法单元125是FMA单元的各实施例中，此FMA单元可以执行浮点乘法累积运算，并适应给定格式(例如，给定的电气与电子工程师学会 (IEEE)标准，诸如用于浮点(FP)算术的IEEE标准754-2008(2008年发布) 的)的操作数。此外，给定实现可以被用来处理各种类型的传入的数据，包括可以是单精度以及双精度浮点格式的操作数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于英特尔公司，未经英特尔公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201380061966.X/2.html，转载请声明来源钻瓜专利网。

上一篇：针对在线系统中的用户动作的定制化预测器
下一篇：受控的热量释放

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于执行指令的处理器、归一化加法运算的方法、通信设备、机器可读介质、用于处理指令的设备和设备有效

专利文献下载