[发明专利]用于执行指令的处理器、归一化加法运算的方法、通信设备、机器可读介质、用于处理指令的设备和设备有效
申请号: | 201380061966.X | 申请日: | 2013-06-27 |
公开(公告)号: | CN104823153B | 公开(公告)日: | 2018-02-13 |
发明(设计)人: | S·卢巴诺维奇;T·庞斯;A·格雷德斯廷;Z·斯波伯 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/305 | 分类号: | G06F9/305;G06F9/06 |
代理公司: | 上海专利商标事务所有限公司31100 | 代理人: | 张东梅 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 引导 变化 预测 逻辑 | ||
1.一种用于执行指令的处理器,包括:
至少一个浮点单元,包括:
加法器,所述加法器将第一操作数X与第二操作数Y相加,以获得具有位长度n的输出操作数;
引导变化预测器LCA逻辑,耦合到所述加法器,用于:
对于所述输出操作数的从n-1到1的每一个位位置i,获得所述第一操作数X的位值组,并基于所述第一操作数X和所述第二操作数Y,获得传播值组,其中,所述第一操作数X的所述位值组包括所述第一操作数X的第一位值Xi和第二位值Xi-1;以及
基于所述传播值组、所述第一位值Xi和所述第二位值Xi-1,生成LCA掩码;以及
移位器,其耦合到所述加法器以及所述LCA逻辑,基于所述LCA掩码,归一化所述输出操作数。
2.如权利要求1所述的处理器,其特征在于,所述LCA逻辑包括异或非XNOR门、异-或XOR门、与AND门以及或OR门,其中所述XOR门耦合到所述加法器和所述XNOR门的输出,其中所述AND门耦合到所述加法器和所述XOR门的输出,其中所述OR门耦合到所述加法器和所述AND门的输出。
3.如权利要求2所述的处理器,其特征在于,所述XNOR门用于接收所述第一位值Xi和所述第二位值Xi-1作为输入。
4.如权利要求1所述的处理器,其特征在于,所述第一操作数X还包括第三位值Xi+1,所述LCA逻辑用于对于所述输出操作数的从n-1到1的每一个位位置i,获得所述第二操作数Y的位值组,所述第二操作数Y的位值组包括所述第二操作数Y的第一位值Yi、第二位值Yi-1和第三位值Yi+1,所述传播值组包括对应于Xi XOR Yi的第一传播值Pi,对应于值Xi-1XOR Yi-1的第二传播值Pi-1,以及对应于值Xi+1XOR Yi+1的第三传播值Pi+1。
5.如权利要求4所述的处理器,其特征在于,XOR门从所述加法器接收所述第三传播值pi+1作为输入,其中AND门从所述加法器接收所述第二传播值Pi-1的逆作为输入,其中OR门从所述加法器接收所述第一传播值Pi作为输入。
6.如权利要求1所述的处理器,其特征在于,所述LCA逻辑与所述加法器并行地操作,其中所述移位器在第一时间点接收所述LCA掩码,其中所述移位器在第二时间点接收所述输出操作数,其中所述第一时间点等于或早于所述第二时间点。
7.如权利要求1所述的处理器,其特征在于,对于所述输出操作数中的每一个引导1或0,所述LCA掩码包括第一值位。
8.如权利要求7所述的处理器,其特征在于,所述LCA掩码进一步包括对应于所述输出操作数的最高有效位MSB的位位置处的第二值位。
9.如权利要求8所述的处理器,其特征在于,所述移位器基于所述输出操作数的所述MSB的所述位位置,确定移位长度,其中所述移位器通过将所述输出操作数移位所述移位长度,获得归一化的输出操作数。
10.如权利要求9所述的处理器,其特征在于,所述至少一个浮点单元进一步包括将由所述移位器获得的所述归一化的输出操作数舍入的舍入器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380061966.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:针对在线系统中的用户动作的定制化预测器
- 下一篇:受控的热量释放