[发明专利]处理器、用于计算系统的方法、机器可读介质和计算机系统有效
申请号: | 201611063814.5 | 申请日: | 2011-12-23 |
公开(公告)号: | CN106775592B | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | J·考博尔圣阿德里安;A·T·福塞斯;T·D·弗莱切;L·K·吴;E·斯普林格 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 姬利永 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 三个 标量 超级 madd 指令 | ||
公开了使用三个标量项的超级乘加(超级MADD)指令。描述了具有执行单元逻辑电路的处理核,所述执行单元逻辑电路使第一寄存器存储第一向量输入操作数,使第二寄存器存储第二向量输入操作数,以及第三寄存器存储包含标量输入操作数a、b、c的打包数据结构。所述执行单元逻辑电路还包括用于执行操作(a*(第一向量输入操作数))+(b*(第二向量操作数))+c的乘法器。
本申请是国际申请日为2011年12月23日、中国国家阶段申请号为201180075792.3、题为“使用三个标量项的超级乘加(超级MADD)指令”的发明专利申请的分案申请。
技术领域
本发明的领域一般涉及计算系统,且尤其涉及使用三个标量项的超级多次加法指令。
背景技术
图1示出了用半导体芯片上的逻辑电路来实现的处理核100的高级示图。
该处理核包括流水线101。该流水线由各自被设计成在完全执行程序代码指令所需的多步骤过程中执行特定步骤的多个级组成。这些通常至少包括: 1)指令取出和解码;2)数据取出;3)执行;4)写回。执行级对由相同指令标识出并在另一上述先前级(例如,步骤2)中被取出的数据执行由上述先前步骤(例如在步骤1)中所取出和解码的指令所标识出的特定操作。被操作的数据通常是从(通用)寄存器存储空间102中取出的。在该操作完成时所创建的新数据通常也被“写回”到寄存器存储空间(例如,在级4处)。
与执行级相关联的逻辑电路通常由多个“执行单元”或“功能单元”103_1至 103_N构成,这些单元各自被设计成执行其自身的独特的操作子集(例如,第一功能单元执行整数数学操作,第二功能单元执行浮点指令,第三功能单元执行自/至高速缓存/存储器的加载/存储操作等等)。由所有这些功能单元执行的所有操作的集合与处理核100所支持的“指令集”相对应。
两种类型的处理器架构在计算机科学领域中被广泛认可:“标量”和“向量”。标量处理器被设计成执行对单个数据集进行操作的指令,而向量处理器被设计成执行对多个数据集进行操作的指令。图2A和图2B示出比较示例,其例示了标量处理器和向量处理器之间的基本不同之处。
图2A示出标量AND(与)指令的示例,其中单个操作数集A和B被加在一起以产生奇异(或“标量”)结果C(即,AB=C)。相比之下,图2B示出向量AND指令的示例,其中两个操作数集A/B和D/E并行地分别加在一起以同时产生向量结果C和F(即,A.AND.B=C和D.AND.E=F)。根据术语学,“向量”是具有多个“元素”的数据元素。例如,向量V=Q,R,S,T,U 具有五个不同元素:Q,R,S,T和U。示例性向量V的“大小”为五(因为它具有五个元素)。
图1还示出与通用寄存器空间102不同的向量寄存器空间107的存在。具体而言,通用寄存器空间102名义上用于存储标量值。由此,当执行单元中的任一个执行标量操作时,它们名义上执行从通用寄存器存储空间102中调用的操作数(并且将结果写回到通用寄存器存储空间102)。相比之下,当执行单元中的任一个执行向量操作时,它们名义上执行从向量寄存器空间107调用的操作数(并且将结果写回向量寄存器空间107)。存储器的不同区域可类似地被分配以供存储标量值和向量值。
还注意到,在到功能单元103_1至103_N的相应输入以及来自功能单元 103_1至103_N的相应输出处,存在掩码逻辑104_1至104_N以及105_1至 105_N。在各种实现中,对于向量操作,这些层中只有一层实际上被实现——尽管这并不是严格的要求(尽管图1中未描绘,但可以想到,仅执行标量操作而非向量操作的执行单元不需要具有任何掩码层)。对于采用掩码的任何向量指令,输入掩码逻辑104_1至104_N和/或输出掩码逻辑105_1至105_N可用于控制针对该向量指令对哪些元素进行有效地操作。这里,掩码向量是从掩码寄存器空间106中被读取(例如,连同从向量寄存器存储空间107中被读取的输入操作数向量一起)并且被呈现给掩码逻辑104、105层中的至少一者。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611063814.5/2.html,转载请声明来源钻瓜专利网。