[发明专利]用于确定直方图的指令有效
申请号: | 201380062290.6 | 申请日: | 2013-06-14 |
公开(公告)号: | CN104823156B | 公开(公告)日: | 2018-07-17 |
发明(设计)人: | 郭狮中 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06F9/46 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘瑜;王英 |
地址: | 美国加*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 输入矢量 加法器电路 电路 功能单元 指令执行 耦合 直方图 处理器 流水线 匹配 指令 | ||
说明的处理器具有指令执行流水线的功能单元。功能单元具有比较库电路和加法器电路。比较库电路比较第一输入矢量的一个或多个元素与第二输入矢量的元素。加法器电路耦合至所述比较库电路,用于以所述第一输入矢量的逐个元素的方式,增加匹配所述第一输入矢量的值的所述第二输入矢量的元素的数量。
技术领域
发明的领域通常涉及计算系统,并且更具体而言,涉及用于确定直方图的指令。
背景技术
图1示出在半导体芯片上用逻辑电路实现的处理核心100的高层图。处理核心包含流水线101。流水线包括多个阶段,每个设计为执行完全执行程序代码指令所需要的多步骤处理中的特定步骤。这些典型地至少包含:1)指令获取和解码;2)数据获取3)执行;4)写回。当数据由相同的指令识别并在之前阶段中获取(例如,在上述步骤2)中)时,执行特定操作的执行阶段由指令识别,该指令在另一个之前阶段中被获取并解码(例如,在上述步骤1)中)。被操作的数据典型地从(通用)寄存器存储空间102获取。在操作完成时创建的新数据也典型地“写回”到寄存器存储空间(例如,在上述4)阶段处)。
关联于执行阶段的逻辑电路典型地由多个“执行单元”或者“功能单元”103_1至103_N组成,其每个设计为执行其自身的操作的唯一子集(例如,第一功能单元执行整数数学操作,第二功能单元执行浮点指令,第三功能单元执行从/向缓存/存储器的加载/存储操作等)。由所有功能单元执行的所有操作的集合对应于处理核心100支持的“指令集”。
在计算机科学领域广泛知晓2个类型的处理器架构:“标量”和“矢量”。标量处理器被设计为执行对单集合数据执行操作的指令,而矢量处理器被设计为执行对多集合数据执行操作的指令。图2A和2B呈现展示了标量处理器与矢量处理器之间的基本差异的比较例。
图2A示出标量AND指令的示例,其中,单个操作数集A和B被AND在一起来生成单数(singular)(或者“标量”)结果C(即,AB=C)。与此相反,图2B示出矢量AND指令的示例,其中,2个操作数集A/B和D/E分别被AND,以生成矢量结果C,F(即,A.AND.B=C且D.AND.E=F)。关于术语,“矢量”是具有多个“元素”的数据元素。例如,矢量V=Q、R、S、T、U具有5个不同元素:Q、R、S、T和U。示例性矢量V的“尺寸”是5(因为其具有5个元素)。
图1还示出不同于通用寄存器空间102的矢量寄存器空间104的存在。具体而言,通用寄存器空间102在名义上被用于存储标量值。这样,当任何执行单元执行标量操作时,其在名义上使用从(并将结果写回)通用寄存器存储空间102调用的操作数。与此相反,当任何执行单元执行矢量操作时,其在名义上使用从(并将结果写回)矢量寄存器空间107调用的操作数。存储器的不同区域可以同样被分配用于存储标量值和矢量值。
还要注意的是,在向功能单元103_1至103_N的输入处和从功能单元103_1至103_N的输出处相应存在掩蔽(masking)逻辑104_1至104_N和105_1至105_N。在各种实施方式中,实际上仅实现这些层中的一个—尽管不是严格要求。对于采用掩蔽的任何指令,输入掩蔽逻辑104_1至104_N和/或输出掩蔽逻辑105_1至105_N可以被用于控制:针对矢量指令,哪些元素被有效地操作。此处,掩蔽矢量从掩蔽寄存器空间106读出(例如,连同从矢量寄存器存储空间107读出的输入数据矢量),并且被呈现给掩蔽逻辑104、105层中的至少一个。
在执行矢量程序代码的过程中,每个矢量指令不需要要求全数据字。例如,用于一些指令的输入矢量可以仅是8个元素,用于其他指令的输入矢量可以是16个元素,用于其他指令的输入矢量可以是32个元素等。因此,掩蔽层104/105被用于识别适用于特定指令的全矢量数据字的元素的集合,以便跨指令影响不同的矢量尺寸。典型地,对于每个矢量指令而言,保持在掩蔽寄存器空间106中的特定掩蔽模式由指令调出、从掩蔽寄存器空间获取并被提供至掩蔽层104/105中的一个或者两个,来“启用”对于特定矢量操作的元素的正确集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380062290.6/2.html,转载请声明来源钻瓜专利网。