[发明专利]提供向量压缩和旋转功能的指令和逻辑有效
申请号: | 201310524909.2 | 申请日: | 2013-10-30 |
公开(公告)号: | CN103793201B | 公开(公告)日: | 2017-08-11 |
发明(设计)人: | T·乌利尔;E·乌尔德-艾哈迈德-瓦勒;R·瓦伦丁 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 王英,张立达 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提供 向量 压缩 旋转 功能 指令 逻辑 | ||
技术领域
本公开涉及处理逻辑、微处理器和相关联的指令集架构的领域,当由所述处理器或其它处理逻辑执行时,所述相关联的指令集架构执行逻辑、算术或其它功能操作。具体地说,本公开涉及用于提供向量压缩和旋转功能的指令和逻辑。
背景技术
现代处理器经常包括用于提供操作的指令,这些操作是计算密集的,但是提供能够经过使用例如以单指令多数据(SIMD)向量寄存器为例的各种数据存储设备的有效实现来开发的高级数据并行性。中央处理单元(CPU)可以然后提供并行硬件以支持处理向量。向量是保持多个连续数据元素的数据结构。具有尺寸M的向量寄存器可以包含具有尺寸O的N个向量元素,其中N=M/O。例如,可以将64字节向量寄存器划分为(a)64个向量元素,每一个元素保持占据1个字节的数据项,(b)32个向量元素以保持每一个占据2个字节(或一个“字”)的数据项,(c)16个向量元素以保持每一个占据4个字节(或一个“双字”)的数据项,或(d)8个向量元素以保持每一个占据8个字节(或一个“四倍字”)的数据项。
使应用或软件代码向量化可以包括使应用在例如以宽的或大的宽度向量架构为例的特定系统或指令集架构上编译、安装和/或运行。
计算行业发展了各种编程基准以测试架构和诸如向量化、同时多线程、预测等等的计算技术的效率。一组这样的基准来自标准性能评估公司(SPEC)。SPEC基准广泛用于“检测”处理器和平台架构的性能。构成SPEC基准的程序由行业专业人员进行描绘和分析,试图发现新的编译和计算技术以改善计算机性能。被称为CPU2006的SPEC基准组之一包括被选择以强调系统的处理器、存储器子系统和编译器的整数和浮点CPU密集的基准。CPU2006包括根据NAMD的数据布局和内环推导的被称为444.NAMD的程序,一种用于模拟由伊利诺伊大学厄巴纳-尚佩恩分校的理论和计算生物组的Jim Phillips开发的大生物分子系统的并行程序。将NAMD的几乎所有运行时间都花费在计算小组功能中的原子间交互上。这一组与大量代码分离以形成对于CPU2006的紧凑基准。计算核心在宽范围的机器架构上实现良好的性能,但是不包含平台特定的优化。
程序NAMD是2002年Gordon Bell并行可扩展性奖金的获胜者,但是串行性能同样重要。在人们例如对基准的大多数并行部分中的全部进行向量化之后,不可向量化的串行部分典型地代表基准的运行时间的甚至更显著的部分。这一情况是对于具有高并行可扩展性的计算密集程序的通常情况的典型示例。在使用向量化来加速大多数并行部分之后,还存在移除性能限制问题和瓶颈以改善程序的另外的不可向量化或串行部分的性能的艰难工作。
目前为止,还没有充分探究对于这样的性能限制问题和瓶颈的潜在解决方案。
附图说明
在附图中通过示例而非限制的方式说明了本发明。
图1A是执行用于提供向量压缩和旋转功能的指令的系统的一个实施例的方框图。
图1B是执行用于提供向量压缩和旋转功能的指令的系统的另一实施例的方框图。
图1C是执行用于提供向量压缩和旋转功能的指令的系统的另一实施例的方框图。
图2是执行用于提供向量压缩和旋转功能的指令的处理器的一个实施例的方框图。
图3A说明了根据一个实施例的压缩数据类型。
图3B说明了根据一个实施例的压缩数据类型。
图3C说明了根据一个实施例的压缩数据类型。
图3D说明了根据一个实施例用于提供向量压缩和旋转功能的指令编码。
图3E说明了根据另一实施例用于提供向量压缩和旋转功能的指令编码。
图3F说明了根据另一实施例用于提供向量压缩和旋转功能的指令编码。
图3G说明了根据另一实施例用于提供向量压缩和旋转功能的指令编码。
图3H说明了根据另一实施例用于提供向量压缩和旋转功能的指令编码。
图4A说明了用于执行提供向量压缩和旋转功能的指令的处理器微架构的一个实施例的元素。
图4B说明了用于执行提供向量压缩和旋转功能的指令的处理器微架构的另一实施例的元素。
图5是执行提供向量压缩和旋转功能的指令的处理器的一个实施例的方框图。
图6是执行提供向量压缩和旋转功能的指令的计算机系统的一个实施例的方框图。
图7是执行提供向量压缩和旋转功能的指令的计算机系统的另一实施例的方框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310524909.2/2.html,转载请声明来源钻瓜专利网。