[发明专利]用于对齐寄存器的系统、装置和方法有效
申请号: | 201710458693.2 | 申请日: | 2012-03-29 |
公开(公告)号: | CN107273095B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | J·C·圣阿德里安;R·E·桑斯;M·B·吉尔卡尔;L·K·吴;D·R·布拉德福德;V·W·李 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘瑜;王英 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 对齐 寄存器 系统 装置 方法 | ||
1.一种在计算机处理器中执行对齐指令的方法,包括:
取出所述对齐指令,其中所述对齐指令包括写屏蔽操作数、目的地操作数、第一源操作数、第二源操作数和偏移值;
对所取出的对齐指令进行解码;
通过如下操作来执行经解码的对齐指令:
将所述第一源操作数的第一多个数据元素和所述第二源操作数的第二多个数据元素串接,
基于所述偏移值将串接的数据元素向右移位,以及
对于所述写屏蔽的多个最低有效位中的每个位,确定该位是否指示向右移位的、串接的数据元素中的相应数据元素将被存储在目的地的相应位置上;以及
将所述向右移位的、串接的数据元素中的已被确定为应当存储到所述目的地的那些数据元素存储在所述目的地中的所述相应位置上。
2.如权利要求1所述的方法,其中所述写屏蔽是16位寄存器。
3.如权利要求1所述的方法,其中所述偏移值是8位立即数值。
4.如权利要求1所述的方法,还包括:
确定是否使用所述写屏蔽;以及
如果不使用所述写屏蔽,则将所述向右移位的、串接的数据元素中的数据元素存储在所述目的地的所述相应位置上,而不对于所述写屏蔽的所述多个最低有效位中的每个位,确定该位是否指示向右移位的、串接的数据元素中的相应数据元素将被存储在目的地的相应位置上。
5.如权利要求1所述的方法,其中针对所述写屏蔽的所述多个最低有效位中的每个位并行地进行所述确定。
6.如权利要求1所述的方法,其中所述第一源操作数和所述第二源操作数是512位寄存器。
7.如权利要求1所述的方法,其中所述第二源操作数是512位存储器单元,并且来自所述存储器单元的数据元素在所述第一源操作数和所述第二源操作数的串接之前被加载到临时的512位寄存器中。
8.如权利要求1所述的方法,其中所述第一源操作数的数据元素是所述向右移位的、串接的数据元素中的最低有效数据元素。
9.一种执行对齐指令的方法,包括:
响应于包括第一源操作数、第二源操作数、目的地操作数、写屏蔽操作数和偏移的对齐指令,
将所述第一源操作数的第一数据元素集合与所述第二源操作数的第二数据元素集合串接;
将串接的数据元素向右移位X数据元素,其中X是在所述对齐指令中提供的立即数值;以及
对于写屏蔽的第一位位置,确定所述第一位位置是否指示经移位的、串接的数据元素中的相应数据元素将被存储在目的地的相应位置上,
当所述写屏蔽的所述第一位位置指示所述经移位的、串接的数据元素中的所述相应数据元素应当被存储时,将所述经移位的、串接的数据元素中的所述相应数据元素存储在所述目的地中的相应位置上,并且
当所述写屏蔽的所述第一位位置指示其相应数据元素不应被存储在所述目的地中时,不对所述目的地中的所述相应位置上的数据元素进行处理。
10.如权利要求9所述的方法,还包括:
对于写屏蔽的第二位位置,确定所述第二位位置是否指示所述经移位的、串接的数据元素中的相应数据元素将被存储在所述目的地中的相应位置上,
当所述写屏蔽的所述第二位位置指示所述经移位的、串接的数据元素中的所述相应数据元素应当被存储时,将所述经移位的、串接的数据元素中的所述相应数据元素存储在所述目的地的相应位置上,并且
当所述写屏蔽的所述第二位位置指示其相应数据元素不应当被存储在所述目的地中时,不对所述目的地中的所述相应位置上的数据元素进行处理。
11.如权利要求10所述的方法,还包括:
当所述写屏蔽的最后一个位位置已被评估以确定所述经移位的、串接的数据元素中的相应数据元素是否将被存储在所述目的地中的相应位置上时,确定完成所述对齐指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710458693.2/1.html,转载请声明来源钻瓜专利网。