[发明专利]提供向量压缩和旋转功能的指令和逻辑有效
申请号: | 201310524909.2 | 申请日: | 2013-10-30 |
公开(公告)号: | CN103793201B | 公开(公告)日: | 2017-08-11 |
发明(设计)人: | T·乌利尔;E·乌尔德-艾哈迈德-瓦勒;R·瓦伦丁 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 王英,张立达 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提供 向量 压缩 旋转 功能 指令 逻辑 | ||
1.一种处理器,包括:
掩码寄存器,包括第一多个数据字段,其中,所述掩码寄存器中的所述第一多个数据字段中的每一个与向量中的元素单元相对应;
解码级,用于对指定向量源操作数、所述掩码寄存器、向量目的地操作数和向量目的地偏移的第一指令进行解码;以及
一个或多个执行单元,用于响应于解码的第一指令来执行以下操作:
读取所述掩码寄存器中的所述第一多个数据字段的多个值;
对于所述掩码寄存器中的所述第一多个数据字段中的第一值,将相对应的第一向量元素从所述向量源操作数拷贝到所述向量目的地操作数中的第一相邻顺序元素单元,所述第一向量元素在所述向量目的地偏移单元处;
在将相对应的第一向量元素从所述向量源操作数拷贝到所述向量目的地操作数中的所述第一相邻顺序元素单元之后,将所述掩码寄存器中的所述第一值从第一未掩蔽值改变到第一掩蔽值;
对于所述掩码寄存器中的所述第一多个数据字段中的第二值,将相对应的第二向量元素从所述向量源操作数拷贝到所述向量目的地操作数中的第二相邻顺序元素单元;以及
在将相对应的第二向量元素从所述向量源操作数拷贝到所述向量目的地操作数中的所述第二相邻顺序元素单元之后:
将所述掩码寄存器中的所述第二值从第二未掩蔽值改变到第二掩蔽值,所述第一掩蔽值和所述第二掩蔽值用于跟踪解码的第一指令的完成进展;
确定所述向量目的地操作数已满并且将所述向量目的地操作数存储到存储器中;
将所述向量目的地偏移单元设置为零;以及
使用所述第一掩蔽值、所述第二掩蔽值和所述向量目的地偏移单元来重新执行所述第一指令以压缩第三向量元素。
2.如权利要求1所述的处理器,其中,来自所述向量源操作数的相对应的第一和第二向量元素被拷贝到以所述向量目的地操作数中的元素单元的总数量为模的相邻顺序元素单元。
3.如权利要求2所述的处理器,其中,所述第一指令是向量压缩和旋转指令。
4.如权利要求1所述的处理器,其中,来自所述向量源操作数的相对应的第一和第二向量元素被拷贝到在所述向量目的地偏移单元处开始的相邻顺序元素单元,仅直到填充了最高有效向量目的地元素单元为止。
5.如权利要求4所述的处理器,其中,所述第一指令是向量压缩、填充和旋转指令。
6.如权利要求1所述的处理器,其中,所述第一未掩蔽值为一。
7.如权利要求5所述的处理器,其中,所述第二掩蔽值为零。
8.如权利要求1所述的处理器,其中,拷贝到所述向量目的地操作数中的所述第一向量元素和所述第二向量元素是32位数据元素。
9.如权利要求1所述的处理器,其中,拷贝到所述向量目的地操作数中的所述第一向量元素和所述第二向量元素是64位数据元素。
10.如权利要求1所述的处理器,其中,所述向量目的地操作数是128位向量寄存器。
11.如权利要求1所述的处理器,其中,所述向量目的地操作数是256位向量寄存器。
12.如权利要求1所述的处理器,其中,所述向量目的地操作数是512位向量寄存器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310524909.2/1.html,转载请声明来源钻瓜专利网。