[发明专利]合并相邻的聚集/分散操作有效
申请号: | 201710795886.7 | 申请日: | 2012-12-26 |
公开(公告)号: | CN107562444B | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | A·T·福塞斯;B·J·希克曼;J·C·豪尔;C·J·休斯 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 张欣;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及合并相邻的聚集/分散操作。根据一个实施例,处理器包括指令解码器,其用于对第一指令进行解码,该第一指令用于聚集来自存储器的数据元素,该第一指令具有指定第一存储位置的第一操作数和指定存储多个数据元素的第一存储器地址的第二操作数。该处理器进一步包括执行单元,其耦合至指令解码器,响应于第一指令,该执行单元用于:基于由第二操作数指示的第一存储器地址,从存储器位置中读取数据元素中连续的第一数据元素和第二数据元素;并且将该第一数据元素存储在第一存储位置的第一条目中,将该第二数据元素存储在对应于第一存储位置的第一条目的、第二存储位置的第二条目中。 | ||
搜索关键词: | 合并 相邻 聚集 分散 操作 | ||
【主权项】:
一种处理器,包括:多个64位通用寄存器;多个128位单指令多数据(SIMD)寄存器;数据高速缓存器;指令高速缓存器;第二级(L2)高速缓存器,耦合至所述数据高速缓存器,并且耦合至所述指令高速缓存器;分支预测单元;指令转换后备缓冲器(TLB),耦合至所述指令高速缓存器;指令取出单元;解码单元,耦合至所述指令取出单元,所述解码单元用于对多个指令解码,所述多个指令包括第一指令,所述第一指令用于指示128位操作数尺寸,所述第一指令具有第一字段和第二字段,所述第一字段用于指定所述多个128位SIMD寄存器中的第一128位SIMD目的地寄存器,所述第二字段用于指定所述多个64位通用寄存器中的一个64位通用寄存器来存储基址,并且所述第一指令用于指示64位的数据元素宽度;和执行单元,耦合至所述解码单元,耦合至所述多个128位SIMD寄存器,并且耦合至所述多个64位通用寄存器,所述执行单元用于:根据所述基址,加载来自存储器的第一结构和第二结构,所述第一结构包括第一64位数据元素、第二64位数据元素和第三64位数据元素,所述第二结构包括第一64位数据元素、第二64位数据元素和第三64位数据元素,其中第一结构的第一64位数据元素、第二64位数据元素和第三64位数据元素将是所述存储器中连续元素,所述第二结构的第一64位数据元素、第二64位数据元素和第三64位数据元素将是所述存储器中连续元素;并且将所述第一结构的所述第一64位数据元素存储为所述第一128位SIMD目的地寄存器的第一64位数据元素,将所述第一结构的所述第二64位数据元素存储为所述第二128位SIMD目的地寄存器的第一64位数据元素,将所述第一结构的所述第三64位数据元素存储为所述第三128位SIMD目的地寄存器的第一64位数据元素,将所述第二结构的所述第一64位数据元素存储为所述第一128位SIMD目的地寄存器的第二64位数据元素,将所述第二结构的所述第二64位数据元素存储为所述第二128位SIMD目的地寄存器的第二64位数据元素,将所述第二结构的所述第三64位数据元素存储为所述第三128位SIMD目的地寄存器的第二64位数据元素,其中所述第一128位SIMD目的地寄存器的所述第一64位数据元素包括所述第一128位SIMD目的地寄存器的最低有效位,所述第二128位SIMD目的地寄存器的所述第一64位数据元素包括所述第二128位SIMD目的地寄存器的最低有效位,所述第三128位SIMD目的地寄存器的所述第一64位数据元素包括所述第三128位SIMD目的地寄存器的最低有效位。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710795886.7/,转载请声明来源钻瓜专利网。