[发明专利]排序加速处理器、方法、系统和指令有效
申请号: | 201510090544.6 | 申请日: | 2015-02-28 |
公开(公告)号: | CN104951401B | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | S·格伦;V·克拉斯诺夫 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F12/02 | 分类号: | G06F12/02;G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 姬利永 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 排序 加速 处理器 方法 系统 指令 | ||
一方面的处理器包括多个紧缩数据寄存器以及用于解码指令的解码单元。该指令可以指示包括至少四个数据元素的第一源紧缩数据,用于指示包括至少四个数据元素的第二源紧缩数据,并且用于指示目的地存储位置。执行单元与紧缩数据寄存器和解码单元耦合。响应于该指令,执行单元用于将结果紧缩数据存储在目的地存储位置中。结果紧缩数据可以包括可以标识第一和第二源紧缩数据中相应数据元素位置的至少四个索引。索引可以存储在结果紧缩数据中表示第一和第二源紧缩数据中相应数据元素的经排序次序的位置中。
技术领域
本文所述的各实施例一般涉及处理器。特别地,本文所述的各实施例一般涉及在处理器中排序数据。
背景技术
数据排序操作广泛应用于计算机、服务器、数据中心、排序网络等等。例如,排序操作通常用于诸如电子数据表、数据库、结构化查询语言(SQL)数据库或服务器、数据中心、高性能计算(HPC)、Apache Hadoop软件框架、图像处理(例如用于中值滤波器、姿势识别等等)、以及神经网络。排序操作,尤其是当排序大型数据集时,可能是计算密集的,并且可能会影响总体性能。
附图说明
可通过参考以下描述以及用于示出实施例的附图最佳地理解本发明。在附图中:
图1是可操作用于执行排序加速指令的实施例的处理器实施例的框图。
图2是执行单源排序索引指令的方法实施例的流程框图。
图3是单源排序索引操作的实施例的框图。
图4是单源排序索引和数据元素操作的实施例的框图。
图5是执行双源排序索引指令的实施例的方法实施例的流程框图。
图6是数据元素最小一半双源排序索引操作的实施例的框图。
图7是数据元素最大一半双源排序索引操作的实施例的框图。
图8是数据元素最小一半双未排序源排序索引操作的实施例的框图。
图9是数据元素最小一半双源排序索引和数据操作的实施例的框图。
图10是数据元素最小一半带掩码双源排序索引操作的实施例的框图。
图11是数据元素最大一半带掩码双源排序索引操作的实施例的框图。
图12是数据元素最小一半带掩码双未排序源排序索引操作的实施例的框图。
图13是数据元素最小一半带掩码双源排序索引和排序数据操作的实施例的框图。
图14是合适的一组紧缩数据寄存器的实施例的框图。
图15A-15B是示出根据本发明的实施例的通用向量友好指令格式及其指令模板的框图。
图16A是示出根据本发明的实施例的示例性专用向量友好指令格式的框图。
图16B是示出根据本发明的一个实施例的构成完整操作码字段的专用向量友好指令格式的字段的框图。
图16C是示出根据本发明的一个实施例的构成寄存器索引字段的专用向量友好指令格式的字段的框图。
图16D是示出根据本发明的一个实施例的构成扩充(augmentation)操作字段的专用向量友好指令格式的字段的框图。
图17是寄存器架构的实施例的框图。
图18A是示出有序流水线实施例以及寄存器重命名、无序发布/执行流水线实施例的框图。
图18B是处理器核实施例的框图,该处理器核包括耦合到执行引擎单元的前端单元,并且两者耦合到存储器单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510090544.6/2.html,转载请声明来源钻瓜专利网。