[发明专利]使用SIMD指令集架构查找大数据集中最小和最大值的快速方法有效
申请号: | 201410096786.1 | 申请日: | 2014-03-17 |
公开(公告)号: | CN104050230B | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | L-A.唐;S-H.许 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F9/38 |
代理公司: | 中国专利代理(香港)有限公司72001 | 代理人: | 张金金,汤春龙 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 simd 指令 架构 查找 数据 集中 最小 最大值 快速 方法 | ||
技术领域
本文描述的实施例大体上涉及对于大数据集的数据处理,并且更特定地涉及使用单指令多数据(SIMD)处理器来处理大数据集。
背景技术
单指令多数据(SIMD)处理器大体上在展现大量数据并行的应用中使用而没有复杂控制流或过量处理器间通信。对于SIMD处理器的典型应用可包括低级视觉和图像处理,例如模式识别、数据库搜索和统计分析。在图像处理中牵涉的一个常见操作是查找最小或最大值或到大数据阵列内的其关联索引。大部分的SIMD处理器提供可快速执行最小和最大操作的指令。然而,如果SIMD处理器必须保持跟踪产生这些值的索引,SIMD指令的数据并行可被破坏。
附图说明
本发明的实施例的各种优势将通过阅读下列说明和附上的权利要求并且通过参考下列图而对本领域内技术人员变得明显,其中:
图1是根据实施例的计算系统的示例的框图;
图2A-2B是根据实施例的大数据集和该大数据集的数据布局的示例的图;
图3是根据实施例确定边界数据值单元和关联的索引的方法的示例的流程图;以及
图4A-4B是根据实施例的SIMD指令列表和框图的示例的图。
图5是根据实施例的系统的框图;以及
图6是根据实施例的装置的图。
具体实施方式
现在转向图1,示出计算系统100,其包括中央处理单元(CPU)120、系统存储器130、存储装置140(包括数据库150)、图形处理单元(GPU)160和图形存储器170。图示的系统100可以是移动平台的一部分,例如膝上型电脑、个人数字助理(PDA)、无线智能电话、媒体播放器、成像装置、移动互联网装置(MID)、智能平板电脑等或其任何组合。系统100还可以是例如个人计算机(PC)、服务器、工作站等固定平台的一部分。
CPU 120可包括存储器控制器(未示出),其提供对系统存储器130的访问,该系统存储器130可包括随机存取存储器,例如双数据速率(DDR)同步动态随机存取存储器模块。系统存储器130的模块可并入单直列存储器模块(SIMM)、双直列存储器模块(DIMM)、小型DIMM(SODIMM)等内。CPU 120还可具有一个或多个驱动器和/处理器核(未示出),其中每个核可功能齐全地具有取指令单元、指令解码器、一级(L1)高速缓存、执行单元,等。CPU可包括一个或多个单指令多数据(SIMD)处理器核。CPU 120还可执行操作系统(OS),例如Microsoft Windows、Linux或Mac (Macintosh) OS。
存储装置140可用多种部件或子系统实现,包括例如磁盘驱动器、光驱动器、闪速存储器或能够持久存储信息的其他装置。如在图1中图示的,存储装置140包括数据库150,其存储大数据集。
图示的系统100还包括图形处理单元(GPU)160,其耦合于图形存储器170。专用图形存储器170可包括GDDR(图形DDR)或DDR SDRAM模块,或适合用于支持图形渲染的任何其他存储器技术。GPU 160和图形存储器170可安装在图形/视频卡上,其中GPU 160可经由例如PCI Express Graphics(PEG,例如外围部件互连/PCI Express x16图形15W-ATX规范1.0、PCI特别兴趣组)总线或加速图形端口(例如,AGP V3.0接口规范,2002年9月)总线等图形总线而与CPU 120通信。图形卡可集成到系统母板上、到主CPU 120晶片(die)内、配置为母板上的分立卡等。
作为图形应用的一部分,图示的GPU 160执行软件模块。图形应用可需要确定大数据集中的最小或最大值以及到大数据阵列的其关联索引。在一个示例中,软件模块包括代码,用于与确定值到大数据阵列内的关联索引并行地确定大数据集中的最小或最大值。
软件模块还可包括代码,用于将数据值和该数据值的关联索引组合到单个数据单元内用于存储为大数据集中的数据条目。软件模块可用例如面向对象编程语言(例如C++)等任何编程语言来编写。
GPU 160还可包括一个或多个单指令多数据(SIMD)处理器核,用于提高和/或支持图形性能。从而,图示的方法可以在牵涉高级数据并行和处理复杂性的图形环境中特别有益。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410096786.1/2.html,转载请声明来源钻瓜专利网。