[发明专利]高效存储器和资源管理有效

专利信息
申请号: 201280062362.2 申请日: 2012-11-19
公开(公告)号: CN104040518B 公开(公告)日: 2016-11-16
发明(设计)人: 安德鲁·克格尔;马克·赫梅尔;安东尼·阿萨罗;菲利普·恩基 申请(专利权)人: 超威半导体公司;ATI科技无限责任公司
主分类号: G06F13/28 分类号: G06F13/28
代理公司: 上海胜康律师事务所 31263 代理人: 李献忠
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 高效 存储器 资源管理
【说明书】:

背景

发明领域

本发明总体涉及计算系统。更具体地,本发明涉及计算系统内虚拟地址空间的共享。

背景技术

最近,由于GPU的每单位功率和/或成本的典型性能,因此对将图形处理单元(GPU)用于一般计算的期望已经变得更加明显。一般来说,GPU的计算能力已以超过对应中央处理单元(CPU)平台的计算能力的速度增长。结合移动计算市场和其必需支持服务器/企业系统的开发,已经利用这种增长来提供指定的期望用户体验质量。因此,组合使用CPU和GPU来执行带有数据并行内容的工作负载正在变成一种广泛应用的技术。

然而,传统上,GPU是在受约束的编程环境中操作,仅可用于图形加速。这些约束起因于GPU不具有与CPU一样丰富的编程生态系统这一事实。因此,它们的用途一直大多局限于二维(2D)和三维(3D)图形以及已习惯于处理图形和视频应用编程接口(API)的少量前沿多媒体应用。

随着多供应商支持的和标准API和支持工具出现,GPU的应用已经不再局限于诸如传统图形等传统应用。虽然OpenCL和DirectCompute是有前景的起点,但创造一种允许对于大多数编程任务CPU和GPU的组合使用起来与CPU一样流畅的环境和生态系统仍存在许多障碍。

现有计算系统通常包括多个处理设备。例如,一些计算系统包括位于单独芯片上(例如,CPU可以位于主板上并且GPU可以位于图形卡上)或者在单个芯片封装中的CPU和GPU两种情况。然而,这两种布置仍包括与以下项相关的重大挑战:(i)高效调度、(ii)提供进程间服务质量(QoS)保证、(iii)编程模型、(iv)编译成多种目标指令集体系结构(ISA)以及(v)单独的存储器系统——在所有这些的同时还要使功耗最小化。

例如,分立芯片布置迫使系统以及软件体系结构针对每个处理器利用芯片到芯片接口对存储器进行存取。这些外部接口(例如,芯片到芯片)对用于协同操作异构处理器的存储器等待时间和功耗造成不利影响,同时,单独的存储器系统(即,单独地址空间)和驱动器管理共享存储器会产生变得对精细粒度卸载而言不可接受的开销。

在另一实施例中,存储在由多个处理器访问的存储器中的一些图像可能未能以期望质量水平存储。例如,图像的图片质量、对比度、取向(例如,旋转)等等可能不正确。通常,如果存在驻于存储器中需要在显示前进行操纵的图像数据,那么不得不将这些图像数据复制到I/O设备的存储器中,图像数据可在I/O设备的存储器中进行操纵并且随后复制回存储器以使它们可被打印出来。这个过程是耗时的,并且例如可能降低所存储的图像数据的质量。

概述

因此,需要一种用于多个处理器访问存储在共享存储器中的数据的高效方式以存储。

虽然GPU、加速处理单元(APU)以及通用图形处理单元(GPGPU)是本领域中的常用术语,但是术语“加速处理设备(APD)”被认为是一种更广泛的表述。例如,APD是指相对于诸如常规CPU、常规GPU和/或它们的组合等资源以加速的方式执行与加速图形处理任务、数据并行任务或嵌套数据并行任务相关联的那些功能和计算的任何协同操作的硬件和/或软件集合。

更确切地,本发明的实施方案涉及用于IOMMU高效存储器和资源管理的方法、系统以及计算机可读介质。在一个实施例中,与访问存储器中的数据相关联的指针经由输入/输出存储器管理单元(IOMMU)传递到输入/输出(I/O)设备。I/O设备经由IOMMU访问存储器中的数据,而不将数据复制到本地I/O设备存储器中。I/O设备基于指针对存储器中的数据执行操作。

本发明的进一步特征和优点以及本发明的各实施方案的结构和操作在下文中参照附图详细描述。应当注意,本发明不限于本文所描述的这些特定实施方案。本文呈现此类实施方案仅用于说明目的。基于本文所包含的教导内容,另外的实施方案对于相关领域的技术人员而言将是显而易见的。

附图简述

附图并入本文并且构成本说明书的一部分,图解了本发明并且与说明书一起进一步用来解释本发明的原理并使相关领域的技术人员能够实践和使用本发明。本发明的各实施方案参照附图在下文中进行描述,其中在全文中,类似参考标号用于指代类似元素。

图1是根据本发明的实施方案的一种处理系统的说明性框图。

图2是图1所示APD的框图图示。

图3A是根据本发明的一个实施方案的IOMMU嵌套分页事务系统的第一层的示例性框图。

图3B是根据所述实施方案的IOMMU嵌套分页事务系统的第二层的示例性框图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超威半导体公司;ATI科技无限责任公司,未经超威半导体公司;ATI科技无限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201280062362.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top