[发明专利]图形处理器的流水线化归约操作有效
申请号: | 200680056329.3 | 申请日: | 2006-11-08 |
公开(公告)号: | CN101542524A | 公开(公告)日: | 2009-09-23 |
发明(设计)人: | W·李;E·李 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06T1/60;H04N1/393 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 赵腾飞;王 英 |
地址: | 美国加*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图形 处理器 流水线 化归约 操作 | ||
背景技术
图形处理单元(GPU)是可以用在例如个人计算机、工作站或游戏主 机中的专用图形渲染设备。GPU在操作和显示计算机图形方面非常有效率。 GPU包含多个处理单元,这些处理单元同时执行独立的操作(例如,在像 素级上的颜色空间转换)。它们的高并行化结构可以使它们在复杂算法范围 内比普通的中央处理单元(CPU)效率高。GPU可以采用使图形基元操作 运行的比使用主CPU直接在屏幕上绘制快得多的方式,来实现多个图形基 元。
GPU上的通用编程正在成为一种用于加速计算的高效且普遍的方式, 并且结合CPU充当重要的计算单元。在实践中,可以对庞大数量的现有通 用处理内核(例如纹理处理、矩阵和矢量计算)进行优化以便运行在GPU 上。然而,GPU具有某些硬件约束和结构限制。例如,GPU不具有全局变 量的概念,并且不能使用几个全局变量来在运行中保存临时数据。因此, GPU不能有效地处理某些通常使用的归约(reduction)操作(例如,对一 串数据元素进行平均和求和计算)。
发明内容
根据一个方面,本发明公开了一种能够对多个图像同时执行归约操作 的方法,所述方法包括:初始化纹理缓冲器,所述纹理缓冲器大于要分析 的帧并且包括第一侧和第二侧,其中,所述第一侧用于存储一新的完整帧, 所述第二侧用于存储所述完整帧的多个不同的尺寸缩小版本,其中,所述 多个不同的尺寸缩小版本依次减小;将一新的完整帧绘制在所述第一侧中;
对所述纹理缓冲器进行尺寸缩小以便同时对所述完整帧和所述多个不 同的尺寸缩小版本执行尺寸缩小;偏移尺寸缩小后的所述完整帧和所述多 个不同的尺寸缩小版本,以便将尺寸缩小后的完整帧复制至所述第二侧中 的第一个位置处,并将经过尺寸缩小后的所述第二侧中的每一个所述尺寸 缩小版本复制至所述第二侧中的下一个位置处;重复所述绘制步骤、所述 尺寸缩小步骤和所述偏移步骤,其中,使所述重复流水线化,以使得所述 纹理缓冲器包含多个不同帧,其中每个帧具有一不同尺寸缩小级别。
根据另一方面,本发明公开了一种能够对多个图像同时执行归约操作 的图形处理单元,所述图形处理单元包括:用于初始化纹理缓冲器的第一 模块,所述纹理缓冲器大于要分析的帧并且包括第一侧和第二侧,其中, 所述第一侧用于存储一新的完整帧,所述第二侧用于存储所述完整帧的多 个不同的尺寸缩小版本,其中,所述多个不同的尺寸缩小版本依次减小; 以及用于将一新的完整帧绘制在所述第一侧中的第二模块;用于对所述纹 理缓冲器进行尺寸缩小以便同时对所述完整帧和所述多个不同的尺寸缩小 版本执行尺寸缩小的第三模块;用于偏移尺寸缩小后的所述完整帧和所述 多个不同的尺寸缩小版本,以便将尺寸缩小后的完整帧复制至所述第二侧 中的第一个位置处,并将经过尺寸缩小后的所述第二侧中的每一个所述尺 寸缩小版本复制至所述第二侧中的下一个位置处的第四模块;其中,对第 二模块至第四模块的操作进行重复和流水线化,以使得所述纹理缓冲器包 含多个不同帧,其中每个帧具有一不同尺寸缩小级别。
根据另一方面,本发明公开了一种系统,所述系统包括:中央处理单 元(CPU);图形处理单元(GPU),包括:用于初始化纹理缓冲器的第一 模块,所述纹理缓冲器大于要分析的帧并且包括第一侧和第二侧,其中, 所述第一侧用于存储一新的完整帧,所述第二侧用于存储所述完整帧的多 个不同的尺寸缩小版本,其中,所述多个不同的尺寸缩小版本依次减小; 以及用于将一新的完整帧绘制在所述第一侧中的第二模块;用于对所述纹 理缓冲器进行尺寸缩小以便同时对所述完整帧和所述多个不同的尺寸缩小 版本执行尺寸缩小的第三模块;用于偏移尺寸缩小后的所述完整帧和所述 多个不同的尺寸缩小版本,以便将尺寸缩小后的完整帧复制至所述第二侧 中的第一个位置处,并将经过尺寸缩小后的所述第二侧中的每一个所述尺 寸缩小版本复制至所述第二侧中的下一个位置处的第四模块;其中,对第 二模块至第四模块的操作进行重复和流水线化,以使得所述纹理缓冲器包 含多个不同帧,其中每个帧具有一不同尺寸缩小级别。
附图说明
根据以下详细描述,各个实施例的特征和优点将会变得显而易见,其 中:
图1示出根据一个实施例的实例视频挖掘应用;
图2A示出根据一个实施例的用于归约操作的实例滤波器循环方法的 流程图;
图2B示出根据一个实施例的滤波器循环方法的实例应用;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680056329.3/2.html,转载请声明来源钻瓜专利网。