[发明专利]用于通用计算的纹理单元有效
申请号: | 201010592194.0 | 申请日: | 2010-12-08 |
公开(公告)号: | CN102087740A | 公开(公告)日: | 2011-06-08 |
发明(设计)人: | V·W·李;M·斯梅尔延斯基;G·S·达西卡;J·冈萨雷斯;J·楚加尼;Y-K·陈;C·金;J·加戈;S·加兰;V·M·D·巴里奥 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 曲卫涛;王洪斌 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 通用 计算 纹理 单元 | ||
技术领域
一般来说,本发明涉及图形处理,具体来说,涉及图形处理器的纹理单元。
背景技术
图形处理器是一般用于处理与图像显示相关联的处理任务的专用处理器。图形处理器可包括多个专门的功能单元,包括纹理单元。纹理单元执行纹理操作,包括纹理解压缩和各向异性过滤。
纹理采样器是用于优化纹理过滤并比通用处理器更快速地执行纹理过滤的特殊类型的纹理单元。
纹理单元可利用线性内插单元进行过滤。另外,包括双线性和三线性内插单元的其它内插单元也可用。
发明内容
本发明涉及一种方法,包括:
利用纹理单元中的可编程线性内插器计算点积。
本发明涉及一种设备,包括:
处理实体;
耦合到所述处理实体的存储器;以及
耦合到所述处理实体、用于计算点积的可编程线性内插器。
本发明涉及一种存储指令的计算机可读介质,所述指令使得计算机能够:
确定由纹理单元确定的点积系数为负数;以及
将所述系数的符号变为正值。
附图说明
图1是根据一个实施例的纹理单元的示意图;
图2是本发明一个实施例的示意图;
图3是根据一个实施例的纹理单元的描绘,该纹理单元包括多个用于执行点积的可编程线性内插单元;
图4是本发明一个实施例的流程图;
图5示出根据一个实施例的卷积的实例;
图6是根据一个实施例的硬件有限状态机;
图7是根据一个实施例的序列状态机的时序图;以及
图8是根据一个实施例用于生成和处理负系数的流程图。
具体实施方式
根据一些实施例,可以利用诸如纹理采样器的纹理单元来执行数学计算,具体来说,在一些实施例中,执行点积计算。否则当图形处理单元的纹理单元(纹理采样器)没有使用时,可从中央处理单元卸载这些任务。因此,在一些实施例中,可提高处理效率。另外,在一些情况下,点积和卷积的计算可以利用以线性内插、双线性内插和三线性内插过滤单元形式的现有纹理单元的可用能力来进行。
纹理映射是由图形处理器中的专用硬件执行的计算加强型任务。即使纹理单元保持闲置,通常仍必须利用通用处理单元来完成多种通用计算任务,例如确定二维卷积用于图像处理、矩阵-矩阵相乘以及用于财务应用的二维点阵计算。但是,纹理单元可适于执行在纹理单元闲置时从中央处理单元卸载的点积计算。
参考图1,内插单元14的纹理单元核40经由纹理控制块42接收纹理请求。纹理控制块42可包括指向纹理表面的指针、纹理表面的宽度和高度、将要进行纹理处理的n个像素的纹理坐标(u,v)、将要执行的过滤操作的类型(例如线性、双线性或三线性)以及纹理过滤器结果。
地址生成级44计算由给定过滤操作使用的所有纹理元素(texel)的地址。以介于0.0与1.0之间的归一化形式传递相关像素的坐标u和v。通过将它们乘以表面尺寸而使它们非归一化。例如,u变成i.bu,其中i是整数,bu是分数。整数部分用于产生最近邻居。在双线性内插的情况下,有四个邻居:(i,j)、(i+1,j)、(i,j+1)、(i+1,j+1)。在三线性过滤操作的情况下,有八个邻居。分数部分可用于计算可在混合相邻像素时使用的权。
数据访问级(stage)46访问所有必需的相邻像素。这个级可具有相对较长等待时间的先进先出缓冲器以容许较长的等待时间。
过滤级48利用有限状态机(FSM)定序器执行相邻像素的线性、双线性或三线性内插。该过滤级在具有三个可能的系数输入的线性内插过滤器树中实现。该过滤单元可包含以树方式连接以执行双线性和三线性过滤的多个线性内插器。
双线性过滤涉及两个级上的三个线性内插。三线性过滤涉及三个级上的七个线性内插。对于双线性过滤,对于第一级只允许一个系数(bu),对于第二级使用第二系数(bd)。在三线性过滤的情况下,对于前两级使用与双线性操作相同的系数,并且对于第三级使用第三系数(bw)。
通用或中央处理单元可耦合到纹理采样器或直接耦合到内插单元。参考图2,一个系统10示出耦合到专用内插单元14的通用或中央处理单元12。
举例来说,通用处理单元可以是具有一个或多个核的中央处理单元、控制器或数字信号处理器。在一个实施例中,内插单元可以是图形处理单元的诸如纹理采样器的纹理单元。专用内插单元是设计成利用线性内插法进行内插的硬件或软件。中央处理单元12和内插单元14均可耦合到存储器16。中央处理单元的输出可包括诸如点积的一般处理结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010592194.0/2.html,转载请声明来源钻瓜专利网。