[发明专利]具有高吞吐量内部通信协议的图像处理器有效
申请号: | 201880028900.3 | 申请日: | 2018-01-05 |
公开(公告)号: | CN110574068B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | J.R.雷德格雷夫;A.梅克斯纳;Q.朱;J.金;A.瓦西尔耶夫;O.沙查姆 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 吞吐量 内部 通信协议 图像 处理器 | ||
描述了一种处理器。处理器包括网络。多个处理核心耦合到网络。处理器包括耦合到网络的发送器电路。发送器电路将由处理核心中的一个生成的输出数据发送到网络中。发送器电路包括控制逻辑电路,以使发送器电路在发送器电路的输出数据的较早的第一分组的传输完成之前发送对输出数据的第二分组的传输的请求。
技术领域
本发明的领域一般涉及计算科学,且更具体地说,涉及具有高吞吐量内部通信协议的图像处理器。
背景技术
图像处理通常包括对被组织成阵列的像素值的处理。这里,空间组织的二维阵列捕获图像的二维性质(附加维度可以包括时间(例如,二维图像的序列)和数据类型(例如,颜色)。在典型场景下,阵列像素值是由已经生成静态图像或生成捕获运动的图像的帧的序列的相机提供的。传统的图像处理器通常处于两个极端的任一边。
第一个极端执行作为在通用处理器或通用类处理器(例如,具有矢量指令增强的通用处理器)上运行的软件程序的图像处理任务。尽管第一个极端典型地提供了高度通用的应用软件开发平台,但是其更细粒度的数据结构的使用以及相关联的开销(例如,指令获取和解码、片内和片外数据的处理、推测性运行)最终导致在程序代码的运行期间每单位数据消耗大量能量。
第二个相反的极端将固定功能硬连线电路应用于更大的数据单元。直接应用于定制设计的电路的更大(而不是更细粒度的)数据单元的使用大大降低了每单位数据的功耗。然而,定制设计的固定功能电路的使用通常会导致处理器能够执行有限的一组任务。因此,在第二个极端中缺乏广泛通用的编程环境(与第一个极端相关联)。
提供高度通用的应用软件开发机会以及改进的每单位数据的能效的技术平台仍然是一个理想但缺失的解决方案。
发明内容
描述了一种处理器。处理器包括网络。多个处理核心耦合到网络。处理器包括耦合到网络的发送器电路。发送器电路将由处理核心中的一个产生的输出数据发送到网络中。发送器电路包括控制逻辑电路,以使发送器电路在发送器电路的较早的第一输出数据分组的传输完成之前发送对第二输出数据分组的传输的请求。
附图说明
以下描述和附图用于说明本发明的实施例。在附图中:
图1示出了模板处理器架构的高级视图;
图2示出了图像处理器架构的更详细视图;
图3示出了图像处理器架构的更详细视图;
图4示出了可以由图像处理器运行的应用软件程序;
图5a示出了第一通信序列;
图5b示出了改进的通信序列;
图5c示出了通信流期间计数器的使用行为;
图6a示出了发送器电路的实施例;
图6b示出了接收器电路的实施例;
图7示出了一种通信方法;
图8a、8b、8c、8d和8e描绘了图像数据到行组的解析、行组到表格(sheet)的解析以及在具有重叠模版的表格上执行的操作;
图9a示出了模版处理器的实施例;
图9b示出模板处理器的指令字的实施例;
图10示出模板处理器内的数据计算单元的实施例;
图11a、11b、11c、11d、11e、11f、11g、11h、11i、11j和11k描绘了使用二维移位阵列和运行通道阵列的以确定具有重叠模版的一对相邻输出像素值的示例;
图12示出了集成的运行通道阵列和二维移位阵列的单位单元的实施例;
图13示出了示例性计算系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880028900.3/2.html,转载请声明来源钻瓜专利网。