[发明专利]GPGPU中基于全局节点信息的NoC仲裁方法有效
申请号: | 201711479871.6 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108199985B | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 王志英;马胜;刘文杰;陆洪毅;沈立;陈微;何锡明 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | H04L12/933 | 分类号: | H04L12/933;H04L12/937 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 周长清;胡君 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | gpgpu 基于 全局 节点 信息 noc 仲裁 方法 | ||
本发明公开一种GPGPU中基于全局节点信息的NoC仲裁方法,步骤包括:S1.收集网络中各个计算节点的性能信息,根据性能信息设置各个计算节点的优先级,并广播给所有计算节点进行全局同步更新;S2.当计算节点发出访存请求时,将各计算节点中需要向网络注入的数据包进行分组,得到数据包的分组信息;计算节点进行请求仲裁时,先根据分组信息进行组间仲裁,再根据计算节点的优先级进行组内仲裁,当经过组内仲裁后仍然有多个请求胜出,采用局部仲裁机制进行附加仲裁。本发明具有实现方法简单、仲裁效率高,能够保证仲裁公平性,同时优化资源配置、实现仲裁结果一致性,提高系统性能等优点。
技术领域
本发明涉及GPGPU(General Purpose Graphic Process Unit,通用图形处理器)中片上网络(Network-on-a-chip,NoC)仲裁技术领域,尤其涉及一种GPGPU中基于全局节点信息的NoC仲裁方法。
背景技术
GPGPU上采用大量的简单处理器核,通过并行处理大量的数据获得高吞吐率,在大量任务之间切换来掩藏片下访存带来的访存延迟。由于处理器核结构简单,GPGPU上能够集成大量的晶体管,这使得其在单精度和双精度浮点运算方面独具优势。在浮点计算方面超强的计算能力,使得GPGPU被广泛应用于高性能计算领域,成为解决计算密集型科学和工程问题的重要手段。高密度集成计算单元给GPGPU带来超强计算能力的同时,也对片上通信结构提出了更高的要求。传统的多处理器结构和最初的片上多核系统采用基于总线的通信方式,这种方式将所有核连接到一个中央总线上,总线仲裁采取集中控制的方式。然而,随着片上的计算单元越来越多,基于总线的通信方式不再适用。
为了最大限度的提高计算核心的利用率、高效完成核间通信,片上通信方式必须具备高带宽、扩展性好的特点,而基于总线的通信方式和交叉开关都无法满足这两点,因此片上网络(on-chip networks)这种新型的通信结构应运而生。目前针对GPGPU领域的片上网络技术仍然十分匮乏,GPGPU和通用处理器在通信方式上存在巨大差异,使得通用处理器上的片上网络技术不能直接应用到GPGPU领域。两者的差异主要体现在以下几个方面:
1)GPGPU采用流处理模式,同一时刻有成百上千的线程同步执行,由此产生的访存通信比通用处理器高很多。
2)通用处理器中计算节点之间、计算节点和存储节点之间都需要通信,但GPGPU的计算节点之间不通信,通信只存在于计算节点和存储节点之间。数目较多的计算节点通过请求网络发送读写请求给数量较少的存储节点,经过读写处理后数量较少的存储节点再通过回复网络将回复报文发给计算节点,GPGPU的这种通信方式被称为“many-to-few-to-many”。
3)请求网络中的读请求报文较小,写请求报文较大但是数量很少;而回复网络中存在大量的读请求回复报文,这些报文通常携带读出的数据,因此报文数量多、长度大,上述通信特点使得请求网络负载较低,回复网络负载较高,负载不均衡也是现有片上网络结构不能充分发挥性能优势的原因之一。
4)通用处理器中不同计算节点之间的通信主要是由共享存储编程模型导致的,共享存储模式下,为了提高访存效率和系统性能,不同计算节点都有私有Cache,同一地址的数据在不同Cache中可能有不同的副本,因此产生了Cache一致性问题。因此,通用处理器中的片上网络针对Cache一致性协议进行了大量优化设计,但是GPGPU中,通信只存在于计算节点和存储节点之间,因此没有数据的Cache一致性协议问题,那么针对Cache一致性协议所做的优化设计显然不适合GPGPU结构。
GPGPU片上网络的仲裁器是片上网络路由器中的关键模块,因为它决定了片上网络所支持的QoS等级,并且在关键路径的延迟上影响到网络路由器的性能。目前GPGPU片上网络的NoC仲裁器主要采用以下几种方式:
①固定优先级的仲裁器:该类仲裁器是最简单的一种仲裁设计,通过以线性规则分配优先权,由迭代电路的方式构建仲裁器,但是由于没有考虑到公平性,固定优先级的仲裁器在实际中使用的并不多;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711479871.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种云台控制系统、云台网关
- 下一篇:一种数据传输方法、堆叠设备及堆叠系统