[发明专利]一种数据传输装置及传输方法有效
申请号: | 202010200676.0 | 申请日: | 2020-03-20 |
公开(公告)号: | CN111459856B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 刘艳欢;李文明;安述倩;吴海彬;冯煜晶;吴萌;叶笑春;范东睿 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F13/16 | 分类号: | G06F13/16;G06F13/40 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据传输 装置 传输 方法 | ||
本发明提供一种数据传输装置,包括:控制逻辑,其用于根据配置信息产生相应的控制信号以控制其他模块的动作;其中,存储体接口逻辑用于从存储体中读取数据或向存储体写入数据;第一选择逻辑用于选择与正向传输模式对应的数据传输路径或与反向传输模式对应的数据接收路径;数据对齐逻辑用于对传输的数据进行对齐操作;重组模块用于对传输的数据进行重组操作以将存储体中读出的数据块拆分成数据分量的形式并重组成新的数据块后传递给片上存储结构进行处理,或将片上存储结构处理后的数据块拆分成数据分量形式并重组成数据块写入存储体;第二选择逻辑用于选择与正向传输模式对应的数据接收路径或与反向传输模式对应的数据传输路径;数据路由逻辑用于确定数据传输的目的地址。
技术领域
本发明涉及计算机硬件处理技术领域,具体来说,涉及包含多个并行计算单元的单核或多核处理器中的数据传输结构,更具体地说,涉及一种可重组的数据传输装置及传输方法。
背景技术
在面向科学计算、大数据以及人工智能计算等高通量数据处理场景中,为了挖掘特定应用的并行性,在处理器中通常使用多个微处理核,每个微处理核内设计多个并行计算单元,采用这种结构一次能处理多个分量的数据,从而有效提高处理速率,有效满足对数据的并发处理要求。为了充分发挥处理单元的计算能力,需要将片上存储的数据按照数据分量的形式进行重组,然后送入计算单元进行处理。对于这类处理器来说,数据由主机读入内存,然后传入以DDR为主的存储体,接着由数据传输模块将数据从DDR中搬移至处理器的片上存储。在上述过程中,如果数据重组操作由主机来进行,则需要进行频繁的读写主机内存的操作,该过程耗时巨大,严重影响了处理器的性能。如果由片上存储模块来处理,一方面会大大增加片上存储结构的复杂度,另一方面片上存储结构进行重组操作同样需要消耗很多时间,且灵活性会大大减弱,而往往需要重组和不需要重组的需求同时存在。基于以上原因,研究更高效的数据传输与重组方案对于提高处理器效率来说显得尤为重要。
经过分析发现,传统的数据传输结构,其主要功能是将数据从以DDR为主的存储体直接搬移至片上存储,中间不经过任何处理。如图1所示的传统数据传输结构,在正向传输过程中,外部配置信息通过配置接口进入,并经过配置解析模块进行初步解析后,形成传输所需的传输方向、传输大小、数据源地址、数据目的地址以及传输启动信号等信息,将这些信息送入控制逻辑模块,控制逻辑模块接收到这些信息后,产生相应的控制信号,一方面将控制信号传输给存储体接口逻辑模块,该模块在这些控制信号的控制下产生读写存储体的操作,另一方面将控制信号送入片上存储接口逻辑,该模块在这些控制信号的控制下对来自存储体接口逻辑模块的数据按要求送入片上存储模块的目的地址处。反向传输过程则与正向传输过程正好相反。由此可见,现有的数据传输结构在数据传输过程中,中间不会对数据进行处理,将数据处理成数据分量的工作要么是主机来完成,要么是由片上存储结构来完成,无论是主机还是片上存储结构来执行将数据处理成数据分量的操作,都会存在耗时长、灵活性减弱、影响处理器性能等问题。
发明内容
因此,本发明的目的在于克服上述现有技术的缺陷,提供一种新的数据传输结构及传输方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010200676.0/2.html,转载请声明来源钻瓜专利网。