[发明专利]基于数据流的硬件加速方法及系统有效
申请号: | 201710016921.0 | 申请日: | 2017-01-11 |
公开(公告)号: | CN106776044B | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 牛昕宇 | 申请(专利权)人: | 深圳鲲云信息科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 31219 上海光华专利事务所(普通合伙) | 代理人: | 徐秋平 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 硬件加速 方法 系统 硬件 加速器 执行 | ||
1.一种基于数据流的硬件加速方法,其特征在于,所述硬件包括多个通信连接的硬件计算节点,每个所述硬件计算节点的计算任务由至少一个计算模块完成,所述方法包括:
实时监控各个所述硬件计算节点的使用情况;
当监测到出现资源空闲的硬件计算节点时,利用性能模型估测拓展重构成本以及重构后获得性能收益;所述性能模型为:
其中,rtb(r,v)表示从状态r拓展至状态v的性能提升,在状态r,读取目标计算节点的计算结果,形成重构的硬件计算节点,转换至状态v;表示由于计算资源的提升所带来的计算时间的降低,pi为节点i中可支持的并行计算模块;dpi为每个计算模块的内部并行度;freqi为计算模块的时钟频率;rc(r,v)表示估算的拓展重构成本;wli(r)为在状态r分配的计算量,wli(v)为在状态v分配的计算量;
如果性能提升rtb(r,v)大于零,则进行计算扩展,从而将目标计算节点拓展到资源空闲的硬件计算节点;所述计算扩展的实现过程包括:
获取每个所述硬件计算节点的计算任务量,及其含有的计算模块的并行计算信息,据以计算每个所述硬件计算节点完成各自的计算任务量的计算时间;
按照每个所述硬件计算节点在各自的约束条件下计算时间最短的原则,将每个所述硬件计算节点优化成各定制硬件模块,其中,各自的所述约束条件由硬件计算节点的资源配置确定;
当检测到存在资源空闲的硬件计算节点时,将一所述定制硬件模块的相关配置信息载入其中,从而形成重构的硬件计算节点,所述重构的硬件计算节点通过其接口将计算结果传递至其他硬件计算节点来完成计算拓展。
2.根据权利要求1所述的基于数据流的硬件加速方法,其特征在于,重构的硬件计算节点之间采用异步通信的方式进行数据交互。
3.根据权利要求2所述的基于数据流的硬件加速方法,其特征在于,所述计算任务包括循环计算,且在重构后为每个硬件计算节点重新分配wli的计算任务量,所述异步通信的方式通过以下数学模型实现:
其中,tai→j表示硬件计算节点i传输到硬件计算节点j的数据抵达时间,tcj为硬件计算节点j本地的调度延时,pj*dpj为硬件计算节点j的计算速度,为硬件计算节点j使用上个循环使用硬件计算节点i传输计算结果的时间,为硬件计算节点j下个循环需要硬件计算节点i传输的计算结果的时间;tdi为数据抵达目标节点后数据更新延时;pj为节点j中可支持的并行计算模块;dpj为每个计算模块的内部并行度。
4.根据权利要求3所述的基于数据流的硬件加速方法,其特征在于,还包括:
根据下个循环所需要的最晚传输结果时间调节各硬件计算节点的本地调度延时;
根据上个循环所需要的最早传输结果时间调节各硬件计算节点的本地调度td。
5.根据权利要求1所述的基于数据流的硬件加速方法,其特征在于,所述约束条件包括以下方式中的一种或多种组合:
方式1)每个时钟处理数据所消耗的逻辑资源和接口消耗的逻辑资源之和不超过所述硬件计算节点所含有的总逻辑资源;
方式2)每个时钟处理数据所消耗的存储资源和接口消耗的存储资源之和不超过所述硬件计算节点所含有的总存储资源;
方式3)所述硬件计算节点在计算过程中所消耗的带宽资源不大于预设值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳鲲云信息科技有限公司,未经深圳鲲云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710016921.0/1.html,转载请声明来源钻瓜专利网。