[发明专利]一种基于多张量核心处理器的卷积计算数据重用方法在审
申请号: | 202111248647.2 | 申请日: | 2021-10-26 |
公开(公告)号: | CN116028384A | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 高伟;叶楠;王洪磊;杨晋喆 | 申请(专利权)人: | 太初(无锡)电子科技有限公司 |
主分类号: | G06F12/0842 | 分类号: | G06F12/0842;G06F13/28;G06F15/78;G06F17/15 |
代理公司: | 中国商标专利事务所有限公司 11234 | 代理人: | 张立晶 |
地址: | 214000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 张量 核心 处理器 卷积 计算 数据 重用 方法 | ||
1.一种基于多张量核心处理器的卷积计算数据重用方法,所述多张量核心处理器包括控制核心、多个张量核心阵列;控制核心用于程序的初始化、I/O、通信以及对多个张量核心阵列分配任务;控制核心对多个张量核心阵列分配任务是通过DMA将加速核心段的关键数据布局到每个张量核心的片上高速缓存SPM;张量核心阵列包括多个张量核心,用于程序热点区域的并行加速处理,每个张量核心设有片上高速缓存SPM,可以单独完成复杂的卷积计算;其特征在于,所述的卷积计算数据重用方法,包括:
s1、控制核心通过DMA将多个不同的输入特征图分别分配给多个张量核心的片上高速缓存SPM;
s2、控制核心通过DMA将卷积核广播到前述多个张量核心的片上高速缓存SPM;
s3、前述多个张量核心依据各自的片上高速缓存SPM的输入特征图、卷积核进行计算;
s4、前述多个张量核心完成计算后,将计算结果写回内存,之后广播更新卷积核重复步骤s2,直到将所有卷积核广播一遍,得到不同输出特征图的最终结果,写回内存。
2.如权利要求1所述的基于多张量核心处理器的卷积计算数据重用方法,其特征在于,所述s2中,控制核心先对张量核心的片上高速缓存SPM是否可以存储卷积核进行判断,如果卷积核无法放置于一个张量核心的SPM,则对卷积核进行拆分,控制核心通过DMA将拆分后的卷积核广播到前述多个张量核心的片上高速缓存SPM。
3.如权利要求1或2所述的基于多张量核心处理器的卷积计算数据重用方法,其特征在于,所述s1中,控制核心先将输入特征图分成多个组,每组包括多个输入特征图;控制核心按输入特征图组的顺序,通过DMA将一组的多个不同的输入特征图分别分配给多个张量核心的片上高速缓存SPM;
所述s4中,所有卷积核广播一遍后,重复步骤s1,控制核心通过DMA将下一组的多个不同的输入特征图分别分配给多个张量核心的片上高速缓存SPM,直到将所有输入特征图组分配完,得到不同输出特征图的最终结果,再写回内存。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太初(无锡)电子科技有限公司,未经太初(无锡)电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111248647.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:低氮燃烧器
- 下一篇:一种正丁烷氧化催化剂及其制备方法和应用