[发明专利]用于超大规模人工神经网络数值运算的并行计算加速方法在审
申请号: | 202110259060.5 | 申请日: | 2021-03-10 |
公开(公告)号: | CN112926732A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 李国齐;陈恒努;刘哲贤;周子栋 | 申请(专利权)人: | 之江实验室;清华大学 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04;G06N3/08 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 杨小凡 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 超大规模 人工 神经网络 数值 运算 并行 计算 加速 方法 | ||
1.用于超大规模人工神经网络数值运算的并行计算加速方法,其特征在于包括如下步骤:
S1,对人工神经网络中的大规模数据进行张量分解,将大规模矩阵转化为小规模张量;
S2,将小规模张量分组进行并行运算,得到一组新的张量,包括如下步骤:
S211,组间进行并行运算;
S212,组内的小规模张量,先并行的两两缩并后,再将结果并行缩并,直至每组得到新的张量;
S213,不同组的新的张量,构成一组新的张量;
S3,将新的张量依照理论最优运算方案进行串行运算,包括如下步骤:
S31,将原本参与运算的第一矩阵得到的一组新的张量,依次进行串行缩并,得到由第一矩阵元素重排形成的第一新张量;
S32,将第一新张量,与原本参与运算的第二矩得到的一组新的张量,依次进行串行缩并,得到第二新张量;
S33,将第二新张量,与原本参与运算的第三矩得到的一组新的张量,依次进行串行缩并,得到第三新张量,以此类推,直至最后得到最终新张量;
S34,将最终新张量的元素重排为矩阵。
2.如权利要求1所述的用于超大规模人工神经网络数值运算的并行计算加速方法,其特征在于所述原本参与运算的矩阵,参与的是乘法运算。
3.如权利要求1所述的用于超大规模人工神经网络数值运算的并行计算加速方法,其特征在于所述步骤S2中对分解得到的张量进行分组,每个张量仅出现在一个组之中;同一组内的张量,在张量分解过程中的顺序是连续的;对于任意一组张量,其第一个张量和前一组张量的最后一个张量,以及其最后一个张量和后一组张量的第一个张量,在张量分解过程中的顺序是连续的;选取第一组张量的数量,之后的每一组张量的数量,都按照以下规则进行选取:
S221,首先选取和第一组相同的张量数量;
S222,若该组张量运算得到的新张量规模大于第一组张量运算得到的新张量规模,则将该组的张量数量减少,直至该组张量得到的新张量规模小于第一组张量运算得到的新张量规模,然后将当前张量的数量定为该组张量的预计数量;
S223,若该组张量运算得到的新张量规模小于第一组张量运算得到的新张量规模,则将该组的张量数量增加,直至该组张量得到的新张量规模大于第一组张量运算得到的新张量规模,然后将当前张量的数量定为该组张量的预计数量;
S224,对于最后一组张量,若该组张量运算得到的新张量规模大于等于第一组张量运算得到的新张量规模的预设比例,则将当前所有组的预计数量定为最终每组的张量数量,若小于预设比例,则取消该组,将所有张量并入倒数第二组,得到一个新的最后一组张量。
4.如权利要求3所述的用于超大规模人工神经网络数值运算的并行计算加速方法,其特征在于所述步骤S223,在该组张量得到的新张量规模大于第一组张量运算得到的新张量规模后,将当前张量的数量减一后定为该组张量的预计数量。
5.如权利要求3所述的用于超大规模人工神经网络数值运算的并行计算加速方法,其特征在于对于最后一组至第三组进行如下操作:若该组张量运算得到的新张量规模小于第一组张量运算得到的新张量规模,则将当前张量的数量定为最终该组的张量数量,否则将该组的张量从第一个开始依次移入前一组,直至该组张量得到的新张量规模小于第一组张量运算得到的新张量规模,然后将当前张量的数量定为该组张量的最终数量。
6.如权利要求5所述的用于超大规模人工神经网络数值运算的并行计算加速方法,其特征在于在该组张量得到的新张量规模小于第一组张量运算得到的新张量规模后,将当前张量的数量加一后定为该组张量的最终数量。
7.如权利要求3所述的用于超大规模人工神经网络数值运算的并行计算加速方法,其特征在于对于第二组张量,若该组张量运算得到的新张量规模小于等于第一组张量运算得到的新张量规模的预设倍数,则将当前张量数量定为最终该组的张量数量,若大于预设倍数,重新选取第一组的张量数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室;清华大学,未经之江实验室;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110259060.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种先导增压二级溢流阀
- 下一篇:一种服务请求的处理方法及装置