[发明专利]一种面向GPDSP的反卷积矩阵的向量化实现方法有效
申请号: | 201710201601.2 | 申请日: | 2017-03-30 |
公开(公告)号: | CN106959937B | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 郭阳;张军阳;扈啸;王慧丽;胡敏慧;王子聪 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F17/15 | 分类号: | G06F17/15;G06F17/16 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 周长清 |
地址: | 410073 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向GPDSP的反卷积矩阵的向量化实现方法,由GPDSP的CPU核为卷积神经网络中前向传播阶段产生的权值矩阵及反向计算阶段的残差矩阵分配相应的标量存储空间和向量存储空间,其步骤为,S1:设残差矩阵A(m,m)、权值矩阵B(n,n)及反卷积结果矩阵C(m+n‑1,m+n‑1),且m>n;S2:通过控制循环次数,首先计算反卷积结果矩阵C前n‑1行元素;S3:固定循环次数,计算反卷积结果矩阵C第n行至第m行元素;S4:通过控制循环次数,计算反卷积结果矩阵C倒数第n‑1行至倒数第1行元素。本发明具有原理简单、操作方便、能充分利用向量处理器完成特殊数据计算、缩短整个算法运行时间、提高算法执行效率等优点。 | ||
搜索关键词: | 一种 面向 gpdsp 卷积 矩阵 量化 实现 方法 | ||
【主权项】:
1.一种面向GPDSP的反卷积矩阵的向量化实现方法,其特征在于,由GPDSP的CPU核为卷积神经网络中前向传播阶段产生的权值矩阵及反向计算阶段的残差矩阵分配相应的标量存储空间和向量存储空间,其步骤为,S1:设残差矩阵A(m,m)、权值矩阵B(n,n)及反卷积结果矩阵C(m+n‑1,m+n‑1),且m>n;S2:通过控制循环次数,首先计算反卷积结果矩阵C前n‑1行元素;所述步骤S2的详细步骤为:S2.1取权值矩阵B第n行的最后一个元素bn‑1,n‑1,取残差矩阵A第一行元素,将bn‑1,n‑1广播至标量寄存器中的元素与矩阵A第一行元素对应相乘,累加上将bn‑1,n‑2向量化后与移位后的残差矩阵A的第一行元素一一对应相乘的结果;重复以上步骤n次,n为权值矩阵B列数,完成反卷积结果矩阵C第一行元素的计算;S2.2顺移至残差矩阵A的第二行元素,计算过程如步骤2.1,循环n+n次完成反卷积结果矩阵C第二行元素的计算;S2.3顺移至残差矩阵A的第n‑1行元素,计算过程如步骤2.1,循环(n‑1)*(n‑1)次完成反卷积结果矩阵C第n‑1行元素的计算;S3:固定循环次数,计算反卷积结果矩阵C第n行至第m行元素;所述步骤S3中,反卷积结果矩阵C的第n行至第m行的每一行元素的计算都在步骤S2.3的基础上顺移至残差矩阵A的第n行,计算过程如步骤2.1,循环n*n次完成反卷积结果矩阵C中间某一行行元素的计算;S4:通过控制循环次数,计算反卷积结果矩阵C倒数第n‑1行至倒数第1行元素;S4.1倒数第n‑1行元素由权值矩阵B的前n‑1行元素参与计算,计算过程如步骤S2.3;S4.2倒数第2行元素由权值矩阵B的前2行元素参与计算,计算过程如步骤S2.2;S4.3倒数第1行元素由权值矩阵B的前1行元素参与计算,计算过程如步骤S2.1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710201601.2/,转载请声明来源钻瓜专利网。