[发明专利]面向向量处理器的二维矩阵卷积的向量化实现方法有效

申请号：	201710201589.5	申请日：	2017-03-30
公开（公告）号：	CN106970896B	公开（公告）日：	2020-05-12
发明（设计）人：	郭阳;张军阳;刘仲;扈啸;王慧丽;胡敏慧;王子聪	申请（专利权）人：	中国人民解放军国防科学技术大学
主分类号：	G06F17/16	分类号：	G06F17/16;G06F17/15
代理公司：	湖南兆弘专利事务所(普通合伙) 43008	代理人：	周长清
地址：	410073 ***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	面向向量处理器二维矩阵卷积量化实现方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种面向向量处理器的二维矩阵卷积的向量化实现方法，其特征在于，步骤为：

S1:输入卷积矩阵A和卷积核矩阵B；通过DMA控制器将卷积矩阵A和卷积核矩阵B分别搬运到向量存储单元和标量存储单元；

S2:将卷积矩阵A的一行元素和卷积核矩阵B的一个元素广播后对应的一行元素一一对应相乘，相乘的结果通过一个初始化为0的累加寄存器进行累加；

S3:通过混洗指令取出步骤S2中从卷积矩阵A中取出的一行元素的前K-1个元素至向量处理单元，并与本次取出并广播至向量处理单元的卷积核矩阵B的第二个元素进行一一对应相乘，结果累加至步骤S2中的累加寄存器中；其中K为并行处理单元的个数；

S4:判断是否完成卷积核矩阵B一行元素的计算，若没有完成，返回步骤S3，若完成则继续步骤S5；

S5:将卷积矩阵A和卷积核矩阵B的数据地址指向相应的下一数据行，最终完成卷积结果矩阵C的第一行元素的计算；

S6:通过循环步骤S2～步骤S5最终完成整个卷积结果矩阵C的计算。

2.根据权利要求1所述的面向向量处理器的二维矩阵卷积的向量化实现方法，其特征在于，在上述步骤S1的搬运过程中，通过DMA控制器的配置，卷积矩阵A的每一行组织成一个数据帧，卷积核矩阵B的每一个元素组织成一个数据帧，整个卷积矩阵A共分成p个数据帧，当所述数据帧的元素个数不等于向量处理器中并行处理单元的个数K的倍数时，在数据帧尾部补0使得每个数据帧的元素个数等于并行处理单元的个数K的倍数。

3.根据权利要求1或2所述的面向向量处理器的二维矩阵卷积的向量化实现方法，其特征在于，对于m×m的卷积矩阵A与n×n的卷积核矩阵B的卷积运算，得到(m-n+1)×(m-n+1)的卷积结果矩阵C，且m≥n，结果矩阵C的每一个元素都是由n×n的卷积核矩阵B的所有元素在m×m的卷积矩阵A上与卷积核矩阵B同样大小的区域进行点积运算并累加求和的结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学，未经中国人民解放军国防科学技术大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710201589.5/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]面向向量处理器的二维矩阵卷积的向量化实现方法有效

专利文献下载