[发明专利]面向向量处理器的基于SIMD的平均值值池化并行处理方法在审

专利信息
申请号: 201710202133.0 申请日: 2017-03-30
公开(公告)号: CN106991473A 公开(公告)日: 2017-07-28
发明(设计)人: 郭阳;张军阳;扈啸;王慧丽;胡敏慧;王子聪 申请(专利权)人: 中国人民解放军国防科学技术大学
主分类号: G06N3/02 分类号: G06N3/02;G06F9/38
代理公司: 湖南兆弘专利事务所(普通合伙)43008 代理人: 周长清
地址: 410073 *** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 向量 处理器 基于 simd 平均值 值池化 并行 处理 方法
【权利要求书】:

1.一种面向向量处理器的基于SIMD的平均值值池化并行处理方法,其特征在于,步骤为:

S1:设卷积操作后需要进行池化操作的池化矩阵为A,其大小为M×N,池化窗口的尺寸为k×k,且M>k,N>k,向量处理单元的个数为p,且M、N、p为k的整数倍;

S2:根据池化窗口尺寸k,取池化矩阵A的前k行元素进行相应的累加操作,得出前k行元素对应的列和;

S3:配置混洗模式并进行混洗;

S4:将步骤S3中得到的结果对应相加;

S5:重复步骤S3、S4直到每组元素的数值归约至p/k个VPE中为止;

S6:使用向量VMOVI指令将立即数赋值给一个向量寄存器,并将此向量寄存器与步骤S5中的累加和一一对应相乘;

S7:最终得出p/k个平均值池化的结果向量;

S8:顺移至池化矩阵A的k+1行,重复上述步骤S2到步骤S7直至遍历完池化矩阵A的所有子图,得到池化矩阵A的所有尺寸为k×k的平均值池化结果矩阵。

2.根据权利要求1所述的面向向量处理器的基于SIMD的平均值值池化并行处理方法,其特征在于,所述步骤S3的详细流程为:

S301:若k为偶数,则将步骤S2中p/k组中每组元素的前k/2个元素放置在一起,每组的后k/2个元素放置在一起;

S302:若k为奇数,以k为3,p为12为例,即池化窗口的尺寸为3×3,向量处理单元的个数为12。

3.根据权利要求1所述的面向向量处理器的基于SIMD的平均值值池化并行处理方法,其特征在于,所述步骤S8中的一个平均值池化结果c0,0的计算公式为其中c0,0为平均值池化结果矩阵中的第一个元素,k为池化窗口的尺寸,在卷积神经网络中,池化窗口为方阵,ai,j为需要进行平均值池化的池化矩阵A中的元素。

4.根据权利要求1或2或3所述的面向向量处理器的基于SIMD的平均值值池化并行处理方法,其特征在于,所述定义池化窗口的大小为sizeX,两个相邻池化窗口的水平位移或竖直位移为stride,平均值池化操作中池化窗口不重叠,即sizeX=stride。

5.根据权利要求1或2或3所述的面向向量处理器的基于SIMD的平均值值池化并行处理方法,其特征在于,所述池化矩阵A和池化窗口尺寸k均为方阵。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710202133.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top