[发明专利]卷积神经网络的加速运算方法、服务器及存储介质有效
申请号: | 201710544330.0 | 申请日: | 2017-07-05 |
公开(公告)号: | CN107451654B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 谌璟;孙庆新 | 申请(专利权)人: | 深圳市自行科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518000 广东省深圳市南山区南山街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 神经网络 加速 运算 方法 服务器 存储 介质 | ||
1.一种卷积神经网络的加速运算方法,其特征在于,所述方法包括:
加速运算服务器获取待拆分map;
判断所述待拆分map是否需要进行边界补充,若需要,对所述待拆分map进行边界补充,并将边界补充后的待拆分map作为新的待拆分map;
对所述待拆分map进行卷积和池化操作,将进行卷积和池化操作后的待拆分map拆分成预设数量的子map,并获取各子map的位置信息;
对各子map分别进行跨层运算,获取每一层运算的中间结果,将所述中间结果存入内部存储器中;
提取所述内部存储器中的中间结果参与下一层运算,直至获得最终运算结果;
按照所述位置信息对所述最终运算结果进行拼接,获得用于后续网络计算的拼接结果。
2.如权利要求1所述的方法,其特征在于,所述对所述待拆分map进行边界补充,并将边界补充后的待拆分map作为新的待拆分map,具体包括:
获取预设跨层层数与预设卷积核尺寸;
根据所述预设跨层层数与所述预设卷积核尺寸计算出所述边界补充的数量;
根据所述边界补充的数量对所述待拆分map进行边界补充,并将边界补充后的待拆分map作为所述新的待拆分map;所述预设跨层层数为所述待拆分map跨越卷积神经网络的层数。
3.如权利要求2所述的方法,其特征在于,所述获取预设跨层层数与预设卷积核尺寸,其中,获取预设卷积核尺寸具体包括:
获取所述待拆分map进行卷积和池化操作的预设卷积核的类型,根据所述预设卷积核的类型获取所述预设卷积核尺寸。
4.如权利要求2所述的方法,其特征在于,所述根据所述预设跨层层数与所述预设卷积核尺寸计算出所述边界补充的数量具体包括:
根据所述预设跨层层数与所述预设卷积核尺寸通过下式计算出所述边界补充的数量:
其中S为所述边界补充的数量,T代表所述预设跨层层数中池化层的总数量,数组Lt代表所述预设跨层层数中第t个池化层的倍数,索引号是t,t=1~T;数组Ni代表所述预设跨层层数中第i-1次到第i次池化层之间的卷积层的数量,索引号是i,i=1~T;二维数组Kij代表所述预设跨层层数中第i-1次到第i次池化层之间的第j个卷积层的卷积核尺寸,j为第i-1次到第i次池化层之间多个卷积层的索引号,j=1~Ni,对应的卷积核就是一个Kij*Kij矩阵,S、T、Lt、Ni、Kij均为大于0的整数。
5.如权利要求4所述的方法,其特征在于,所述根据所述预设跨层层数与所述预设卷积核尺寸通过下式计算出所述边界补充的数量之后,所述方法还包括:
根据所述边界补充的数量对R*C矩阵待拆分map进行边界补充,以获得R0*C0矩阵待拆分map;
将所述R0*C0矩阵待拆分map按照预设拆分方式拆分为a*b个子map;
其中R0=R+S,C0=C+S,R为所述R*C矩阵待拆分map的行数数,C为R*C矩阵待拆分map的列数数,R0为所述R0*C0矩阵待拆分map的行数,C0为所述R0*C0矩阵待拆分map的列数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市自行科技有限公司,未经深圳市自行科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710544330.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种齿轮箱的焊接结构
- 下一篇:防止丁字梁焊接变形夹具