[发明专利]一种基于深度学习芯片的数据存储优化方法和装置有效
申请号: | 201810307064.4 | 申请日: | 2018-04-08 |
公开(公告)号: | CN108615076B | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 廖裕民;卢捷 | 申请(专利权)人: | 瑞芯微电子股份有限公司 |
主分类号: | G06N7/04 | 分类号: | G06N7/04 |
代理公司: | 福州市景弘专利代理事务所(普通合伙) 35219 | 代理人: | 林祥翔;徐剑兵 |
地址: | 350003 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于深度学习芯片的数据存储优化方法和装置,所述方法在激活函数运算单元对卷积特征数据进行激活函数运算,得到第二特征矩阵数据之后,通过非零数据统计单元统计第二特征矩阵数据中非零数据,以及通过特征数据压缩单元根据所有非零数据在整个第二特征矩阵数据占比情况,对第二特征数据进行压缩处理,得到压缩数据,并将压缩数据回写至主存单元中。相较于现有技术中将激活函数运算得到的全部数据回写至主存的方式,本发明可以有效降低存储带宽和运算数据对存储空间的占用。 | ||
搜索关键词: | 一种 基于 深度 学习 芯片 数据 存储 优化 方法 装置 | ||
【主权项】:
1.一种基于深度学习芯片的数据存储优化装置,其特征在于,所述装置包括主存单元、特征数据读取单元、特征数据解压单元、特征数据缓存单元、卷积核读取单元、卷积核缓存单元、卷积运算单元、激活函数运算单元、非零数据统计单元、数据压缩单元、数据回写单元;所述主存单元分别与特征数据读取单元、卷积核读取单元连接,所述特征数据读取单元与特征数据解压单元连接,所述特征数据解压单元与特征数据缓存单元连接,所述特征数据缓存单元与卷积运算单元连接;所述卷积核读取单元与卷积核缓存单元连接,所述卷积核缓存单元与卷积运算单元连接;所述卷积运算单元与激活函数运算单元连接,所述激活函数运算单元与非零数据统计单元连接,所述非零数据统计单元与数据压缩单元连接,所述数据压缩单元与数据回写单元连接,所述数据回写单元与主存单元连接;所述主存单元用于存储第一特征矩阵数据以及各个神经网络子层的卷积核数据;所述特征数据读取单元用于从主存单元读取第一特征矩阵数据,并将其存储于特征数据缓存单元中;所述卷积核读取单元用于从主存单元读取当前神经网络子层对应的卷积核数据,并将其存储于卷积核缓存单元中;所述卷积运算单元用于获取卷积核缓存单元中的卷积核数据以及特征数据缓存单元中的第一特征矩阵数据进行卷积运算,得到卷积特征数据,并将卷积特征数据传输给激活函数运算单元;所述激活函数运算单元用于对卷积特征数据进行激活函数运算,得到第二特征矩阵数据;所述非零数据统计单元用于统计第二特征矩阵数据中非零数据,所述特征数据压缩单元用于根据所有非零数据在整个第二特征矩阵数据占比情况,对第二特征数据进行压缩处理,得到压缩数据;所述反向回写单元用于将压缩数据回写至主存单元中;当前神经网络子层的压缩数据为下一层神经网络子层的第一特征矩阵数据对应的压缩数据,所述特征数据解压单元用于对特征数据读取单元读取的压缩数据进行解压数据,并将解压得到的第一特征矩阵数据存储至特征数据缓存单元中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞芯微电子股份有限公司,未经瑞芯微电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810307064.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种自动化调参方法
- 下一篇:一种应用于深度学习网络的缓存优化方法及装置