[发明专利]一种稀疏神经网络的数据处理方法、处理器和系统在审
申请号: | 202110783460.6 | 申请日: | 2021-07-12 |
公开(公告)号: | CN113486200A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 刘焕双;李秋平;雍珊珊;张兴;王新安;高金潇;李肖飞;郭朋非 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G06F16/532 | 分类号: | G06F16/532;G06N3/02 |
代理公司: | 深圳市华优知识产权代理事务所(普通合伙) 44319 | 代理人: | 余薇 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 稀疏 神经网络 数据处理 方法 处理器 系统 | ||
本发明提供一种稀疏神经网络的数据处理方法、处理器和系统,获取由所述稀疏神经网络的稀疏数据转换得到的稠密数据;将所述稠密数据中的权重数据和输入特征图进行通道匹配,将通道相同的权重数据和输入特征图匹配成对,得到和权重数据匹配的输入特征图的索引值;对匹配的权重‑输入特征图数据对进行PE阵列计算。实现了同时挖掘各特征图和权值数据的稀疏性,减少存储空间和运算量,降低系统延时并提高系统吞吐率。
技术领域
本发明涉及稀疏神经网络技术领域,具体地,涉及一种稀疏神经网络的数据处理方法、处理器和系统。
背景技术
近年来,深度学习在诸如图像识别和语音处理等领域取得了显著的成绩,深度学习在移动端和嵌入式应用领域也显示出巨大的应用前景,但最先进的深度神经网络推理需要数十亿次操作和数百兆字节来存储激活值和权重数据,巨大的存储和运算需求很大程度上限制了其在资源和能耗受限的平台上进行部署。
得益于稀疏神经网络的稀疏性和容错性,比如卷积神经网络CNN,可以在几乎不降低精度的情况下大大降低其运算和存储需求。如今,主要的解决方案是对稀疏神经网络进行跳零处理,即当遇到零元时通过门控开关关闭运算单元来降低功耗,但不能降低系统延时和提高系统吞吐率。此外,现有的稀疏神经网络处理器还存在以下问题:
1.非零元的出现是随机的,需要专门的编译器进行处理。
2.难以同时挖掘权值数据和特征图的稀疏性。
3.对输出特征图存储器的访存压力过大。
上述问题阻碍了深度学习在移动端和嵌入式应用领域的广泛应用,对许多应用场景的落地造成严重的限制。
发明内容
本发明的主要目的是提供一种稀疏神经网络的数据处理方法、处理器和系统,以便解决现有技术中难以同时挖掘权值数据和特征图稀疏性、无法降低系统延时以及对输出特征图存储器访存压力大的问题。
为了实现上述目的,本发明提供一种稀疏神经网络的数据处理方法,包括:
获取由所述稀疏神经网络的稀疏数据转换得到的稠密数据;
将所述稠密数据中的权重数据和输入特征图进行通道匹配,将通道相同的权重数据和输入特征图匹配成对,得到和权重数据匹配的输入特征图的索引值;
对匹配的权重-输入特征图数据对进行PE阵列计算。
可选地,所述对匹配的权重-输入特征图数据对进行PE阵列计算包括:
将所述匹配的权重数据和输入特征图的地址发送到地址计算单元用于计算部分和Psum的地址;
计算时由地址计算单元控制权重-输入特征图数据对进入对应的近似乘法器中进行近似乘法运算,运算结果进入加法器由地址计算单元控制其是否与Buffer中数据进行相加,将部分和Psum的中间结果暂存在Buffer中,当Psum计算完成后,由Buffer存入Psum RF中地址计算单元指定的Psum Addr。
可选地,所述将所述稠密数据中的权重数据和输入特征图进行通道匹配包括使用优先编码器将权重W向量和输入特征图IF向量的通道channel匹配矩阵转化为(有效-位置)矢量。
可选地,所述近似乘法运算包括:检测输入特征图和权值数据最高非零位的位数,截取其后几位数据进行乘法运算,再由移位器根据检测到的位数将乘法运算结果移位到正常位数。
可选地,PE阵列计算完成后,将计算结果沿对角线进行累加,将累加结果存储到Psum SRAM中。
本发明还提供一种处理器,包括:
获取单元,用于获取由稀疏神经网络的稀疏数据转换得到的稠密数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110783460.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高效研磨体剥离制备石墨烯的方法
- 下一篇:一种抗结食用盐及其制备方法