[发明专利]一种神经网络加速系统和方法有效
申请号: | 201911304163.8 | 申请日: | 2019-12-17 |
公开(公告)号: | CN111091183B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 李远超;蔡权雄;牛昕宇 | 申请(专利权)人: | 深圳鲲云信息科技有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/063 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 518048 广东省深圳市福田区福保*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 加速 系统 方法 | ||
本发明实施例公开了一种神经网络加速系统和方法,所述系统包括:数据处理模块,用于将卷积神经网络计算的输入数据从浮点数转为定点数;特征图拆分模块,用于根据第一预设规则将输入数据拆分为多个计算特征图qdsubgt;j/subgt;;第一计算模块,用于根据第二预设规则对每个计算特征图qdsubgt;j/subgt;进行计算得到多个第一输出特征图qosubgt;i/subgt;;累加模块,用于依次对所有第一输出特征图qosubgt;i/subgt;进行累加得到第二输出特征图;第二计算模块,用于根据第三预设规则对所述第二输出特征图进行处理得到输出数据。通过将浮点数转化为定点数,使得卷积神经网络的计算在需要更少的逻辑资源的同时不影响计算的准确性,占用的存储资源也大幅减少,数据传输速度加快。
技术领域
本发明实施例涉及神经网络技术,尤其涉及一种神经网络加速系统和方法。
背景技术
卷积神经网络在过去几年中取得显著发展,它目前是许多智能系统的基本工具。但是为了提高图像分类、图像识别等准确率,卷积神经网络的计算复杂度和对存储资源的消耗也在不断增加。因此,卷积神经网络加速已成为一个热门课题。
对于卷积神经网络的硬件实现,近年来已经提出了一批基于FPGA或ASIC的加速器。这些加速器的设计从不同的方面来对卷积神经网络进行优化,例如优化卷积神经网络的计算资源,优化数据的输出,优化计算资源和片下存储器的访问等待。
然而这些加速器的设计通常将卷积神经网络算法当成一个小黑盒,只优化了硬件结构,容易造成硬件加速后的卷积神经网络计算的准确率下降。
发明内容
有鉴于此,本发明实施例提供一种神经网络加速系统和方法,以减少神经网络计算需要使用的逻辑资源,提高数据传输速度。
第一方面,本发明实施例提供一种神经网络加速系统,包括:
数据处理模块,用于将卷积神经网络计算的输入数据从浮点数转为定点数;
特征图拆分模块,用于根据第一预设规则将输入数据拆分为多个计算特征图qdj;
第一计算模块,用于根据第二预设规则对每个计算特征图qdj进行计算得到多个第一输出特征图qoi;
累加模块,用于依次对所有第一输出特征图qoi进行累加得到第二输出特征图;
第二计算模块,用于根据第三预设规则对所述第二输出特征图进行处理得到输出数据。
进一步的,所述第一计算模块包括:
权值存储器,用于存储权值qw;
卷积计算单元,用于根据所述计算特征图qdj和所述权值qw进行卷积计算得到第一输出特征图的第一部分
支路加法树单元,用于根据第四预设规则对将所述计算特征图qdj进行计算得到第一输出特征图的第二部分
第一输出特征图计算单元,用于将所述第一输出特征图的第一部分和所述第一输出特征图的第二部分相减得到所述第一输出特征图qoi。
进一步的,所述数据处理模块还用于将所述权值存储器内存储的权值qw转化为定点数。
进一步的,所述特征图拆分模块具体用于:
根据预设步长将输入数据拆分为多个包括3*3矩阵数据结构的计算特征图qdj。
进一步的,所述第二计算模块包括:
偏置模块,用于将所述第二输出特征图加上预设偏置参数,得到输出偏置特征图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳鲲云信息科技有限公司,未经深圳鲲云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911304163.8/2.html,转载请声明来源钻瓜专利网。