[发明专利]一种特定余数基的余数系统卷积计算单元在审
申请号: | 202210733589.0 | 申请日: | 2022-06-27 |
公开(公告)号: | CN115062263A | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 卢有亮;郑伟生;周小琴;张哲;陈彦伯;江陆翔 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F17/15 | 分类号: | G06F17/15;G06F7/72;G06F7/499;G06N3/04;G06V10/82 |
代理公司: | 成都虹盛汇泉专利代理有限公司 51268 | 代理人: | 王伟 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特定 余数 系统 卷积 计算 单元 | ||
本发明公开一种特定余数基的余数系统卷积计算单元,应用于人工智能领域,针对现有卷积计算存在的高时延的问题;本发明将一组较大的卷积数据通过前向转换单元转换为余数表示,在余数系统中进行卷积运算,利用模加法器和模乘法器来完成二进制中的加法和乘法运算,最后将计算完成的结果通过后向转换单元转换成二进制输出,减少了构造传统乘加运算所需的DSP单元并且降低了卷积计算的时延。
技术领域
本发明属于人工智能技术领域,特别涉及一种用于卷积神经网络中卷积计算的硬件电路的实现技术。
背景技术
卷积神经网络中卷积层用于提取输入数据的特征,卷积运算占用了卷积神经网络前向推断过程中的大部分运算,包含了大量的乘法和加法运算。在数字电路实现中多采用DSP(Digital Signal Processing)资源来实现,由于卷积神经网络算法的发展主要以增加网络深度和宽度,随之而来的是网络中对应的参数的增加,通过硬件实现的运算效率也会有所降低。因此需要利用硬件电路优化的方法来满足算法对速度的要求。余数系统(Residue Number System,RNS)是一个无权,并行的数值表征系统。余数系统由于其高并行度以及高运算速度,常常被用于设计矩阵运算的乘累加单元(MAC),矩阵运算又是卷积神经网络中卷积层运算所需要的关键技术,卷积计算在卷积神经网络中拥有较高的占比。
发明内容
为解决上述技术问题,本发明提出一种特定余数基的余数系统卷积计算单元,将一组较大的卷积数据通过前向转换单元转换为余数表示,在余数系统中进行卷积运算,利用模加法器和模乘法器来完成二进制中的加法和乘法运算。
本发明采用的技术方案为:一种特定余数基的余数系统卷积计算单元,包括:前向转换模块、后向转换模块、模加法器、模乘法器、基拓展模块和缩放模块;
前向转换模块用于将输入的二进制数据转换为三组余数基{2n,2n-1,2n+1-1}中的余数表示,输入的二进制数据具体包括:特征图数据、权重数据和偏置数据;
各通道中,将该通道对应的特征图数据和权重数据输入模乘法器,同时对该通道的偏置数据进行缓存;
同一通道中,将模乘法器的输出与缓存的偏置数据输入模加法器;
将各通道模加法器的输出输入后向转换单元,得到卷积运算的结果。
本发明的有益效果:本发明的一种基为{2n,2n-1,2n+1-1}的余数系统卷积计算单元,将一组较大的卷积数据通过前向转换单元转换为余数表示,在余数系统中进行卷积运算,利用模加法器和模乘法器来完成二进制中的加法和乘法运算,最后将计算完成的结果通过后向转换单元转换成二进制输出,减少了构造传统乘加运算所需的DSP单元并且降低了卷积计算的时延。
附图说明
图1是基为{2n,2n-1,2n+1-1}的余数系统的卷积计算单元结构图。
图2是余数系统基为{26-1,26,27-1}前向转换模块。
图3是模加法器结构。
图4是模乘法器结构。
图5是基拓展模块结构。
图6是各个通道的模乘加单元结构
图7是余数系统基为{26-1,26,27-1}后向转换模块。
具体实施方式
为便于本领域技术人员理解本发明的技术内容,下面结合附图对本发明内容进一步阐释。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210733589.0/2.html,转载请声明来源钻瓜专利网。