[发明专利]加速计算二维图像CNN卷积的方法有效
申请号: | 201711223548.2 | 申请日: | 2017-11-29 |
公开(公告)号: | CN107862650B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 李园强;张亚亚;刘洋;徐维涛;蔡刚 | 申请(专利权)人: | 中科亿海微电子科技(苏州)有限公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06N3/04 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
地址: | 215028 江苏省苏州市工业园*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 加速 计算 二维 图像 cnn 卷积 方法 | ||
1.一种加速计算二维图像CNN卷积的方法,包括:
数据以流水线方式排布输入FIFO,卷积窗口在FIFO内成为平行四边形,卷积运算在行和列方向上同时重用数据;
根据PE计算单元数量及对速度的要求,PE计算单元采用并行加速计算方法或串行加速计算方法,输出特征图像;
其中,所述数据以流水线方式排布输入FIFO包括:将矩形方式表示的原始输入图像数据以流水线方式排布后,每行数据相对上一行向右错开一列或多列,整体形成一个平行四边形;
其中,PE计算单元处理后输出特征图像的数据也呈现每行数据相对上一行向右错开一列或多列的四边形排布;
其中,所述的卷积窗口在FIFO内呈现平行四边形包括:在原始输入图像为矩形方式表示下,卷积核滑过原始输入图像不同位置的卷积窗口在FIFO中呈现平行四边形。
2.根据权利要求1所述的方法,其中PE单元从FIFO获取数据,在资源充足速度要求高的情况使用并行加速方法,在要求资源少时使用串行加速方法。
3.根据权利要求2所述的方法,所述的并行计算方法包括:FIFO内包括了若干卷积窗口,即所述平行四边形覆盖的数据,每个固定位置与卷积核中固定位置的元素做乘积是固定的,并将固定的乘积结果接入同一加法树;FIFO中每进入一列数据,所有平行四边形便执行一次卷积运算,输出多个特征数据。
4.根据权利要求3所述的方法,并行加速方法进一步包括:
尺寸对应的输入图像按行分成多组,分批送入FIFO和PE进行处理,再将输出特征按行拼接成完整的特征图像;对于多个卷积核的情形,一个卷积核对应一个PE,所有PE共享输入图像数据,并行加速计算。
5.根据权利要求2所述的方法,所述的串行计算方法包括:数据缓存data buffer与权重缓存weight buffer的结构具有置数和移位寄存器链的功能,进入数据缓存data buffer与权重缓存weight buffer的数据排布方式使得进入缓存的相邻数据可以重用。
6.根据权利要求2所述的方法,所述数据排布方式包括:
输入二维图形、卷积核;
将输入的二维图像在计算时将其安行分成若干组,每个分组(batch)由一个PE在一段时间内进行卷积处理,根据组内行数确定分批处理数目batch_num;
将不同batch输出结果拼接在一起。
7.根据权利要求1所述的方法,还包括:输出特征图像以循环队列的方式存储;其中,
特征图像的偏置作为特征队列的初始值,每行的大小等于完整特征图像的列数,行数等于FIFO内平行四边形的个数,即并行计算的卷积窗口数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科亿海微电子科技(苏州)有限公司,未经中科亿海微电子科技(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711223548.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序