[发明专利]一种卷积神经网络的并行计算方法及装置在审
申请号: | 201910348849.0 | 申请日: | 2019-04-28 |
公开(公告)号: | CN110147252A | 公开(公告)日: | 2019-08-20 |
发明(设计)人: | 陈海波 | 申请(专利权)人: | 深兰科技(上海)有限公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06N3/04 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 200336 上海市长宁区威*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 像素点数据 卷积 卷积神经网络 并行计算 图像数据 原图像数据 卷积运算 权重数据 相隔 合并 | ||
一种卷积神经网络的并行计算方法及装置,用于提高卷积运算效率。其中的一种卷积神经网络的并行计算方法包括:获取待卷积的图像数据,其中,所述待卷积的图像数据中的任一像素点数据是由原图像数据中对应所述任一像素点数据所在位置的第一像素点数据与相隔N个像素点数据的至少一个第二像素点数据合并得到的,所述第一像素点数据和所述至少一个第二像素点数据位于同一行,N由第一卷积步长确定;将所述待卷积的图像数据与权重数据进行卷积,得到至少两个卷积结果。
技术领域
本申请涉及卷积神经网络加速技术领域,尤其涉及一种卷积神经网络的并行计算方法及装置。
背景技术
随着深度学习技术的不断成熟,卷积神经网络(Convolutional Neural Network,CNN)被广泛用于计算机视觉、语音识别、自然语言处理等领域,其中,卷积神经网络的本质在于卷积运算。
目前,用于卷积计算的基本单元是处理单元(Processing Element,PE),一个PE包括多个数字信号处理(Digital Signal Processing,DSP)元器件,一个DSP可以做一个图像像素点的卷积运算,例如,一个DSP可以做一个位宽为16bit(比特)的图像像素点的卷积运算。
而随着更精确的深度学习模型被开发出来,目标检测、图像识别等许多应用问题只需要INT8或更低定点计算精度来保持可接受的识别准确性,对比INT16数据位宽降低了一半,数据存储空间也减半。在相同的硬件资源下,若继续采用上述传统的计算方式进行运算,运算效率低下,对存储资源也是极大浪费。
发明内容
本申请实施例提供一种卷积神经网络的并行计算方法及装置,用于提高卷积神经网络的运算效率。
第一方面,本申请提供一种卷积神经网络的并行计算方法,包括:获取待卷积的图像数据,其中,所述待卷积的图像数据中的任一像素点数据是由原图像数据中对应所述任一像素点数据所在位置的第一像素点数据与相隔N个像素点数据的至少一个第二像素点数据合并得到的,所述第一像素点数据和所述至少一个第二像素点数据位于同一行,N由第一卷积步长确定;将所述待卷积的图像数据与权重数据进行卷积,得到至少两个卷积结果。
在本申请实施例中,由于待卷积的图像数据中的任一像素点数据是由原图像数据中对应该像素点数据所在位置的第一像素点数据和至少一个第二像素点数据合并得到的,因此,在对该像素点数据进行卷积运算时,实际是进行了原图像数据中至少两个像素点数据的卷积运算,相较于现有技术中一个时钟周期仅进行一个像素点数据的卷积运算,提高了运算效率。
在一个可能的设计中,所述任一像素点数据是由所述第一像素点数据与相隔N个像素点数据的第二像素点数据合并得到的;
获取待卷积的图像数据,包括:将所述原图像数据的每一行中每相隔N个像素点数据的两个像素点数据合并为一个像素点数据,得到重排后的图像数据;从所述重排后的图像数据中获取待卷积的图像数据。
在本申请实施例中,可以先对原图像数据进行重排,进而获取待卷积的图像数据,也可以是在需要进行卷积运算时,直接从原图像数据上读取第一像素点数据和第二像素点数据,本领域普通技术人员可以根据实际需要选择,在此不做限制。
在一个可能的设计中,所述重排后的图像数据对应的第二卷积步长是所述第一卷积步长的两倍。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深兰科技(上海)有限公司,未经深兰科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910348849.0/2.html,转载请声明来源钻瓜专利网。