[发明专利]基于OpenCL标准的卷积神经网络加速方法有效
申请号: | 201710543986.0 | 申请日: | 2017-07-05 |
公开(公告)号: | CN107341127B | 公开(公告)日: | 2020-04-14 |
发明(设计)人: | 王树龙;殷伟;刘而云;刘红侠;杜守刚 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F15/16 | 分类号: | G06F15/16;G06F9/30;G06N3/04 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 opencl 标准 卷积 神经网络 加速 方法 | ||
本发明提出了一种基于OpenCL标准的卷积神经网络加速方法,主要解决现有CPU处理卷积神经网络效率低的问题。其实现步骤为:1.读入原始的三维图像数据,将其传递到GPU的全局内存中;2.读取权重和偏置数据到GPU的全局内存中;3.将GPU的全局内存原始图像数据读取到GPU的局部内存中;4.初始化参数,构造线性激活函数Leaky‑ReLU;5.计算卷积神经网络第十二层的图片数据;6.计算卷积神经网络第十五层的图片数据;7.计算卷积神经网络第十八层的图片数据,并将该将图片数据存入GPU,再传回到主机内存中,给出运算时间。本发明提高了卷积神经网络运算速度,可用于计算机视觉的物体检测。
技术领域
本发明属于无人驾驶感知技术领域,特别涉及一种卷积神经网络加速方法,可用于计算机视觉的物体检测。
背景技术
随着神经网络研究的深入,研究人员发现对图片输入做卷积操作和生物视觉中的神经元接受局部内的输入有相似性,在神经网络中加上卷积操作成为主流趋势。由于卷积神经网络CNN在神经网络的结构上针对视觉输入本身特点做的特定设计,所以卷积神经网络成为计算机视觉领域的必然选择。无人驾驶的感知部分作为计算机视觉的领域范围,不可避免地成为CNN发挥作用的舞台。
传统的深度学习算法主要计算工具是CPU,因为CPU的通用性好,硬件架构已经成熟。然而,当深度学习算法对运算能力需求越来越大时,特别是卷积神经网络算法,CPU执行的效率不能满足需求。此时GPU进入了深度学习的研究者视野,GPU提供大量的并行运算单元,可以同时对图像像素进行并行处理,这个架构正好可以运用到深度学习算法上。
深度学习卷积神经网络模型中的参数是通过从大数据中学习获得的,能够应对车辆行驶过程中复杂的情形,且精确度高。但是对数据的质量和数量要求高,对计算能力也有很高的要求,所以用GPU做计算载体更具有优势。而且在GPU上编程技术门槛较低,算法开发周期较短。
发明内容
本发明的目的在于针对上述现有技术的不足,提供一种基于OpenCL标准的卷积神经网络加速方法,以在应对复杂的交通环境时,满足高的精确度要求和实时性要求。
本发明的技术方案完成如下:
一、技术原理
OpenCL(Open Computing Language)是第一个面向异构系统通用目的并行编程的标准,也是一个统一的编程环境,在异构架构下,主机CPU完成任务的调度与分配,而加速设备完成数据密集型的计算任务。利用OpenCL标准对图像算法进行加速的过程中,并行粒度的选择和数据的访存策略将直接影响到算法的加速效果。因此,利用OpenCL语言对图像算法进行加速时需要对并行粒度进行合理选择,以及对数据访存策略进行优化。主流的异构架构为CPU+GPU异构架构,与传统单一架构相比,异构架构能够更好的实现高性能并行计算,在深度学习、大数据和科学计算等领域有广阔的前景。此外,GPU相比于CPU有更大的数据吞吐量和更强的浮点计算能力,特别适合并行计算。卷积神经网络算法具有高度的并行性和较大的数据吞吐量,可以利用CPU+GPU的异构架构加速算法的执行速度。
本发明是在OpenCL标准下,通过对卷积神经网络的数据访存策略进行优化和对粒度进行合适选择,完成了卷积神经网络在异构架构下的并行加速。
二、技术方案
根据上述原理,本发明的实现方案包括如下:
1)将原始的三维图像数据读入到主机内存中,经过边缘扩展处理后,再将图像数据传递到GPU的全局内存中;
2)将训练得到的用于和图片数据卷积的权重和偏置数据从文本文件读入到主机内存中,再将权重和偏置数据传递到GPU的全局内存中;
3)将GPU的全局内存原始图片数据分块读入到GPU的局部内存中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710543986.0/2.html,转载请声明来源钻瓜专利网。