[发明专利]神经网络配置方法、装置、计算机设备和存储介质在审
申请号: | 202110737010.3 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113592062A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 深圳元戎启行科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F11/34 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 关志琨 |
地址: | 518054 广东省深圳市南山区粤海街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 配置 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种神经网络配置方法、装置、计算机设备和存储介质。所述方法包括:生成神经网络的有效配置列表;确定神经网络中的待配置卷积层;遍历有效配置列表中的硬件增强项和卷积算法标识的组合,得到待配置卷积层的运行延迟,并根据运行延迟确定所述待配置卷积层的目标硬件增强项和目标卷积算法标识;确定神经网络中的下一个待配置卷积层,并返回至遍历有效配置列表中的硬件增强项和卷积算法标识的组合,得到待配置卷积层的运行延迟的步骤,直至确定神经网络的各个卷积层各自的目标硬件增强项和目标卷积算法标识。采用本方法能够提升了神经网络执行推理任务的效率。
技术领域
本申请涉及深度学习技术领域,特别是涉及一种神经网络配置方法、装置、计算机设备和存储介质。
背景技术
在最近几年,卷积神经网络在深度学习领域已经取得了巨大的成功。然而,如图形分类的推理任务仍然是一个计算负荷极高的工作,需要构建特别应用程序的硬件,以及在低功耗硬件上高效执行推理程序的库。GPGPU(General-Purpose computing on GraphicsProcessing Units,通用图形处理单元)是其中一个广为应用的硬件。此外,为新兴的神经网络体系结构开发高效的子程序库是一项非常重要的工作。这种方法在现有库的基础上提供了另一种层优化,使推理引擎能够充分利用底层硬件的功能和效率,而不是来自传统库的接口。
如cuDNN(Compute-Unified Device Architecture Deep Neural Networklibrary,基于CUDA的深度神经网络库)的深度学习的函数库,已经被大多数如TensorFlow、PyTorch等的深度学习架构所采用。上述深度学习架构也因此提出了一个可以更准确地识别库中的最佳选择的封装函数,从而让用户通过配置环境变量来实现其运用,以提升神经网络的运行速度。
然而,由于推理引擎的开发人员在进行开发工作时通常是直接使用如cuDNN的库,而不是通过上述深度学习框架,因此也就无法直接利用其提出的封装函数来识别库中的最佳选择,从而可能由于次优的配置而影响了神经网络的运行效率。
因此,现有的神经网络配置方法存在着影响神经网络运行效率的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种神经网络配置方法、装置、计算机设备和存储介质。
第一方面,提供了一种神经网络配置方法,包括:
生成神经网络的有效配置列表;所述有效配置列表包括硬件增强项和卷积算法标识;
确定所述神经网络中的待配置卷积层;
遍历所述有效配置列表中的硬件增强项和卷积算法标识的组合,得到所述待配置卷积层的运行延迟,并根据所述运行延迟确定所述待配置卷积层的目标硬件增强项和目标卷积算法标识;
确定所述神经网络中的下一个待配置卷积层,并返回至所述遍历所述有效配置列表中的硬件增强项和卷积算法标识的组合,得到所述待配置卷积层的运行延迟的步骤,直至确定所述神经网络的各个卷积层各自的目标硬件增强项和目标卷积算法标识。
在一个实施例中,所述遍历所述有效配置列表中的硬件增强项和卷积算法标识的组合,得到所述待配置卷积层的运行延迟,并根据所述运行延迟确定所述待配置卷积层的目标硬件增强项和目标卷积算法标识,包括:
在所述有效配置列表中,选取待测试卷积算法标识;
针对所述待测试卷积算法标识,在所述有效配置列表中,选取待测试硬件增强项;
获取所述待配置卷积层采用所述待测试卷积算法标识和所述待测试硬件增强项执行基准测试任务时的运行延迟;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳元戎启行科技有限公司,未经深圳元戎启行科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110737010.3/2.html,转载请声明来源钻瓜专利网。