[发明专利]提高卷积神经网络计算效率的方法和装置有效
申请号: | 201710173124.3 | 申请日: | 2017-03-22 |
公开(公告)号: | CN108629405B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 方颉翔;胡睿;张铧铧 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06K9/00 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提高 卷积 神经网络 计算 效率 方法 装置 | ||
本发明实施例提供了一种提高卷积神经网络计算效率的方法和装置,一种提高卷积神经网络计算效率的方法包括:对于检测模型的每一卷积层,根据输入特征图的分辨率和通道数、卷积系数的个数以及乘加单元中乘法器的个数,确定乘加单元在每个维度上乘法器的分配系数,对于检测模型的每一卷积层,根据每个维度上乘法器的分配系数,将卷积层的输入特征图的分辨率及通道数上的各数据,输入乘加单元中的各乘法器进行卷积运算,输出每一卷积层的输出特征图,其中,待检测图像的特征图作为检测模型第一卷积层的输入特征图。本发明实施例提供的提高卷积神经网络计算效率的方法和装置,用于提高卷积神经网络算法的计算效率。
技术领域
本发明涉及计算机技术领域,特别是涉及一种提高卷积神经网络计算效率的方法和装置。
背景技术
在图像识别领域,随着深度学习算法的不断发展,基于卷积神经网络(Convolutional Neural Network,CNN)的检测、分类、提取、匹配应用层出不穷。这些应用的基础就是各种CNN。CNN是一种模拟大脑神经网络的工作方式实现数据信息提取的算法。该算法利用卷积计算完成信息的初步提取,结合一些非线性运算,实现高性能的目标检测。
在大部分的CNN芯片方案中,主要关注的都是系统的计算性能、缓存模块的性能大小、互联关系。对于数据无法保证计算单元高效运转的情况,基本是采用增加接口带宽的方式来解决。事实上,由于CNN算法的巨大计算需求,其专用芯片的计算往往是以大规模并行的方式工作的。每一个时钟周期,芯片内都会进行上百至上万次不等的乘加运算。这导致计算单元在每个时钟周期都需要获取大量的输入数据,保证计算单元能持续工作。
在CNN芯片的计算中,控制单元从存储单元中获取CNN检测的模型架构、卷积计算的每层分辨率、每层卷积系数的分辨率等特征,随后控制单元对于卷积计算的每一层,按照该层分辨率输出特征数据与卷积系数进入乘加单元。乘法单元内的各乘法器完成特征数据与卷积系数的乘法后,将结果送入加法树单元。在加法树单元中,会根据控制单元的控制,将对应的数据累加,并送出结果到数据整理单元。数据整理单元则根据数据的分组情况,将结果按照写回存储单元。在完成CNN模型的各层卷积运算后,即可得到运算结果。
但在使用CNN芯片进行检测的过程中,输入的待检测图像的分辨率是不确定的,在卷积运算的每一层中,每一个维度上的分辨率也是在不断变化的。而CNN芯片中乘加单元中的乘法器对卷积运算中每一个维度上的分配方式是固定的,这就导致乘加单元中的乘法器在某些维度上输入的数据不足,某些维度上输入的数据又过多,无法发挥所有乘法器的最大运算性能,从而影响CNN芯片的计算效率。
发明内容
本发明实施例的目的在于提供一种提高卷积神经网络计算效率的方法和装置,提高了卷积神经网络算法的计算效率。
本实施例具体技术方案如下:
第一方面提供一种提高卷积神经网络计算效率的方法,包括:
获取待检测图像的特征图的分辨率和通道数以及乘加单元中乘法器的个数;
获取所述待检测图像的特征图的CNN检测模型,所述检测模型包括对所述特征图进行卷积运算时每一卷积层的步进值、每一卷积层所使用的卷积系数分辨率和每一卷积层所使用的卷积系数的个数;
根据所述CNN检测模型第m卷积层的步进值和第m卷积层的输入特征图的分辨率,确定第m+1卷积层的输入特征图的分辨率,根据所述CNN检测模型第m卷积层所使用的卷积系数的个数,确定第m+1卷积层的输入特征图的通道数;
对于所述检测模型的每一卷积层,根据输入特征图的分辨率和通道数、卷积系数的个数以及所述乘加单元中乘法器的个数,确定所述乘加单元在每个维度上乘法器的分配系数,其中,所述分配系数为2的n次方,n为正整数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710173124.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于集成人工神经元器件的不应电路
- 下一篇:用于卷积神经网络的运算装置