[发明专利]一种基于卷积神经网络的参数填充方法与装置有效
| 申请号: | 201910974233.4 | 申请日: | 2019-10-14 |
| 公开(公告)号: | CN110472700B | 公开(公告)日: | 2020-06-16 |
| 发明(设计)人: | 陈海波 | 申请(专利权)人: | 深兰人工智能芯片研究院(江苏)有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 李迪 |
| 地址: | 213161 江苏省常州市武进*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 卷积 神经网络 参数 填充 方法 装置 | ||
本申请提供一种基于卷积神经网络的参数填充方法与装置。该方法可以灵活的调整卷积神经网络的参数,同时对不同参数下确定的卷积神经网络的权重的形状和偏置项的形状进行填充,使得基于填充后的权重和偏置项对输入图像卷积处理得到的特征图形状与官方原配置得到的特征图形状一样,适用于按原配置设计的FPGA,无需重新设计FPGA、节省资源;且填充后权重和偏置项得到的特征图经过后续处理得到的最终预测结果与未填充前得到特征图经过后续处理得到的最终预测结果相同。
技术领域
本申请涉及现场可编程门阵列FPGA实现卷积神经网络领域,尤其涉及一种基于卷积神经网络的参数填充方法与装置。
背景技术
随着人工智能的不断发展,人工智能在机器视觉、语音识别以及自然语言处理等领域都取得了重大突破。卷积神经网络(Convolutional Neural Network,CNN)在人工智能领域受到越来越多的青睐,它是深度学习技术中极具代表性的学习算法之一,它利用空间关系,采用权值共享网络结构,使之更类似于生物神经网络,降低了网络模型的复杂度并减少了权值的数量,提高了一般算法的训练性能。卷积神经网络的这些优点使得它成为当前语音分析和图像识别领域的研究热点。
随着网络变得越来越大、越来越复杂,我们需要大量的计算资源来对其进行训练,因此人们纷纷将注意力转向现场可编程门阵列(Field Programmable Gate Array,FPGA)器件,FPGA不仅具有软件的可编程性和灵活性,同时又有专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)高吞吐和低延迟的特性,而且由于具有丰富的I/O接口,FPGA还非常适合用作CNN硬件加速器。CNN硬件加速器提供更多更先进的特性,比如图像分类、物体识别和追踪、人脸和语音识别、自然语言处理等,将先进的人工智能网络应用到自动化生产、控制等场景中,提高相关行业的生产力为用户带来更好的服务。
现有技术中,FPGA往往是依据某一神经网络的固定网络结构(参数结构),也就是网络的固定配置,实现该网络对图像或视频流进行物体检测或目标识别等。一旦按照实际应用调整该卷积神经网络的相关配置参数重新训练,得到稍异于原结构(一般指官方网络结构)的新结构时,那么这套按照该固定配置实现的FPGA将无法重复利用,需要重新设计。FPGA内部算法、计算单元、主控调度单元需要大量改动,耗费大量资源。
发明内容
本申请提出一种基于卷积神经网络的参数填充方法,该方法可以灵活的调整卷积神经网络的参数,通过分析不同于原结构的特征图,对不同于原结构(一般指官方网络结构)的参数进行填充,使其形状和原结构的形状相同,进而生成和原结构形状相同的特征图,并且不改变自身的后续效果,可以直接用于按原网络结构设计好FPGA,无需重新设计、节省资源。
第一方面,本申请提供一种基于卷积神经网络的参数填充方法,该方法包括:
确定第一参数和第二参数,所述第一参数和所述第二参数用于确定第一卷积神经网络的第一权重的形状和第一偏置项的形状,当输入图像输入到所述第一卷积神经网络时,所述第一权重和所述第一偏置项用于对所述输入图像进行卷积生成与所述输入图像对应的第一特征图;
确定改变后第一参数和/或第二参数的取值,基于改变后的第一参数和第二参数,确定第二卷积神经网络的第二权重的形状和第二偏置项的形状,所述第二权重和所述第二偏置项用于对所述输入图像进行卷积生成与所述输入图像对应的第二特征图;分析所述第二特征图的形状与所述第一特征图的形状,确定第二特征图的需重建形状;
根据所述需重建形状,对所述第二权重和所述第二偏置项填充特定形状的特定值,以使当所述输入图像输入所述第二卷积神经网络时,填充后的所述第二权重和所述第二偏置项对所述输入图像进行卷积得到第三特征图,所述第三特征图与所述第一特征图的形状相同,且所述第三特征图经过后续处理得到的最终预测结果与所述第二特征图经过所述后续处理得到的最终预测结果相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深兰人工智能芯片研究院(江苏)有限公司,未经深兰人工智能芯片研究院(江苏)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910974233.4/2.html,转载请声明来源钻瓜专利网。





