[发明专利]基于FPGA的卷积神经网络架构方法及其人脸识别方法在审
申请号: | 201911366823.5 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111126309A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 刘文;蒋云翔;朱佳;蔡晔;丁杰;郝志杰 | 申请(专利权)人: | 长沙海格北斗信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 410000 湖南省长*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 fpga 卷积 神经网络 架构 方法 其人 识别 | ||
本发明公开了一种基于FPGA的卷积神经网络架构方法,包括系统初始化;根据crp的内部状态启动dma,读取ps侧的图像信息;根据S3FD算法,复用crp模块从而完成conv计算;对crp模块内部的乘加卷积运算进行实现与调度;对结构帧控模块进行复用;对结构层孔模块进行复用;对crp_calc模块进行复用本发明还公开了包括所述基于FPGA的卷积神经网络架构方法的人脸识别方法。本发明提供的这种基于FPGA的卷积神经网络架构方法及其人脸识别方法,采用FPGA复用的方式实现卷积神经网络的架构,兼顾了FPGA内部资源和卷积神经网络的运算速度;而且本发明方法的可靠性高,适用性好。
技术领域
本发明属于图像识别领域,具体涉及一种基于FPGA的卷积神经网络架构方法及其人脸识别方法。
背景技术
随着经济技术的发展,智能网络时代已经到来。而人脸识别技术,也已经广泛应用于人们的生产和生活当中,给人们的生产和生活带来了无尽的便利。
现今的人脸识别技术,往往依靠的是传统的CNN算法,即卷积神经网络算法。传统的CNN算法大多基于通用处理器实现,在实时性和功耗方面都不能满足应用的需求。就目前卷积神经网络应用技术的发展而言,算法本身需要对图片等数据进行卷积运算操作,致使CPU运算速度极慢,资源消耗极高;而这也是限制卷积神经网络发展的一大重要因素。
现阶段出现了各种基于FPGA的卷积神经网络架构的设计,也确实为神经网络的发展解决了一些难题,但是由于各种算法中CNN层数不同,乘加运算量的差异,同时也受制于FPGA内部资源及功耗,对于一些权重位宽较大、个数较多的架构,FPGA并不能满足设计要求。这就要求对算法进行剪枝优化处理:剪枝能使算法的运算量降低,节省FPGA的逻辑消耗;但是,经过剪枝之后的算法在精度方面会降低,影响算法实现的效果。
因此,目前并没有一种能够兼顾性能和资源的基于FPGA的卷积神经网络架构方法。
发明内容
本发明的目的之一在于提供一种能够兼顾性能和资源、可靠性高且适用性好的基于FPGA的卷积神经网络架构方法。
本发明的目的之二在于提供一种包括了所述基于FPGA的卷积神经网络架构方法的人脸识别方法。
本发明提供的这种基于FPGA的卷积神经网络架构方法,包括如下步骤:
S1.系统初始化;
S2.根据crp(卷积神经网络模块)的内部状态启动dma(直接存储器访问模块),读取ps(programmable system)侧的图像信息;
S3.根据S3FD算法,复用crp模块从而完成conv计算;所述conv为卷积神经网络运算模块;
S4.对crp模块内部的乘加卷积运算进行实现与调度;
S5.对结构帧控模块进行复用;
S6.对结构层孔模块进行复用;
S7.对crp_calc模块进行复用;所述crp_calc模块为卷积神经网络的乘加运算模块。
步骤S1所述的系统初始化,具体包括接收CPU通过APB总线下发的各项数据。
所述的各项数据包括DMA的读写首地址,图像信息、卷积核信息和反量化信息。
步骤S4所述的crp模块,具体包括crp_frame_ctrl模块,crp_layer_ctrl模块和crp_calc模块;crp_frame_ctrl模块用于负责帧控制与调度;crp_layer_ctrl模块用于负责crp层的控制与调度,crp_calc模块用于完成卷积神经网络的乘加运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙海格北斗信息技术有限公司,未经长沙海格北斗信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911366823.5/2.html,转载请声明来源钻瓜专利网。