[发明专利]深度学习人脸识别网络优化方法、装置及存储介质有效
申请号: | 201711455889.2 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108062532B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 张凤春;杨东;王栋 | 申请(专利权)人: | 智慧眼科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T1/20 |
代理公司: | 长沙智嵘专利代理事务所(普通合伙) 43211 | 代理人: | 刘宏 |
地址: | 410205 湖南省长沙市岳麓区长*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 学习 识别 网络 优化 方法 装置 存储 介质 | ||
本发明公开了一种深度学习人脸识别网络优化方法、装置及存储介质,该方法包括以下步骤:图像数据由CPU内存传递至GPU显存,且仅传递unsigned char类型图像数据;对接收到的数据在GPU下由unsigned char类型图像数据转换为float类型图像数据;对GPU下float类型图像数据进行减均值操作;加载深度学习人脸识别模型文件和减均值操作后的图像数据,传入深度学习框架中,在GPU下进行并行计算;将计算结果由GPU显存回传至CPU内存中。本发明在GPU下并行计算,与现有对深度学习框架CPU下串行计算方式相比,本发明整体运算速度的得以很大提升,节约了运行时间,使得运行速度得到提升。
技术领域
本发明涉及人脸识别领域,特别地,涉及一种深度学习人脸识别网络优化方法、装置及存储介质。
背景技术
深度学习(Deep Learning)是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习典型应用为图像识别和语音识别。
人脸识别技术是目前被广泛研究的热门课题。人脸识别技术就是利用计算机分析人脸图像,通过检测对比人脸数据库中的所有已知原型人脸图像来达到辨认身份的目的。随着科学技术的发展及各种技术手段的综合应用,人脸识别技术将在视频监控、访问控制等领域有着广阔的应用前景。
深度学习采用了与传统神经网络相似的分层结构,系统由包括输入层、隐层(多层)、输出层组成的多层网络,只有相邻层节点之间有连接,同一层以及跨层节点之间相互无连接,每一层可以看作是一个logistic regression模型;这种分层结构,比较接近人类大脑结构。
深度学习由于计算量大,计算复杂,所以基于深度学习的人脸识别速度上与传统方法比较起来,具有一定劣势,针对速度优化方面,许多研究人员提出各种针对的改进方法。
针对深度学习框架有很多,目前主要以TensorFlow、Caffe、MXNet这三款流行的Deep Learning框架为主。TensorFlow、Caffe、MXNet这三款流行的Deep Learning框架,虽然在性能上比CPU有很大的提升,但是这三款框架在GPU上,性能还没有完全达到最优,还有优化的空间。
发明内容
本发明提供了一种深度学习人脸识别网络优化方法、装置及存储介质,以解决深度学习人脸识别网络由于计算量大、计算复杂导致速度性能不佳的技术问题。
本发明采用的技术方案如下:
一种深度学习人脸识别网络优化方法,包括以下步骤:
图像数据由中央处理器CPU内存传递至图形处理器GPU显存,且仅传递unsignedchar类型图像数据;
对接收到的数据在GPU下由unsigned char类型图像数据转换为float类型图像数据;
对GPU下float类型图像数据进行减均值操作;
加载深度学习人脸识别模型文件和减均值操作后的图像数据,传入深度学习框架中,在GPU下进行并行计算;
将计算结果由GPU显存回传至CPU内存中。
进一步地,图像数据由中央处理器CPU内存传递至图形处理器GPU显存的步骤中,将unsigned char类型图像数据对应的图像内存进行锁定,待完全传递至GPU显存下时,再将unsigned char类型图像数据对应的图像内存进行解锁。
进一步地,对接收到的数据在GPU下由unsigned char类型图像数据转换为float类型图像数据的步骤基于通用并行计算架构CUDA进行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智慧眼科技股份有限公司,未经智慧眼科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711455889.2/2.html,转载请声明来源钻瓜专利网。