[发明专利]一种图像识别方法、装置、计算设备及存储介质有效
申请号: | 201810565420.2 | 申请日: | 2018-06-04 |
公开(公告)号: | CN109033940B | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 陈华官 | 申请(专利权)人: | 上海依图网络科技有限公司;上海图智安网络科技有限公司;深圳依图信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 图像识别 存储介质 计算设备 权值矩阵 特征图像 卷积核 图像 图像处理中 模型确定 图像输入 共享 检测 申请 | ||
本申请公开了一种图像识别方法、装置、计算设备及存储介质,用以解决现有技术中在图像处理中图像识别的精度不高的问题。所述方法包括:将待检测的图像输入到预先训练完成的卷积神经网络模型中,通过所述卷积神经网络模型确定所述图像的特征图像,并根据所述特征图像确定所述图像的识别结果;所述卷积神经网络模型,包括权值矩阵共享的卷积核和权值矩阵不共享的卷积核。
技术领域
本申请涉及深度学习领域,尤其涉及一种图像识别方法、装置、计算设备及存储介质。
背景技术
最近几年,随着深度学习的发展,大多数计算机视觉(CV)问题是基于深度学习方法解决的,主要是深度学习方法里面的CNN网络。卷积神经网络(Convolutional NeuralNetworks,CNN)是深度学习算法在图像处理领域的一个重要应用。卷积神经网络是将图像处理中的二维离散卷积运算和人工神经网络相结合,可以自动提取特征,主要应用于二维图像的识别和检测。
CNN网络一般包含卷积层,池化层,全连层。卷积层是卷积神经网络最重要的层,积层主要用于提取图像浅层特征,如:边缘、梯度信息。卷积层的卷积运算占据了整个卷积神经网络95%的运算量,是卷积神经网络实用化的关键。
例如,现有技术中的人脸识别模型,例如,DeepID的解决方案是将一个人脸切成很多部分,每个部分都训练一个模型,然后模型聚合。DeepID的目标是人脸验证(判断两张图片是否是一个人),同时衍生出人脸识别(多次人脸验证)。使用卷积神经网络学习特征,输入一张图片,产出160维的特征图像,然后使用现成的浅层机器学习组合贝叶斯进行分类。DeepID采用增大数据集的方法,一是增加新的数据,celebFaces(87628张图片,5436个人),celebFaces+(202599张图片,10177个人);二是裁剪图片,多区域、多尺度、多通道裁剪,然后将计算的向量组合,使用PCA降维,进而获得较好的识别准确度。FaceNet则是没有考虑局部特征,直接通过数据量大和特殊的目标函数获得可接受的识别精度。
可以看出,上述人脸识别模型的运算量都较大,很难进一步提高人脸图像识别的精度,以及模型轻量化的需求。
发明内容
本申请实施例提供了一种图像识别方法、装置、计算设备及存储介质,用以解决现有技术中在人脸识别中识别精度不高,模型训练效率较低的问题。
本申请实施例提供了一种图像识别方法,该方法包括:
获取待检测的图像;
将所述待检测的图像输入到预先训练完成的卷积神经网络模型中,通过所述卷积神经网络模型确定所述图像的特征图像,并根据所述特征图像确定所述图像的识别结果;
所述卷积神经网络模型,包括第一卷积单元、第二卷积单元和第三卷积单元;所述第一卷积单元为所述卷积神经网络模型中的前N个卷积层,所述第二卷积单元为所述卷积神经网络模型中的最后的M个卷积层;所述第三卷积单元为所述卷积神经网络模型中除所述第一卷积单元和所述第二卷积单元外的P个卷积层;N,M,P为正整数;
所述第一卷积单元中的N个卷积层中的卷积核为权值矩阵共享的卷积核;所述第二卷积单元中的M个卷积层中的卷积核为权值矩阵共享的卷积核;所述第三卷积单元的每个卷积层中的卷积核包括至少一个权值矩阵不共享的卷积核和至少一个权值矩阵共享的卷积核;针对一个卷积层,所述权值矩阵不共享卷积核的个数占卷积核的总个数的比例,与所述卷积层的深度负相关。
本申请实施例中,与位置信息相关的图像信息通过权值矩阵不共享的卷积核对应的卷积层获取,与位置信息无关的图像信息通过权值矩阵共享的卷积核对应的卷积层获得,能够同时兼顾权值矩阵共享的卷积核的卷积层的通用性和权值矩阵不共享的卷积核的卷积层的位置特性,在节约网络参数的情况下,更好的利用图像局部性的信息。另外,相比现有的人脸识别的卷积神经网络模型,显著增加了其模型的深度,提高了人脸识别的精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图网络科技有限公司;上海图智安网络科技有限公司;深圳依图信息技术有限公司,未经上海依图网络科技有限公司;上海图智安网络科技有限公司;深圳依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810565420.2/2.html,转载请声明来源钻瓜专利网。