[发明专利]梯度参数确定方法、装置及计算机可读存储介质有效
申请号: | 201710373287.6 | 申请日: | 2017-05-24 |
公开(公告)号: | CN107229968B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 万韶华 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 林锦澜 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 梯度 参数 确定 方法 装置 计算机 可读 存储 介质 | ||
本公开是关于一种梯度参数确定方法、装置及计算机可读存储介质,涉及图像处理技术领域,该方法包括:通过待训练的卷积神经网络模型中的指定全连接层,接收该指定全连接层的下一个卷积层传递的第一梯度,该指定全连接层位于该卷积神经网络模型包括的多个卷积层之间的指定位置,通过该指定全连接层确定第二梯度。将该第一梯度与该第二梯度进行求和运算,得到第三梯度,将该第三梯度确定为用于训练该卷积神经网络模型的梯度参数。由于将该第一梯度与第二梯度进行求和运算后,增强了梯度参数,因此,确定后的该梯度参数可以传递的更深,从而增加了算法的收敛速度。
技术领域
本公开涉及图像处理技术领域,尤其涉及一种梯度参数确定方法、装置及计算机可读存储介质。
背景技术
随着图像处理技术的快速发展,卷积神经网络模型在图像识别方面得到了广泛的应用,譬如,如果将一张待识别的图像输入至已完成训练的卷积神经网络模型中,通过该卷积神经网络模型可以识别出该图像的类别。例如,将一张“猫”的图像输入至已完成训练的卷积神经网络模型中,通过该卷积神经网络模型可以识别出该图像的类别为“猫”。
为了能够成功实现图像识别,通常需要预先基于训练图像对卷积神经网络模型进行训练,卷积神经网络模型一般是由多个卷积层、多个激活层、多个池化层以及多个全连接层串联组成。卷积神经网络模型的训练过程包括:在卷积神经网络模型的输入层输入训练图像,通过待训练的卷积神经网络模型对训练图像进行识别后,从输出层输出预测类别概率。之后,基于该预测类别概率与初始类别概率之间的类别概率误差,确定每一层的梯度参数,并基于该每一层的梯度参数对卷积神经网络模型包括每一层的初始模型参数进行调整。在实际实现中,为了增加图像识别的准确性,一般需要对卷积神经网络模型进行深度训练,通常采用的方法是在卷积神经网络模型中增加卷积层的数量。
发明内容
为克服相关技术中存在的问题,本公开提供一种梯度参数确定方法、装置及计算机可读存储介质。
第一方面,提供了一种梯度参数确定方法,所述方法包括:
通过待训练的卷积神经网络模型中的指定全连接层,接收所述指定全连接层的下一个卷积层传递的第一梯度,所述指定全连接层位于所述卷积神经网络模型包括的多个卷积层之间的指定位置,所述指定全连接层的下一个卷积层靠近所述卷积神经网络模型的输出层;
通过所述指定全连接层确定第二梯度,所述第二梯度是基于第一类别概率误差确定得到,所述第一类别概率误差为第一预测类别概率与初始类别概率之间的误差,所述第一预测类别概率是通过所述卷积神经网络模型中位于所述指定全连接层之上的多层对训练图像进行识别处理后得到;
将所述第一梯度与所述第二梯度进行求和运算,得到第三梯度;
将所述第三梯度确定为用于训练所述卷积神经网络模型的梯度参数。
可选地,所述通过所述指定全连接层确定第二梯度,包括:
通过所述卷积神经网络模型中位于所述指定全连接层之上的多层对所述训练图像进行识别处理,得到所述第一预测类别概率;
确定所述第一预测类别概率与所述初始类别概率之间的差值,得到所述第一类别概率误差;
基于所述第一类别概率误差,通过所述指定全连接层采用指定梯度下降法确定所述第二梯度。
可选地,所述通过待训练的卷积神经网络模型中的指定全连接层,接收所述指定全连接层的下一个卷积层传递的第一梯度之前,还包括:
通过所述卷积神经网络模型包括的所有层对所述训练图像进行识别处理,得到第二预测类别概率;
确定所述第二预测类别概率与所述初始类别概率之间的差值,得到第二类别概率误差;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710373287.6/2.html,转载请声明来源钻瓜专利网。