[发明专利]图像分类模型的训练方法、图像分类方法及装置在审
| 申请号: | 202210536970.8 | 申请日: | 2022-05-17 |
| 公开(公告)号: | CN114998649A | 公开(公告)日: | 2022-09-02 |
| 发明(设计)人: | 张开活;邢冯;蓝翔 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/08;G06N3/04 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 单冠飞 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 分类 模型 训练 方法 装置 | ||
本公开提出了图像分类模型的训练方法、图像分类方法及装置,涉及人工智能技术领域,具体涉及深度学习、计算机视觉等技术领域,具体实现方案为:采用样本图像,对图像分类模型执行多轮训练过程,其中,任意一轮的训练过程包括:根据设定的稀疏权重矩阵进行图像分类模型的前向计算,进而,根据得到的预测类别与类别标注标签之间的差异,确定本轮的损失函数;对本轮的损失函数进行反向梯度计算,并根据得到的本轮的稠密权重矩阵进行裁剪,得到用于下一轮训练过程的稀疏权重矩阵,由此,使整个训练过程中保持权重矩阵是稀疏的,加快了训练过程中的计算速度,可有效地降低训练过程中的计算时间。
技术领域
本公开涉及人工智能技术领域,具体涉及深度学习、计算机视觉等技术领域,尤其涉及图像分类模型的训练方法、图像分类方法及装置。
背景技术
随着计算机技术的发展,出现了对图像的分类技术,图像分类是计算机视觉领域的一个基础任务。通过图像分类技术能够快速识别图像中各对象所属的类别。
为了实现图像中各对象的自动分类,在已有的样本图像上构建图像分类模型时,需要对图像分类模型进行训练,从而基于训练好的图像分类模型对待分类图像进行分类。
为了提升模型的预测效果,如何对图像分类模型进行训练是非常重要的。
发明内容
本公开提供了一种用于图像分类模型的训练方法、图像分类方法及装置。
根据本公开的一方面,提供了一种图像分类模型的训练方法,包括:获取样本图像;采用所述样本图像,对图像分类模型执行多轮训练过程,其中,任意一轮的训练过程包括:根据设定的稀疏权重矩阵进行所述图像分类模型的前向计算,以得到所述样本图像在本轮的预测类别;根据所述预测类别与样本图像上的类别标注标签之间的差异,以确定本轮的损失函数;对所述本轮的损失函数进行反向梯度计算,以得到本轮的稠密权重矩阵;对所述本轮的稠密权重矩阵进行裁剪,以得到用于下一轮训练过程的稀疏权重矩阵;在所述任意的一轮的损失函数的取值小于阈值的情况下,停止所述训练过程。
根据本公开的另一方面,提供了一种图像分类方法,包括:获取待分类图像;采用第一方面实施例所述的图像分类模型的训练方法得到的图像分类模型,对所述待分类图像中的对象进行类别预测,以得到所述待分类图像的预测类别。
根据本公开的另一方面,提供了一种图像分类模型的训练装置,包括:获取模块,用于获取样本图像;训练模块,用于采用所述样本图像,对图像分类模型执行多轮训练过程,其中,任意一轮的训练过程包括:根据设定的稀疏权重矩阵进行所述图像分类模型的前向计算,以得到所述样本图像在本轮的预测类别;根据所述预测类别与样本图像上的类别标注标签之间的差异,以确定本轮的损失函数;对所述本轮的损失函数进行反向梯度计算,以得到本轮的稠密权重矩阵;对所述本轮的稠密权重矩阵进行裁剪,以得到用于下一轮训练过程的稀疏权重矩阵;停止模块,用于在所述任意的一轮的损失函数的取值小于阈值的情况下,停止所述训练过程。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开第一方面实施例所述的方法,或者,执行本公开第二方面实施例所述的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开第一方面实施例所述的方法,或者,执行本公开第二方面实施例所述的方法。
根据本公开的另一方面,提供了一种计算机程序产品,所述计算机程序在被处理器执行时实现本公开第一方面实施例所述的方法,或者,执行本公开第二方面实施例所述的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210536970.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





