[发明专利]图像分类方法、装置、电子设备及存储介质在审
申请号: | 202110372852.3 | 申请日: | 2021-04-07 |
公开(公告)号: | CN113033689A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 申啸尘;周有喜 | 申请(专利权)人: | 新疆爱华盈通信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市嘉勤知识产权代理有限公司 44651 | 代理人: | 王敏生 |
地址: | 830000 新疆维吾尔自治区乌鲁木齐市经济技术开*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 方法 装置 电子设备 存储 介质 | ||
本申请公开一种图像分类方法、装置、电子设备及存储介质,方法包括:获取图像;将图像输入预先训练的分类模型;接收分类模型对图像的分类结果,并输出分类结果;预先训练分类模型的步骤包括:建立原始分类模型,并获取样本数据集;将样本数据集内的样本数据分批次输入原始分类模型进行训练;接收交叉熵损失函数对每批次样本数据计算的确定标签及否定标签的损失值;对每批次样本数据的确定标签及否定标签的损失值进行平衡,并计算平衡损失值;利用所有的平衡损失值作为总损失值对原始分类模型进行优化,直至确定标签的损失值占比不再降低,得到分类模型;原始分类模型学习时,会向标签为确定存在方向学习,提升对图像进行多类别分类时的分类效果。
技术领域
本申请涉及人工智能技术领域,具体涉及一种图像分类方法、装置、电子设备及存储介质。
背景技术
图像分类是根据不同类别的目标在图像信息中所反映的不同特征,将不同类别的目标区分开来的图像处理方法。图像分类方法基于神经网络的分类模型,通常以不同计算量要求首先要选用不同的backbone(主干网络),如resnet(残差网络),densenet(密集网络),mobilenet(移动端神经网络)等。最后建立分类数据集,选取合适的损失函数对网络进行训练。例如有100种不同类别的图片,则进行100类别的分类。目前,分类模型的损失函数通常使用交叉熵损失函数。
但是交叉熵损失函数进行的是单标签分类,在选取交叉熵损失函数进行模型训练时,每张图片只具有一个标签。但若一张图片即同时包含多种事物,如一张图片包含狗、猫这两种动物,在进行图像分类时,通常会出现图像内的多种事物中,其中一种事物的概率很高,其他种事物概率很低的情况,因此对图片分类时,无法将可能存在的多种事物都包含在分类的类别内。
为解决上述问题,现有的方法是对一张图片中的每一个类别都进行标签,假设分类模型能够进行100类图像的分类,则需要使用100个二分类交叉熵损失函数来优化模型的输出,对于每一类的事物,在同一张图像中都会有一个表示存在的确定标签或表示不存在的否定标签,因此该一张图像会有100个标签,每个二分类交叉熵损失函数则分别对一个标签计算损失值,最后相加得到总损失值,其中,确定标签的损失值较大,否定标签的损失值较小。在总损失值较大时,分类模型会向确定标签的方向进行学习,从而提升分类模型的分类能力。
但是在实际中,一张图片一般只包含几个种类的事物,因此一张图片的大部分标签都为否定标签,以一张图片包含2个种类的事物为例,那么标签为确定标签的比例只占有2%,标签为否定标签的比例占有98%,这就导致标签不平衡的问题,使得最后计算出的总损失值较小。
若总损失值过小,分类模型进行学习时,就不会向标签为确定标签的方向进行学习,从而降低了对图像进行多个类别分类时的效果。
发明内容
基于此,为了解决或改善现有技术的问题,本申请提供一种图像分类方法、装置、电子设备及存储介质,可以提高对图像进行多个类别分类时的分类效果。
本申请第一方面提供一种图像分类方法,包括:获取图像;将所述图像输入预先训练的分类模型;接收所述分类模型对所述图像的分类结果,并输出所述分类结果;所述预先训练分类模型的步骤包括:建立原始分类模型,并获取样本数据集,所述原始分类模型具有损失函数,所述样本数据集内的样本数据具有预设数量的类别标签,每个所述类别标签为对应类别的确定标签或否定标签;将所述样本数据集内的样本数据分批次输入所述原始分类模型进行训练;接收所述交叉熵损失函数对每批次样本数据计算的所述确定标签及所述否定标签的损失值;对每批次样本数据的确定标签及否定标签的损失值进行平衡,直至所有批次中,所述确定标签及所述否定标签的损失值占比相同,并计算每批次样本数据的平衡损失值;利用所有的所述平衡损失值作为总损失值对所述原始分类模型进行优化,直至所述确定标签的损失值占比不再降低,得到分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆爱华盈通信息技术有限公司,未经新疆爱华盈通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110372852.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动化炸药装药滚压工装
- 下一篇:物联网设备的处理方法、装置及系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序