[发明专利]一种基于类别一致性深度学习的图像识别方法有效
申请号: | 202110408724.X | 申请日: | 2021-04-16 |
公开(公告)号: | CN113095335B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 赵汉理;卢望龙;何奇;黄辉 | 申请(专利权)人: | 温州大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/44;G06V10/82;G06N3/0464;G06N3/084;G06N3/048 |
代理公司: | 杭州昱呈专利代理事务所(普通合伙) 33303 | 代理人: | 张蜜 |
地址: | 325000 浙江省温州市瓯海*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 类别 一致性 深度 学习 图像 识别 方法 | ||
1.一种基于类别一致性深度学习的图像识别方法,其特征在于,所述方法包括以下步骤:
步骤S1、给定训练集和测试集;使用自动协同定位方法对训练集进行标注,得到训练集的类别一致二值掩码标签,这种掩码能够分割出每张图片所包含视觉共性特征的区域;
步骤S2、构建基于类别一致性深度学习的图像识别方法,首先用卷积神经网络构建特征提取模块用于图像特征的提取;然后构建分类器模块,将提取的特征进行输入,并进行预测给出识别结果;接着构建类别一致掩码学习模块,利用提取的特征进行类别一致二值掩码的预测;
步骤S3、在某一次迭代训练过程中,将所述训练集中的图像作为输入,特征提取模块进行特征提取,并由分类器模块输出识别结果;同时类别一致掩码学习模块利用提取的特征进行类别一致二值掩码的预测,得到预测的类别一致二值掩码;
步骤S4、根据交叉熵损失函数Lcls计算识别结果和训练集中的类别标签之间的误差;利用类别一致损失函数Lmask计算预测的类别一致二值掩码和训练集的类别一致二值掩码标签之间的误差;根据损失值进行反向传播,利用随机梯度下降法,对特征提取模块、分类器模块和类别一致掩码学习模块的参数进行更新;
步骤S5、利用测试集对所述方法的模型进行评估;若模型测试准确率为当前最高,则保存模型参数;判断训练是否结束,若结束则跳转至步骤S6,否则跳转至步骤S3;
步骤S6、得到最优模型参数,并将最优模型参数分别更新特征提取模块、分类器模块和类别一致掩码学习模块参数;将特征提取模块、分类器模块作为最终的识别模型;
其中,在所述步骤S4中,类别一致损失Lmask公式为:
其中,N是训练样本总数,是类别一致二值掩码标签,预测的类别一致二值掩码,通过端对端的训练,类别一致掩码学习模块促使骨干网络能够针对同一类别下的共同视觉特征进行学习。
2.根据权利要求1所述的基于类别一致性深度学习的图像识别方法,其特征在于,在所述步骤S4中,通过将特征提取模块、分类器模块和类别一致掩码学习模块进行端到端的训练学习,从而将交叉熵损失和类别一致损失进行结合,得到最终目标函数的公式为:
L=Lcls+αLmask,
其中,权重参数α用于调整分类损失Lcls和类别一致损失Lmask之间的重要性;在训练过程中,整个网络的参数是通过最小化目标函数L来不断优化迭代而得到;在推理过程中,只需要用到特征提取模块和分类器模块就可以实现图像识别;而类别一致掩码学习模块使聚焦于各个类别图像的类别一致性的区域,从而减少不相关背景的影响;并且不会在推断时引入额外的计算成本。
3.根据权利要求1所述的基于类别一致性深度学习的图像识别方法,其特征在于,在所述步骤S1中,训练集和测试集皆为图像集合,并且每张图像都包含对应的类别标签。
4.根据权利要求1所述的基于类别一致性深度学习的图像识别方法,其特征在于,在所述步骤S2中,特征提取模块、分类器模块和类别一致掩码学习模块都由卷积神经网络构造。
5.根据权利要求1所述的一种基于类别一致性深度学习的图像识别方法,其特征在于,在所述步骤S6中,类别一致掩码学习模块仅在训练阶段协助特征提取模块进行关键特征的学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110408724.X/1.html,转载请声明来源钻瓜专利网。