[发明专利]一种基于类别一致性深度学习的图像识别方法有效
申请号: | 202110408724.X | 申请日: | 2021-04-16 |
公开(公告)号: | CN113095335B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 赵汉理;卢望龙;何奇;黄辉 | 申请(专利权)人: | 温州大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/44;G06V10/82;G06N3/0464;G06N3/084;G06N3/048 |
代理公司: | 杭州昱呈专利代理事务所(普通合伙) 33303 | 代理人: | 张蜜 |
地址: | 325000 浙江省温州市瓯海*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 类别 一致性 深度 学习 图像 识别 方法 | ||
本发明提出一种基于类别一致性深度学习的图像识别方法。首先使用自动协同定位方法对训练集进行标注,得到类别一致二值掩码标签。用特征提取模块、分类器模块和类别一致掩码学习模块构造本发明的识别方法。每次迭代训练时,特征提取模块对输入图像进行特征提取;分类器模块根据提取的特征,进行计算并给出识别结果;类别一致掩码学习模块根据提取的特征,预测类别一致二值掩码。结合交叉熵损失和类别一致损失函数计算出损失值并进行反向传播,对识别方法的网络参数进行调整。重复上述步骤,直至训练结束,选择最优网络参数作为识别模型参数;实施本发明,能够以一种自监督学习的方式促进网络对关键特征的学习,实现高鲁棒性高准确率的图像识别。
技术领域
本发明涉及图像识别技术领域,尤其涉及一种基于类别一致性深度学习的图像识别方法。
背景技术
在图像识别方法中,基于手工特征的图像识别算法依赖较多的人工干预,且容易受到光照、旋转、扭曲等因素的干扰。而卷积神经网络能够将特征提取和识别步骤相结合,通过端对端的学习,能够让卷积神经网络自动提取抽象特征,实现精确、高效的识别。另一方面,由于网络在训练的过程中,是直接对整张图像进行识别和训练,图像中的无关背景使得网络无法聚焦于每个类别下的视觉共性区域。如果能够在训练的过程中,同时要求网络对当前图像类别下包含视觉共性特征的区域进行定位分割,那么可以进一步加深网络对每个图像对象关键特征的理解,从而达到强化特征学习的目的。因此,本发明结合自监督学习的思想和自动协同定位方法,提出一种基于类别一致性深度学习的图像识别方法。通过强迫网络关注包含同一类别下的视觉共性特征区域,来强化对关键特征的学习,从而进一步提升识别性能,实现高鲁棒性、高准确率的图像智能识别。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于类别一致性深度学习的图像识别方法,通过强迫卷积神经网络关注包含同一类别下的视觉共性特征区域,来强化对关键特征的学习,从而进一步提升识别性能,并防止网络对无关背景特征的学习,实现高鲁棒性、高准确率的图像识别。
为了解决上述技术问题,本发明实施例提供了一种基于类别一致性深度学习的图像识别方法,所述方法包括以下步骤:
步骤S1、给定训练集Itrain={(ai∈R3×K×K,bi∈R1×C)|i∈[1,N]}以及测试集Itest={(ai∈R3×K×K,bi∈R1×C)|i∈[1,H]};使用自动协同定位方法对训练集Itrain进行标注,得到训练集的类别一致二值掩码标签Masktrain={mi∈R1×K×K|i∈[1,N]},这种掩码能够分割出每张图片所包含视觉共性特征的区域。其中,R表示实数域,ai表示第i张输入图像,3表示颜色通道数量,对应的颜色通道d∈{红,绿,蓝},K表示单张图片的宽或高的尺寸;bi表示第i张输入图像中对应的类别标签,根据所给定类别,生成对应的独热编码(one-hot)向量,C为类别数量;mi为对应的类别一致二值掩码标签。N表示训练集Itrain的样本数量;H表示测试集Itest的样本数量;
步骤S2、构建基于类别一致性深度学习的图像识别方法,首先用卷积神经网络构建特征提取模块用于图像特征的提取;然后构建分类器模块,将提取的特征进行输入,并进行预测给出识别结果;接着构建类别一致掩码学习模块,利用提取的特征进行类别一致二值掩码的预测。这三个模块的所有参数的总和称为θ,第q次迭代训练的参数设为θq。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110408724.X/2.html,转载请声明来源钻瓜专利网。