[发明专利]一种基于层次学习的长尾分布图像识别方法有效
申请号: | 202010465621.2 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111738303B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 陈琼;林恩禄;刘庆发 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06N3/0464;G06N3/08;G06V10/774;G06V10/82 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 层次 学习 长尾 分布 图像 识别 方法 | ||
本发明公开了一种基于层次学习的长尾分布图像识别方法,包括步骤:1)使用预训练模型提取长尾分布图像数据中每个对象的视觉特征;2)依据视觉特征构建类与类之间的层次超类树关系;3)依据层次超类树关系搭建层次超类树神经网络模型;4)使用基于层次学习的方式训练层次超类树神经网络模型;5)用训练好的层次超类树神经网络模型对长尾分布图像数据进行识别。本发明首次将长尾图像识别问题转变成由易到难的层次超类学习问题,可有效缓解长尾分布中类别分布不平衡以及少数类识别准确率低的问题。此外,本发明在其它不同不平衡程度的数据环境中也有优秀的分类识别性能,因而本发明具有实际应用价值,值得推广。
技术领域
本发明涉及机器学习中的深度学习、小样本学习、不平衡分类的技术领域,尤其是指一种基于层次学习的长尾分布图像识别方法。
背景技术
现实生活中的数据经常出现极度不平衡的现象,少数类别含有大量的样本,大多数类别仅有极少量样本,数据各类别的样本分布遵循长尾分布。长尾分布图像识别问题实际上是不平衡分类问题和小样本学习问题的综合体,其中头部样本数目较为充足的类别的识别可以视为不平衡分类问题,尾部样本数目较少的类别的识别可以视为小样本学习问题。
在解决长尾分布图像识别问题时,许多标准高效的卷积神经网络模型无法准确建模,模型在头部类上表现良好,在尾部类上几乎无法识别目标,整体的识别精确度较差。
目前有关长尾分布图像识别的研究大多使用不平衡学习相关的技术,这类技术主要分为数据层面和算法层面。数据层面的技术主要包括下采样多数类样本、上采样少数类样本或结合前面两者的混合采样方法。面对长尾分布数据集时,下采样将会丢弃绝大部分样本,从而损失数据集中许多有价值的信息,上采样则会导致过拟合问题,同时会带来极大的算力消耗。算法层面的技术主要通过代价敏感方法来重新调整各个类别的权重,这类方法在一定层度上缓解了长尾分布图像识别率低的问题,但并没有综合考虑到大量尾部类别仅有极少数样本的情况,这会导致尾部类别的识别准确率还是不够高。此外,可行的解决方法有由头部类别丰富数据中学习的知识往尾部类别进行迁移、设计适合长尾分布图像识别的损失函数以及构建更加合理的长尾分布图像识别模型。然而,目前长尾分布图像识别的研究仍处于初步阶段,当下所有的长尾分布图像识别方法并没有很好地提高尾部类别的识别准确率,如何建模长尾分布的图像数据集仍是一大挑战。
发明内容
本发明的目的在于克服现有技术的不足与缺点,提出了一种行之有效、科学合理的基于层次学习的长尾分布图像识别方法,将不平衡图像识别(分类)问题转变成具有多层超类的层次分类问题,通过构建层次超类树减小头部类对模型的主导作用,使得模型在不同不平衡程度的数据中都能更加准确地分类,进而能够更加有效地解决图像长尾分布识别准确率低的问题。
为实现上述目的,本发明所提供的技术方案为:一种基于层次学习的长尾分布图像识别方法,包括以下步骤:
1)使用预训练模型提取长尾分布图像数据中每个对象的视觉特征;
2)依据视觉特征构建类与类之间的层次超类树关系;
3)依据层次超类树关系搭建层次超类树神经网络模型;
4)使用基于层次学习的方式训练层次超类树神经网络模型;
5)用训练好的层次超类树神经网络模型对长尾分布图像数据进行识别。
在步骤1)中,所述预训练模型是指能够提取出长尾分布图像数据中每一类对象有差别的视觉特征的模型,所述视觉特征是指长尾分布图像数据中对象的向量表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010465621.2/2.html,转载请声明来源钻瓜专利网。