[发明专利]面向图像大数据的类增量分类方法、系统、装置及介质有效
申请号: | 202110223442.2 | 申请日: | 2021-03-01 |
公开(公告)号: | CN112990280B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 罗荣华;黄圳铭 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/047;G06N3/048;G06N3/096 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黎扬鹏 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 图像 数据 增量 分类 方法 系统 装置 介质 | ||
本发明公开了一种面向图像大数据的类增量分类方法、系统、装置及介质,其中方法包括初始化训练阶段和增量学习阶段;所述初始化训练阶段包括:构建图像的初始数据集;根据所述初始数据集训练初始分类模型;所述增量学习阶段包括:根据所述初始数据集和图像的新数据构建增量学习数据集;根据所述初始分类模型获取增量学习新模型,根据增量学习数据集和蒸馏算法训练所述增量学习新模型,得到能够识别新旧类别的模型;其中,所述蒸馏算法使模型的类间距离扩大及类内距离缩小。本发明通过蒸馏算法更新增量学习模型,使模型的类间距离扩大及类内距离缩小,能够在有限的存储空间和计算资源下,提升模型对新旧数据识别性能,可广泛应用于大数据应用领域。
技术领域
本发明涉及大数据应用领域,尤其涉及一种面向图像大数据的类增量分类方法、系统、装置及介质。
背景技术
随着互联网的云计算、物联网、社交网络等新兴信息技术和应用模式的快速发展,促使人类社会的数据种类和规模正以前所未有的速度增长,推动人类社会迈入信息爆炸的大数据时代。而与之相随的是计算机运算能力的不断提升,推动了机器学习的研究与发展,尤其是深度学习领域更是掀起一股研究热潮,被广泛应用在金融、智能制造、医疗健康等各个领域。“大数据+机器学习”技术成为了当今社会耳熟能详的人工智能技术,而在2016年,Google的AlphaGo横空出世,让我们见识到“大数据+机器学习”的巨大威力和其广阔的前景。
虽然目前“大数据+机器学习”技术在各行各业获得广泛应用并取得显著成果,但是目前大多数机器算法是基于静态、封闭的理想环境下进行训练,它们将历史数据作为一个整体进行批量学习,这种批量学习灵活性较差,只能面向静态的批量大数据,而训练得到的模型也只能识别在训练集中出现过的类别,对于未出现在训练集中的类别模型则无法给出分类结果。然而在实际的应用中,各行各业产生的大数据,如传感器数据、图像、视频数据、互联网数据以及传统行业的业务数据等,更多地是一种动态的流数据形态。数据的内容与特征处于不断变化,具有海量性、时变性、无限性等特点。这就需要模型不断在新到来的数据上学习新的类别。
而基于批量学习需要一次性获得训练数据,对于不断产生的新数据,需要将新旧数据混合对模型重新进行训练,该方式存在空间存储和计算资源消耗以及时间成本问题,随着新数据的不断到来,所需要保存的数据量不断扩大,庞大的训练集会导致模型的训练速度下降,计算成本剧增甚至数据无法一次性载入内存,从而无法进行完整的批量学习。如果让模型直接在新数据上训练,模型则会存在对旧数据灾难性遗忘问题。因此,如何在有限的存储空间和计算机资源下,让已训练好的模型在纷至沓来的新数据上较强的学习能力,同时保持对旧数据识别的准确率是一个亟待解决的难题。
发明内容
为至少一定程度上解决现有技术中存在的技术问题之一,本发明的目的在于提供一种面向图像大数据的类增量分类方法、系统、装置及介质。
本发明所采用的技术方案是:
一种面向图像大数据的类增量分类方法,包括初始化训练阶段和增量学习阶段;
所述初始化训练阶段包括:
构建图像的初始数据集;
根据所述初始数据集训练初始分类模型;
所述增量学习阶段包括:
根据所述初始数据集和图像的新数据构建增量学习数据集;
根据所述初始分类模型获取增量学习新模型,根据增量学习数据集和蒸馏算法训练所述增量学习新模型,得到能够识别新旧类别的模型;
其中,所述蒸馏算法使模型的类间距离扩大及类内距离缩小。
进一步,所述训练初始分类模型的过程中,采用HM-Softmax作为分类损失函数;
所述分类损失函数的公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110223442.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电涡流缓速器
- 下一篇:一种电力设施隔离围栏
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置