[发明专利]一种安全可靠的图像分类半监督机器学习方法及装置有效
申请号: | 201910565453.1 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110245723B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 李宇峰;郭兰哲;周志华 | 申请(专利权)人: | 南京大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764 |
代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李玉平 |
地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 安全 可靠 图像 分类 监督 机器 学习方法 装置 | ||
本发明公开了一种安全可靠的图像分类半监督机器学习方法及装置,方法包括:获取目标图像数据集;构建少量的验证图像数据集;对目标数据集中的未标记数据进行赋值并根据机器学习算法在目标数据集上训练得到机器学习模型;计算模型在验证数据集上的预测性能和安全性;更新未标记数据的赋值策略使得训练得到的模型在验证数据集上的预测性能和安全性不断调优,直到收敛。最终训练得到的模型确定为目标图像数据集的机器学习模型。本发明适用于图像分类任务中常见的“数据多但标记少”的数据分析情况。
技术领域
本发明涉及一种安全可靠的图像分类半监督机器学习方法及装置,属于图像分类的机器学习技术领域。
背景技术
随着大数据和高性能计算的发展,人工智能技术得到广泛关注,其中机器学习是人工智能的核心技术。其通过计算的手段,对大量数据进行分析来改善系统自身的性能。在计算机系统中,“经验”通常以“数据”的形式存在。通过机器学习算法,可以从经验数据中得到“模型”。在面对新数据时,模型会给出相应的预测结果。
图像分类是数据分析最常见的任务之一。图像提供生动、容易理解的信息,是人们转递和交换信息的重要来源。图像分类是根据图像的语义信息将不同类别的图像区分开来,是数据分析中重要的基本问题,也是图像检测、图像分割、行为分析等重要任务的基础。图像分类在很多领域有广泛的应用,包括安防领域的人脸识别,交通领域的交通场景识别,互联网领域基于内容的图像检索,医学领域的影像图片识别等。
目前,现有的图像分类机器学习技术主要包括有监督机器学习、无监督机器学习以及半监督机器学习三种。其中,有监督机器学习需要以有标记的数据进行模型训练,有标记的数据可以理解为已知输入和输出的数据。无监督机器学习则是用于在未标记的样本数据中找到隐藏的数据关系进行模型的训练,半监督机器学习则是需要根据样本数据中大量的未标记数据并在少量有标记数据的辅助下进行模型的训练。由于在很多情况下,样本数据中有标记数据的获取方式较为困难,使其数量远远少于未标记数据的数量。比如,我们可以获取大量的医学图像,但是让医生标注大量图像的病灶很困难,因此医学图像分类中数据很多,但是标记很少。在此情况下,基于半监督机器学习的特点,通过半监督机器学习进行模型的训练以便后续进行分类和识别成为了领域内的主要方式。
然而,未标记数据并不是在任何情况下都是有帮助的,因为算法往往需要对数据标记的结构进行假设。比如,低密度假设认为真实的分类边界应该通过低密度的区域;流形假设认为相邻的数据具有相似的标记等。如果在实际应用中,数据标记的真实分布和模型的假设不符,未标记数据对模型的训练起到负面的作用,半监督机器学习就会出现不安全不可靠的情况。
发明内容
发明目的:针对现有技术中存在的问题与不足,本发明提出了一种实现安全可靠的图像分类半监督机器学习方法,主要目的在于实现安全可靠的半监督图像分类的功能,从而解决现有的半监督学习在解决图像分类任务中会出现的不安全不可靠的问题。
技术方案:一种安全可靠的图像分类半监督机器学习方法,具体包括:
1)获取目标图像数据集,其中所述目标图像数据集中的部分图像数据具有标记;
2)构建验证图像数据集,其中所述验证图像数据集上的预测性能和安全性作为评价目标图像数据集标记质量的指标;
3)根据机器学习算法给目标图像数据集中未标记图像数据进行标记赋值,在目标图像数据集上进行模型训练并在验证图像数据集上进行预测,得到验证图像数据集上的预测结果。
4)根据验证图像数据集上的预测性能和安全性更新未标记数据赋值策略,并重新训练模型,直到性能达到最优后结束。
5)将最终的模型作用在目标图像数据集上的机器学习模型。
可选的,所述获取验证图像数据集的做法包括但不限于:
1)领域专家给定少量用于验证的有标记图像数据
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910565453.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于生物特征的图像识别方法及装置
- 下一篇:食材更新方法、装置及储藏设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序