[发明专利]样本标签置信度计算方法、装置、设备及模型训练方法有效
申请号: | 201811079398.7 | 申请日: | 2018-09-17 |
公开(公告)号: | CN109345515B | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 姜泓羊;杨康;高孟娣;代黎明 | 申请(专利权)人: | 代黎明 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 标签 置信 计算方法 装置 设备 模型 训练 方法 | ||
本发明公开了一种样本标签置信度计算方法、装置、设备及模型训练方法。其中样本标签置信度计算方法,用于对图像深度学习模型训练的样本标签置信度进行计算,包括以下步骤:根据当前样本的学习结果计算样本初始标签的初始标签置信度;判断初始标签置信度是否满足预设置信度条件,当初始标签置信度满足预设置信度条件时,保持当前样本的最终标签为初始标签不变;当初始标签置信度不满足预设置信度条件时,从所有预设类标签中选择置信度最大的标签作为当前样本的最终标签。该方法能够应用到深度学习模型中,使得深度学习模型在学习的过程中能够保留对训练样本的历史学习记忆。能够对错标样本进行纠错,从而使得模型能够得到更好的训练。
技术领域
本发明涉及,尤其涉及一种样本标签置信度计算方法、装置、设备及模型训练方法。
背景技术
深度学习网络模型在医学领域已经取得了突出的成果,在图像分类、图像分割以及目标检测等领域均已打败传统图像处理技术。在图像分类方面,深度学习的研究者们针对性地提出了多种经典模型,如VggNet、GoogleNet以及ResNet等。目前,研究者们已经将这些经典模型应用于医学图像分类中。与传统的自然图像不同,医学图像强依赖于医学的领域知识,在实现某一特定医学影像的疾病分类时,研究者们需要专业的医生对医学图像进行标注,并且标注的精确度越高,深度学习模型的性能会越好。然而,由于医生的专业水平不同,对于医学影像的理解和判断也会有出入,收集的医学影像数据很难保证较高的纯度。此外,医生在标注过程中也会由于各种因素,如疲倦、疏忽,而导致误标的情况。对于学习资料不纯的情况,目前并没有针对性的处理方法,大多是通过发现一例错误样本纠错一例的方法进行样本集的沉淀。此外,算法模型的一些防止过拟合的方法也一定程度上抵御了数据纯度低的风险,如参数正则化、dropout处理等。还有一种特殊的网络结构teacher-student network,这类网络首先通过teacher网络学习样本集,然后student网络基于teacher网络学到的参数进行学习。Teacher网络能够在学习阶段降低错误样本的权重,student网络在学习时受到错误样本的影响会相对小些。
但是,从根本上讲,深度学习模型是以数据驱动的算法,数据的纯度能够影响模型在真实应用场景的最终性能。虽然无监督模型和半监督模型的发展能够一定程度上控制数据纯度低所带来的风险,但其应用场景远比有监督模型要少。目前,有监督深度学习模型通过拓展模型宽度和深度,能够高效地学习训练样本的特征,当然也包括训练样本中的一些噪音特征。随着深度学习模型的学习能力不断加强,医学影像学习资料中的错误会以过拟合的形式被模型学习到,这会让模型的能力大打折扣。深度学习模型是人工智能领域最先进的代表算法,但相比真正的智能仍存在很多不足,其中之一表现在对训练数据的学习方面。目前的深度学习模型不会对输入的训练数据有自己的判断,而是一味地按照所给的标签,机械式地通过梯度下降等优化算法进行学习。即使模型对某一正确标签样本学习了100次,当将该样本的标签人为地标错,并输入模型进行学习时,模型不会记得前100次的正确学习,而是以百分之百的置信度去学习错误标签样本。在训练样本中存在较多错标数据时,这样的学习方式显然是不合适的,尤其是在医学影像的学习方面。
发明内容
基于此,有必要针对上述样本标签不准确的问题,提供一种能够对样本标签进行修正的样本标签置信度计算方法。
本发明提供的一种样本标签置信度计算方法,用于对图像深度学习模型训练的样本标签置信度进行计算,包括一下步骤:
根据当前样本的学习结果计算样本初始标签的初始标签置信度;
判断所述初始标签置信度是否满足预设置信度条件,并得到判断结果;
根据所述判断结果,当所述初始标签置信度满足预设置信度条件时,保持所述当前样本的最终标签为所述初始标签不变;
根据所述判断结果,当所述初始标签置信度不满足预设置信度条件时,从所有预设类标签中选择置信度最大的标签作为所述当前样本的最终标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于代黎明,未经代黎明许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811079398.7/2.html,转载请声明来源钻瓜专利网。