[发明专利]一种安全可靠的图像分类半监督机器学习方法及装置有效
申请号: | 201910565453.1 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110245723B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 李宇峰;郭兰哲;周志华 | 申请(专利权)人: | 南京大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764 |
代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李玉平 |
地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 安全 可靠 图像 分类 监督 机器 学习方法 装置 | ||
1.一种安全可靠的图像分类半监督机器学习方法,其特征在于,具体包括:
1)获取目标图像数据集,所述目标图像数据集中的部分图像数据具有标记;
2)构建验证图像数据集,所述验证图像数据集上的预测性能和安全性作为评价目标图像数据集标记质量的指标;
3)对目标数据集的未标记图像进行标记赋值;
4)根据机器学习算法以及机器学习算法对应的未标记数据赋值策略,在目标图像数据集上进行模型训练并在验证图像数据集上进行预测,得到验证图像数据集上的预测结果;
5)根据验证图像数据集上的预测性能和安全性更新未标记数据赋值策略,并重新训练模型,直到性能达到最优后结束;
对未标记图像进行赋值后根据相应的机器学习算法训练得到模型,如下所示:
其中,θ表示训练得到的模型,Θ为θ的取值空间,β表示为Θ内的任意取值,n表示训练数据的个数,k表示图像所属类别的总个数,i为训练样本的索引,j为枚举类别的取值,Qij表示训练样本i具有标记j的概率,l表示刻画性能的损失函数,l(xi,j,β)表示当训练集中的第i张图像标记取值为j,模型参数为β时的损失函数取值;
验证数据为其中xj表示为验证数据中的第j张图像,yj表示图像xj的类别标记,nv表示验证数据中图像的总个数,则模型在验证数据上的损失函数值如下所示:
表示,模型的预测值和真实的标记之间的误差值;
其中,所述模型在验证数据集上的安全性,如下所示:
其中,θ0表示底线模型,即不利用未标记数据的监督学习模型,M表示验证集的总数,表示第i个验证集;式(3)表示半监督学习模型θ和底线模型θ0在预测性能上的差距;差距越大表示半监督学习得到的模型越安全;
根据验证集上的性能调整目标数据集中未标记图像的标记赋值策略是一个双层优化问题,如下所示:
其中内层优化为根据训练数据和标记赋值策略来训练得到模型θ,相应参数含义与(1)式相同,外层优化为通过调整标记赋值矩阵Q,最小化模型在验证数据上的损失并最大化模型的安全性,将验证数据上的损失表示为L(θ),训练数据上的损失表示为E(θ,Q);
当内层优化为一个凸优化问题时,将其转换为对应的KKT条件,从而将双层优化问题转换为单层优化问题,其中,KKT条件为内层优化取得最优解时的条件,如下所示:
求解此式得到θ关于Q的函数θ(Q),将θ(Q)带入外层优化即可求得最终的目标函数关于Q的梯度进而根据梯度优化的算法来更新未标记数据的赋值策略Q从而提升模型的预测性能和安全性可靠性;优化算法流程:先设定优化的轮数T和标记赋值策略的初始值Q0,在第k轮优化过程中,首先计算验证集上的损失函数L(θ)对Q的导数然后采用梯度优化的算法对Q进行更新,η为梯度优化算法的步长;
当内层优化为一个非凸优化问题时,采用梯度优化的方法来对内层优化问题进行求解,将其表示为一个T步的动态过程,具体如下所示:
其中θt表示第t步时的模型,θt-1表示第t-1步时的模型,η表示梯度优化算法的步长,E(θ,Q)表示模型为θ标记赋值策略为Q时训练数据上的损失,表示E(θ,Q)对θ的导数;
将该动态过程表示为θt=Φ(θt-1,Q),其中所以目标式写为:
minQL(θT)(7)
采用拉格朗日乘子法,求得目标函数对于Q的梯度,从而采用梯度优化方法进行求解;
其中,通过拉格朗日乘子法得到拉格朗日对偶式:
其中λt为拉格朗日乘子,式(8)对变量Q的导数为:
其中,从而采用梯度相关的优化方法来对Q进行求解;优化算法流程:首先初始化标记赋值策略Q0,确定内层优化的轮数T和外层优化的轮数outT;在外层优化的第k轮时,首先从t=1,…,T,计算θt=Φ(θt-1,Q),然后计算验证集损失对θ的导数:接着初始化验证集损失对标记赋值策略Q的导数gQ=0,然后从t=T,…,1计算gQ=gQ+αt+1Bt+1,αt=αt+1At+1,计算出gQ后,采用梯度算法更新Qk=Qk-1-ηgQ,η为梯度优化算法的步长;
6)将最终的模型作用在目标图像数据集上的机器学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910565453.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于生物特征的图像识别方法及装置
- 下一篇:食材更新方法、装置及储藏设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序