[发明专利]小样本图像识别的任务重要性感知元学习方法有效

专利信息
申请号: 202111092585.0 申请日: 2021-09-17
公开(公告)号: CN113947133B 公开(公告)日: 2022-11-08
发明(设计)人: 徐阳;范云蕾;李惠 申请(专利权)人: 哈尔滨工业大学
主分类号: G06V30/148 分类号: G06V30/148;G06V10/774;G06V10/764;G06N3/04;G06N3/08
代理公司: 哈尔滨市阳光惠远知识产权代理有限公司 23211 代理人: 孙莉莉
地址: 150001 黑龙*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 样本 图像 识别 任务 重要性 感知 学习方法
【权利要求书】:

1.小样本图像识别的任务重要性感知元学习方法,其特征在于:所述方法包括以下步骤:

步骤一:从图像训练集总样本中随机选取一定量的图像样本作为元批次,在同一元批次中随机采样出互斥的图像样本分别构成支持集和查询集,如此形成一个任务,此过程重复进行多次,在一个元批次中形成多个任务;以上对元批次的处理过程再重复进行多次,最终形成多个不同的元批次、每个元批次包括多个不同的任务,同时,对于每一个元批次,构造一个统一的元批次查询池,对于不同任务都包含相同的样本和标签;

步骤二:对于每一个任务,建立深度网络模型,选取合适的损失函数,使用该任务上支持集的数据及标签进行有监督学习,训练完毕得到适应于该任务的最优模型参数,完成在该任务上的内层更新;

步骤三:对于每一个元批次,计算其中所有任务在支持集上获得的最优模型参数在统一元批次查询池上的验证损失;构造任务重要性感知函数,对于同一元批次所有任务的验证损失,通过任务重要性感知函数计算任务重要性系数,让验证损失越大的任务具有更大的重要性系数;

步骤四:对于每一元批次,将所有任务在查询集上的测试损失,与由步骤三获得的任务重要性系数进行加权求和,进行外层更新,完成一个元批次的训练;每一个外层元批次训练结束后得到的模型参数作为下一个元批次的初始参数,如此循环往复,不断进行内外双层更新直至模型收敛,从而完成小样本图像识别的任务重要性感知元学习;

在步骤二中,计算在该任务支持集上所有图像样本上的平均损失,作为内层循环的损失值,如式(1)所示,然后基于误差反向传播算法进行模型参数更新;训练完毕得到适应于该任务的模型参数,完成在该任务上的内层更新;

式中,lossinternal,k代表内层更新第k个任务的损失函数,k代表第k个任务,Strain代表第k个任务支持集中的图像样本数量,i为支持集图像样本的索引编号,f()表示预测模型,xs,ik表示第k个任务支持集中的第i个输入图像,ys,ik表示第k个任务支持集中的第i个标签,l代表目标函数,表示对应于第n个元批次第k个任务训练得到的最优模型参数,为内层更新过程中的模型参数,θ0,n为第n个元批次的初始模型参数,α为内层更新的学习率,代表对模型参数求梯度运算;

在步骤三中,获得一个元批次内不同任务对于新任务的重要性程度;定义任务重要性系数wk,表示第k个任务的重要性程度,如式(2)所示:

式中,为任务重要性感知函数,Qn表示第n个元批次对应的查询池,x和y分别表示查询池Qn中的图像样本和标签,表示在第k个任务上获得的最优模型参数,k为同一元批次中的任务编号索引,K为同一元批次中所有任务的数量。

2.根据权利要求1所述的方法,其特征在于:所述任务重要性系数的取值范围为0-1,并且对于同一元批次的所有任务,任务重要性系数之和为1,即:

3.根据权利要求1所述的方法,其特征在于:所述任务重要性感知函数为线性函数,对于任务重要性感知函数为线性函数的情况,任务重要性系数的计算公式为:

4.根据权利要求1所述的方法,其特征在于:所述任务重要性感知函数为指数函数,对于任务重要性感知函数为指数函数的情况,任务重要性系数的计算公式为:

其中,softmax表示上式在形式上满足softmax函数的形式。

5.根据权利要求2所述的方法,其特征在于:在步骤四中,基于步骤三获得的任务重要性系数wk,融合不同任务查询集的测试损失,进行外层更新;以某小样本图像数据集作为识别对象,将每一个元批次所有任务在查询集上的测试损失,与任务重要性系数进行加权求和,获得外层循环的损失值,如式(6)所示,并基于误差反向传播算法进行外层更新,完成一个元批次的训练,得到的模型参数作为下一个元批次的初始模型参数;

如此循环往复,不断进行内外双层更新直至模型收敛,即得到了在小样本数据上的最优识别模型;

式中,lossexternal表示外层更新的损失函数,wk表示第k个任务的重要性系数,n表示第n个元学习批次,K表示一个元学习批次中包含的任务数量,k为任务的索引编号,Qtrain表示第k个任务查询集中的样本数量,xq,ik表示第k个任务查询集中的第i个输入图像,yq,ik表示第k个任务查询集中的第i个标签,l代表目标函数,表示在第k个任务上获得的最优模型参数,θ0,n表示第n个元批次的初始模型参数,θ0,n+1表示第n+1个元批次的初始模型参数,β表示外层更新的学习率,代表对模型参数求梯度运算。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111092585.0/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top