[发明专利]基于特征分布迁移的小样本图像特征学习方法及装置有效
申请号: | 202210487387.2 | 申请日: | 2022-05-06 |
公开(公告)号: | CN114782779B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 李晓旭;王湘阳;刘俊;金志宇;任凯;张文斌;曾俊瑀;李睿凡;陶剑;董洪飞 | 申请(专利权)人: | 兰州理工大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06N20/00 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 高福勇 |
地址: | 730050 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 分布 迁移 样本 图像 学习方法 装置 | ||
1.一种基于特征分布迁移的小样本图像特征学习方法,其特征在于,包括以下步骤:
S1、对数据进行预处理,其中数据包括训练集和测试集;
S2,利用基类数据预训练嵌入模块fθ,得到特征空间;
S3,将Dtrain输入到嵌入模块fθ,得到样本特征图,将其输入到分布学习模块gφ中,最小化损失函数,优化分布学习模块gφ;
S4,将新类数据分为支持集和查询集将支持集经过嵌入模块fθ和分布学习模块gφ计算每类的分布原型和
S5,计算基类数据中各类的类别概率,选取最大的前n个类别,将n个类别的分布与当前类别的分布合并,得到矫正后每类的分布原型和步骤S5具体为:
S51,计算基类样本数据中各个类的类别概率,公式如下:
式中,表示为基类样本数据中类别C的均值与方差服从高斯分布,表示为支持集中的第C类的均值,Sd表示为将支持集第C类的分布作为输入,与基类样本数据中的第C类的分布相比较的距离集;
S52,选取最大的前n个类别,将n个类别的分布与当前类别的分布合并,公式如下:
式中,topn(·)表示为一个从输入距离集Sd中选择顶部元素的操作符,SN用以存储关于特征向量最近的n个最近的基类样本数据;
S53,将合并后的类输入公式(6)和(7),得到矫正后的每个类的分布原型和
式(6)中,Sc表示为支持集中的第C类,xi表示为支持集中的第C类中的样本,表示为样本xi的均值,μc表示为第C类的均值即第C个类的分布,式(6)整体表示为求第C类的加权调和平均数,以表示在模型中不同类的分布原型的位置,用以收紧类内关系和满足识别差距;
式(7)的目的是求类别C的方差,用以在足够的类别信息下消除单个数据的类无关表示,减少整体类别信息的幅度变化;
S6,计算新类查询样本的预测概率。
2.根据权利要求1所述的基于特征分布迁移的小样本图像特征学习方法,其特征在于,步骤S1的预处理方法为:
S11,将数据分为和两部分,且这两部分的类别空间互斥,将Dtrain用以在训练过程中调整参数,Dtest作为新类数据测评模型性能;
S12,对于C-way K-shot分类任务,从Dtrain中随机选出C个类别,每个类别中随机选出M个样本,其中K个样本作为支持样本Si,其余M-K个样本作为查询样本Qi,Si和Qi构成一个任务Ti;同样地,对于Dtest有任务
3.根据权利要求1所述的基于特征分布迁移的小样本图像特征学习方法,其特征在于,步骤S2中使用包含四个卷积块的嵌入模块fθ对图像提取特征,其中含有卷积层、池化层和非线性激活函数,每个卷积块使用窗口大小为3*3的卷积核,一个批量归一化,一个RELU非线性层,一个2×2最大池化层,裁剪了最后两个块的最大池化层。
4.根据权利要求1所述的基于特征分布迁移的小样本图像特征学习方法,其特征在于,步骤S3中分布学习模块gφ由两个全连接层组成,用以提取图像特征的分布表示,得到类中每个样本的均值与方差。
5.根据权利要求1所述的基于特征分布迁移的小样本图像特征学习方法,其特征在于,步骤S3中最小化损失函数使用的是梯度下降算法,通过不断地调整权重ω和偏差b,使得损失函数的值变得越来越小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州理工大学,未经兰州理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210487387.2/1.html,转载请声明来源钻瓜专利网。