[发明专利]一种基于深度学习的小样本图像识别方法有效
申请号: | 201910065984.4 | 申请日: | 2019-01-24 |
公开(公告)号: | CN109800811B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 李玲;刘婉莹;刘丹;杨秀华;黄玉兰;张海蓉;李志军;佟宇琪;戴思达;渠云龙;顾琳;李林;杨泰;梁楫坤 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82 |
代理公司: | 长春吉大专利代理有限责任公司 22201 | 代理人: | 王淑秋 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于深度学习的小样本图像识别方法,该方法包括下述步骤:一、划分训练集;二、生成噪声图像;三、预训练原型空间判别网络;四、训练欺骗图像生成网络;五、训练原型空间判别网络;六、重复步骤四和步骤五进行交叉迭代训练,直到达到预先设定的迭代次数或准确率不再提升;七、图像类别识别。本发明在不改变已经训练好的模型的前提下,借助每类少数几个标注样本,通过泛化这些罕见的类别,识别训练过程中有从未见过的新类,而不需要额外的训练,图像识别准确率高。 | ||
搜索关键词: | 一种 基于 深度 学习 样本 图像 识别 方法 | ||
【主权项】:
1.一种基于深度学习的小样本图像识别方法,其特征在于包括下述步骤:一、划分训练集将训练集中的样本图像随机划分到支持集S和查询集Q,训练集中每个类别样本图像的数目一般不少于600个;其中支持集
表示支持集S中包含了n个类别的样本图像,其中
为支持集S中属于类别k的样本图像的集合,
是支持集S中属于类别k的第m个样本;查询集
同样包含了n个类别的样本图像;其中,
为查询集Q中属于类别k的样本图像的集合,
是查询集Q中属于类别k的第l个样本;二.生成噪声图像随机生成噪声图像集合N,N中噪声图像数量是训练集图像类别数,噪声图像形状与训练集中图像相同;三、预训练原型空间判别网络Dφ1.将支持集S中各类别样本图像子集{S1,S2,...Sk...Sn},输入原型空间判别网络Dφ,得到支持集S各类别样本图像原型{c1,c2,...ck...cn};2.从查询集Q中样本图像随机选取M类样本图像,每类选取N个样本图像,组成每次训练用的查询子集
输入原型空间判别网络Dφ,得到其在原型空间内的映射,其中
代表查询子集QNM中属于类别k的图像集合;3.根据原型空间判别网络Dφ的预训练损失函数公式,采用梯度下降算法,预训练原型空间判别网络Dφ的网络参数并更新原型空间判别网络Dφ;4.将步骤2,3重复不少于50次;对于查询集Q中属于类别k的任意一张图像
原型空间判别网络Dφ的预训练损失函数L(φ)′定义如下:
其中,
的定义如下:
其中
是查询集Q中属于类别k的图像,
为查询集图像
在原型空间内的映射;ck是支持集S中属于类别k的样本图像映射到原型空间内的中心点,即类别k样本图像的原型;ck′是支持集S中不属于类别k的图像映射到原型空间内的中心点,即除了类别k样本图像以外的某一类别样本图像的原型;
代表两个张量
ck之间的欧几里得距离;
代表两个张量
ck′之间的欧几里得距离;
其中,Sk∈S,代表支持集S中属于类别k的样本图像集合,xi代表Sk中第i个样本图像的图像矩阵,yi代表Sk中第i个样本图像的所属类别;Dφ(xi)代表Sk中第i个样本图像在原型空间内的映射;
其中,Sk′∈S,代表支持集S中不属于类别k的样本图像集合,xi’代表Sk′中第i个样本图像的图像矩阵,yi’代表Sk′中第i个样本图像的所属类别;Dφ(xi’)代表Sk′中第i个样本图像在原型空间内的映射;四、训练欺骗图像生成网络将噪声图像集合N中的所有图像输入欺骗图像生成网络Gθ得到欺骗图像集合F,F=Gθ(N),然后将欺骗图像生成网络Gθ输出的欺骗图像集合F进一步输入通过步骤三更新后的原型空间判别网络Dφ,将欺骗图像映射到原型空间;根据欺骗图像生成网络Gθ的损失函数J(θ),采用梯度下降算法,训练欺骗图像生成网络Gθ的网络参数并更新欺骗图像生成网络Gθ;对于每张欺骗图像
来说,生成网络Gθ的损失函数J(θ)定义如下:
其中,
其中
是随机噪声图像xrd输入欺骗图像生成网络Gθ后输出的类别k欺骗图像;
是欺骗图像
在原型空间内的映射;
代表两个张量
ck之间的欧几里得距离;
代表两个张量
ck′之间的欧几里得距离;五.训练原型空间判别网络1.将支持集S中各类图像子集{S1,S2,...Sk...SN}输入原型空间判别网络得到各类图像原型{c1,c2,...ck...cN},2.从查询集Q中样本图像随机选取M类样本图像,每类选取N个样本图像,组成每次训练用的查询子集
输入原型空间判别网络,得到其在原型空间内的映射;3.从步骤四中欺骗图像生成网络输出的欺骗图像集合F随机选取M张欺骗图像,输入原型空间判别网络得到其在原型空间内的映射;4.根据原型空间判别网络Dφ的训练误差函数CD(φ),采用梯度下降算法,训练网络参数并更新原型空间判别网络Dφ,5.重复步骤2,3,4不少于100次;原型空间判别网络Dφ的训练误差函数CD(φ)定义如下:CD(φ)=C′D(φ)+NCG(φ) (7)其中,![]()
![]()
![]()
这里的Gθ是步骤四中更新后的欺骗图像生成网络;六、重复步骤四和步骤五进行欺骗图像生成网络和原型空间判别网络的交替迭代训练,直到达到预先设定的迭代次数,或准确率不再提升,得到训练好的欺骗图像生成网络和原型空间判别网络;七、使用训练好的原型空间判别网络,将已知类别的图像归入支持集,通过原型空间判别网络Dφ映射到原型空间得到各类图像原型;将待识别的图像归入查询集,同样通过原型空间判别网络Dφ映射到原型空间得到待识别图像原型,在原型空间内比较待识别图像原型到各类图像原型之间的欧几里得距离,将与待识别图像原型之间欧几里得距离最近的图像原型所属类别判为待识别图像的类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910065984.4/,转载请声明来源钻瓜专利网。