[发明专利]一种基于结构传播的零样本图像分类方法有效
申请号: | 201810345850.3 | 申请日: | 2018-04-18 |
公开(公告)号: | CN108846406B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 蔺广逢;缪亚林;范引娣;陈万军;张二虎;朱虹 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06K9/62 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 许志蛟 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 结构 传播 样本 图像 分类 方法 | ||
1.一种基于结构传播的零样本图像分类方法,其特征在于,包括以下步骤:
步骤1,分别计算所有类别的语义结构和图像结构;
所述步骤1具体为:
步骤1.1,所有类别的语义结构的计算过程如下:
设可见类别的语义特征表示为{bs|s∈1,...,S},其中s为可见类别的索引,S为可见类别数目;
设未可见类别的语义特征表示为{bu|u∈1,...,U},其中u为未可见类别的索引,U为未可见类别数目;
构建可见类别的语义特征和未可见类别的语义特征两者之间的关系为语义特征结构,表示为Wb,见公式(6),
公式(6)中,参数表示可见类别的语义特征bs和未可见类别的语义特征bu的相似度量值,表示式为公式(7),
其中参数d(bs,bu)=(bs-bu)TσbI(bs-bu),σb为语义度量尺度,取值为0.1;
步骤1.2,所有类别的图像结构的计算过程如下:
设可见类别的图像特征表示为{xs|s∈1,...,S},其中s为可见类别的索引;
设未可见类别的图像特征表示为{xu|u∈1,...,U},其中u为未可见类别的索引;
构建可见类别的图像特征和未可见类别的图像特征两者之间的关系为图像特征结构,表示为Wx,见公式(8),
公式(8)中,表示可见类别的图像特征xs和不可见类别的图像特征xu的相似度量值,表示式为公式(9),
因为未可知图像类,故初值赋值
步骤2,根据步骤1中语义结构和图像结构的计算式,建立适用于零样本图像分类的结构关系模型,并求解优化式;
所述步骤2具体操作为:
步骤2.1,建立适用于零样本图像分类的结构关系模型为公式(1),
公式(1)中,参数N是可见类别的样本数;变量β=[β1 β2]T为图像结构和语义结构的线性系数向量;变量ac∈RD为c类的变换向量,D为维度值;变量vj∈RD为第j未可见类在模型中的表示,1≤j≤U;λ和γ是折中参数,分别在{2-24,2-23,...,2-9}取值,通过分割训练集为5个互斥的集合,在其中4个训练,1个测试,进行交叉验证,取最好结果对应的λ和γ取值;变量当yn=c时而当yn≠c时
步骤2.2,求解步骤2.1中的公式(1),
首先设β=[β1 β2]T=[0.5 0 ]T.,vz=[1 1...1]T∈RD且z={1,2,...,j-1,j+1,...,U},则公式(1)等价为公式(2),
其中为步骤2.1中vj(j=1,2,...,U)在公式(2)中得到的最优值;
通过拉格朗日乘子法,由公式(2)式可得:
其中,公式(3)中将公式(3)显式的求解代入公式(1)等价变换成公式(5):
再次通过拉格朗日乘子法,由公式(4)可得公式(5):
其中通过公式(5)显式的求解β*,β*是β在公式(5)中的最优值;
步骤3,根据步骤2中的优化式,继续更新图像结构;
步骤4,循环迭代步骤2-3,进行正向结构传播,直至得到稳定的未可见类别的标记。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810345850.3/1.html,转载请声明来源钻瓜专利网。