[发明专利]一种视觉与语义相似性约束的图像检索方法在审
申请号: | 201310342904.8 | 申请日: | 2013-08-07 |
公开(公告)号: | CN103425768A | 公开(公告)日: | 2013-12-04 |
发明(设计)人: | 毛金莲 | 申请(专利权)人: | 浙江商业职业技术学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 张法高 |
地址: | 310053 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种保持视觉与语义相似性的图像检索方法。该方法首先采用L1图和KNN图两种不同的构图算法,分别对图像视觉和语义相似性进行建模;接着将得到的两种图约束加入到非负矩阵分解算法框架中构建保持视觉与语义相似的非负矩阵分解算法模型;然后利用图像数据集X对该模型进行训练,得到保持视觉和语义相似性的图像基矩阵U和所有图像在U所展开的子空间中的特征表达V;最后在图像检索时,将作为检索参考的图像x转换到该子空间中,得到新特征表达v;依据v与图像数据集中图像的距离,对图像进行排序,返回距离最小的前K个图像给用户,实现图像的检索。本方法在训练得到U后,对新图像特征表达的计算时间为线性时间,能够比较快速准确地实现图像检索功能。 | ||
搜索关键词: | 一种 视觉 语义 相似性 约束 图像 检索 方法 | ||
【主权项】:
1.一种保持视觉与语义相似性的图像检索方法,其特征在于包括如下步骤:1)采用L1图和KNN图的两种不同构图算法,分别对图像视觉相似性和语义相似性进行建模:对视觉相似性建模:以图像集原始视觉特征X=[x1,...,xn]作为L1图的顶点,L1图的边权重矩阵W=[w1,...,wn],其中wi计算如下:min | | w i | | 1 s . t . | | x i - X w i | | ≤ ϵ , w ii = 0 , ∀ i - - - 1 ]]> 其中,xi为第i幅图像的原始视觉特征,wi为矩阵W的第i列,ε为误差系数,wii为向量wi的第i个分量;构建视觉相似性L1图约束如下:min R g = Σ i = 1 n | | v i - V w i | | 2 = | | V - VW | | F 2 - - - 2 ]]>= tr ( V ( I - W ) ( I - W ) T V T ) = tr ( VL g V T ) ]]> 其中,Lg=(I-W)(I-W)T,V=[v1,...,vn]为图像集在子空间上的特征表达,I为单位矩阵;对语义相似性建模:以图像集原始视觉特征X=[x1,...,xn]作为KNN图的顶点,KNN图的边权重矩阵S中设置如下:
构建语义相似性KNN图约束如下:min R s = 1 2 Σ i , j = 1 n ( v i - v j ) 2 S ij = tr ( V L s V T ) - - - 4 ]]> 其中,Ls=D-S,
Sij为矩阵S中第i行第j列上的元素,Dii为矩阵D上第i行第i列上的元素;2)将得到的L1图约束和KNN图约束加入到传统的非负矩阵分解算法框架中,构建保持视觉与语义相似性的非负矩阵矩阵分解算法模型:min U , V ≥ 0 | | X - UV | | F 2 + γ · { α · R g + ( 1 - α ) · R s } ]]>= min U , V ≥ 0 | | X - UV | | F 2 + γ · { V ( α · L g + ( 1 - α ) · L s ) V T } ]]> 5其中,α和γ为正则化参数,U为保持视觉和语义相似性的图像基矩阵,V为图像基矩阵U所展开的子空间中的特征表达;3)利用图像数据集对公式5算法模型进行训练,计算得到保持视觉和语义相似性的图像基矩阵U和所有图像在图像基矩阵U所展开的子空间中的特征表达V,计算方法如下:i)随机初始化U和V矩阵,令中间变量L=α·Lg+(1-α)·Ls;ii)迭代计算U ij ← U ij ( XV T ) ij ( UVV T ) ij ]]> 和V ij ← V ij ( U T X + γV L - ) ij ( U T UV + γ L + ) ij ]]> 直到收敛,其中L + = 1 2 ( L + | L | ) , ]]>
|L|为矩阵L中所有元素取对应绝对值所构成的矩阵;4)在进行图像检索时,将作为检索参考的图像x转换到图像基矩阵U所展开的子空间中,得到新的特征表达v,计算如下:v=(UTU)-1UTx=Mx, 6其中,M=(UTU)-1UT,UT为矩阵U转置,(UTU)-1为UTU的逆矩阵;5)依据步骤4)得到的v,计算v与图像数据集中任一图像xi的特征表达vi之间的距离si,计算公式如下:si=exp(-||v-vi||2) 7最后根据距离si对图像数据集中所有图像进行排序,返回距离值最小的前K个图像给用户,从而实现图像检索。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江商业职业技术学院,未经浙江商业职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310342904.8/,转载请声明来源钻瓜专利网。
- 上一篇:压力机平衡缸
- 下一篇:一种机场LED探照灯及其透镜