[发明专利]一种基于鲁棒非负矩阵分解的图像检索方法有效
申请号: | 201410105511.X | 申请日: | 2014-03-20 |
公开(公告)号: | CN103886066B | 公开(公告)日: | 2017-03-29 |
发明(设计)人: | 陈晋音;黄坚 | 申请(专利权)人: | 杭州禧颂科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/66 |
代理公司: | 杭州求是专利事务所有限公司33200 | 代理人: | 张法高 |
地址: | 311100 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 鲁棒非负 矩阵 分解 图像 检索 方法 | ||
技术领域
本发明涉及基于内容的图像检索和非负矩阵分解方法,尤其涉及一种基于鲁棒非负矩阵分解的图像检索方法。
背景技术
近年来,随着互联网络和智能手机、数码相机的普及,大量的图像资源被源源不断地产生出来。为了对这些图像资源进行有效的组织管理和检索,各种图像检索技术也随之被提出。目前,图像检索已经成为计算机视觉,尤其是多媒体检索领域里的一个研究热点。
除了最早的基于关键字的图像检索技术,目前绝大部分的图像检索技术都是基于内容的图像检索技术。基于内容的图像检索技术是通过从图像提取表征各种图像视觉特征的视觉特征,然后基于特定的算法计算用户提交的待检索图像与图像数据库中各个图片之间的相似性,即距离,从而依据特征距离的大小,对图像进行排序,返回给用户距离值较小的图像,实现对图像数据库中图像的检索。
在基于内容的图像检索算法中,数据降维算法是一种广泛被使用的技术。该技术的核心思想是认为原始图像特征空间存在一定的不足,无法有效地将不同类型的图像区分开来,因此希望寻找到一个合适的特征子空间,在该子空间上不同类型的图像彼此分开,而同类型的图像彼此聚拢。这类方法包括:主成分分析(Principal Component Analysis,PCA),线性鉴别分析(Linear Discriminant Analysis,LDA),非负矩阵分解(Nonnegative Matrix Factorization,NMF)和各种流形学习算法,如多维标度分析(Multidimensional Scaling,MDS),局部线性嵌套(Local Linear Embedded,LLE),局部保持投影(Local Preserving Projection,LPP)等。
在这些子空间方法中,NMF对降维后的数据添加了非负性约束,其目标函数是求解两个非负矩阵U和V,使得X≈UV。由于非负性约束的引入,使得NMF能够学习得到具有局部特征的基矩阵U,也获得了一种与人们认知中局部构成整体所一致的基于局部的数据表达方法。因此该方法的可解释性比较强,被广泛应用到图像检索,人脸识别,数字识别,文本分类等应用。
Liang等将NMF的初始化过程扩展为有监督的初始化,然后使用NMF在隐含语义索引中,用来寻找从底层视觉特征到高层语义特征之间的关系。BeAbdallah等人则采用NMF构建图像的隐含表达,用来提高图像的标注准确性。Caicedo等人基于NMF生成多模态图像表达,并在构建NMF目标函数的时候考虑图像语义信息。
然而,在传统的NMF对图像数据间的关系表达和抗噪声能方法比较弱。针对这个两方面问题,本方法借助L1图在视觉特征的自动选择特性,构建视觉L1图约束,同时引入稀疏噪声项约束,然后将这两种约束条件加入到传统的NMF算法框架中,得到鲁棒非负矩阵分解算法模型。基于所提出的模型,对新图像的处理计算时间为线性时间,能够快速准确地进行图像检索。
发明内容
本发明的目的是克服现有基于非负矩阵分解在图像间关系表达和抗噪声两方面上的不足,提出一种基于鲁棒非负矩阵分解的图像检索方法。
基于鲁棒非负矩阵分解的图像检索方法包括如下步骤:
1)从公共图像数据集Corel5K中选择50类共5000张图像,提取PHOG视觉特征[1]集X=[x1,...,xn],其中n=5000,xi为第i张图像所对应的PHOG视觉特征向量;将PHOG视觉特征集X作为所要构建的L1图的顶点,L1图的边权重矩阵W=[w1,...,wn],,其中wi计算如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州禧颂科技有限公司,未经杭州禧颂科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410105511.X/2.html,转载请声明来源钻瓜专利网。