[发明专利]一种图像检索排序的方法及装置有效
申请号: | 201310690505.0 | 申请日: | 2013-12-13 |
公开(公告)号: | CN103699612B | 公开(公告)日: | 2017-10-13 |
发明(设计)人: | 陈世峰;曹琛 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 深圳中一专利商标事务所44237 | 代理人: | 张全文 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 检索 排序 方法 装置 | ||
技术领域
本发明涉及图像处理领域,特别涉及一种图像检索排序的方法及装置。
背景技术
网络图像检索通常采用基于文字关键词的搜索方法。当前,搜索引擎通过匹配搜索关键词和图像的文字标签,以确定检索图像的排序。然而,由于网络图像存在许多错误的文字标签,检索结果的精确度难以令人满意。鉴于网络图像检索在用户需求方面的不确定性。穷举所有关键词并预先存储排序结果是不可能完成的任务。同时,许多应用依赖于收集大量分门别类的图像,用户手工标定辅助排序的方法也会变得耗费人力。因此,理想的图像检索排序技术应当不依赖于任何预先存储和人工标定,并能达到精确而高效的排序结果。
当前,较为常用的方式为:用户辅助选择法。这种方法要求搜索引擎的用户针对初始结果选择自己认为最正确的一幅图像,其它图像则会根据与用户选择图像的视觉特征相似度进行重新排序。此方法能较为准确地表现用户的检索意图。然而,当面对海量不同类别关键词检索或需要自动检索的场景时,该方法则变得无能为力。
此外,一系列对检索排序的深入研究聚焦在训练机器学习模型。聚类模型依据初始检索图像集的特征相似度,将图像聚成几类,取图像数量最多、特征密度最大的类作为检索的目标图像。这种方法假设与检索关键词有关和无关的图像都能各自成类,难以符合真实的数据分布。主题模型运用概率网络学习图像中潜在的主题并计算主题出现的频率。当图像中的主题大部分是高频出现的主题时,这样的图像被当成与检索关键词最相关的图像排在前列。并且需要针对每个检索关键词做离线训练和验证,从而不适合即时的图像检索。分类模型通过结合图像的视觉特征和文本元数据,离线对标定数据训练分类器。此方法要求标定准确,离线训练过程耗时,性能还受到过拟合问题的影响。
发明人在发明本申请的过程中,至少发现现有技术中存在如下技术问题:
1、现有方法假设在图像集的特征空间中,目标图像紧密地分布在一起,而噪声图像则各自离散分布。然而各种方法设计的选择高密度数据的算法却有时会选择到离散的数据点,从而导致检索到的图像不精确。2、上一点提到现有方法对图像分布的假设本身,难以符合真实数据分布的特性,由此选择的高密度数据仍是目标和噪声的混合。3、即使能获得少量较精确的标定数据,对整个图像集的半监督学习仍会因为噪声图像破坏数据集的流型结构并导致传导不准确的结果,并未考虑如何消除这部分噪声。
发明内容
为了解决现有技术存在的检索图像不精确的问题,本发明实施例提供了一种图像检索排序的方法及装置。所述技术方案如下:
第一方面,本发明提供了一种图像检索排序的方法,所述方法包括:
根据用户输入的关键词从网络图像数据库中搜索得到关键词对应的图像集,以特征聚类的方式分别对所述图像集进行去噪处理得到对应的类图像集;
将所述类图像集与所述网络图像数据库中已建立的其他类图像集分别两两之间进行类间优化处理,通过类间优化处理对所述类图像集中的图像进行第二次去噪处理得到优化图像集;
根据置信分数对优化图像集进行加权计算并获取高密度图像集,按照线性排序模型对所述高密度图像集进行排序,得到所述图像排序结果。
优选地,所述根据用户输入的关键词从网络图像数据库中搜索得到关键词对应的图像集,以特征聚类的方式分别对所述图像集进行去噪处理得到对应的类图像集,包括:
根据用户输入的关键词检索得到图像集其中d代表图像视觉特征的维度;
将所述图像集按照映射g(·)从原始的欧式特征空间投射到新的特征空间,使得特征空间中位于同一流形结构内的数据和离散分布的噪声图像数据分别聚合成m类{X1,…,Xc,…,Xm}∈X;
根据预设判断条件筛选出m类中离散点组成的类,并将所述离散点组成的类滤去得到类图像集。
优选地,所述映射g(·)的构造方法,具体包括:
以图像集中的数据为节点构造两两连接的无向有权图,其中,节点xi和xj的边的权重Wij为:(1)当i≠j时,其中,σ2为权重Wij的方差;(2)当i=j时,Wii=0;
将所述权重Wij组成n×n矩阵W,对矩阵W的归一化处理得到S=D-1/2WD-1/2,其中D为对角矩阵
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310690505.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序