[发明专利]一种基于图像分类的图像检索方法无效
申请号: | 201110443434.5 | 申请日: | 2011-12-27 |
公开(公告)号: | CN102402621A | 公开(公告)日: | 2012-04-04 |
发明(设计)人: | 潘志庚;张明敏;张辉;李文庆 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 杜军 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 分类 检索 方法 | ||
技术领域
本发明属于多媒体信息检索领域,具体涉及一种基于图像分类的图像检索方法,该方法涉及图像处理、计算机视觉、机器学习和图像检索等领域,可直接用于Web环境下和单台计算机下的基于内容的图像检索。
背景技术
随着互联网的发展,多媒体信息特别是图像信息正以爆炸性的速度在产生和传播。面对这浩如烟海的图像宝库,如何挖掘那些符合自己需求的图像已经成为了一个十分棘手的问题,所以近年来图像检索领域正成为一个研究和工程实践的热点。目前,图像检索的方法主要有两种:基于文本的图像检索和基于内容的图像检索。
目前主流的图像搜索引擎采取的都是基于文本的图像检索技术,这种技术的实质还是传统意义上的文本检索技术,其过程是将与网络图像相关的文本信息如图像标题、链接文本、内容描述等建立索引来标注图像,最后采用关键字匹配技术来进行检索。然而由于语义的多义性以及描述的模糊性问题,使基于文本的图像检索技术的准确度受到比较大的限制,所返回的结果通常不符合用户的预期。
基于内容的图像检索通过引入计算机视觉领域的技术,对图像像素级对象进行数学建模与求解,这样就用图像本身的内容特征作为了图像的标识。针对图像的内容特征提取方面,图像检索目前有一些转变:从基于整幅图像的特征提取转变为基于区域(或对象)的特征提取,这个转变的过程使得所提取的图像的特征更加的鲁棒,使特征在图像发生旋转和平移前后保持不变,并且在图像光照变化的前后也保持相对的不变性。基于内容的图像分类技术是计算机视觉与模式分类技术融合的结果,是在提取图像内容特征后运用模式分类的方法对图像进行自动学习和分类的技术。近十年,分类技术也得到了长足的进步,产生了基于统计概率理论的支持向量机方法,建立在底层简单分类器上的Adaboost方法,这些方法相较于之前的决策树、神经网络等方法分类准确率都大大的提升了。但是,原来的基于内容的图像检索由于计算量大很难应用到大型图像库系统中,在因特网上的应用就更少了,图像的分类方法也只是找出图像属于某一类别而没有进一步在这一类别中进行检索操作。
发明内容
本发明的目的在于提供一种基于图像分类的图像检索方法,该方法将图像分类技术融入到图像检索中,解决了当前基于内容的图像检索中检索速度慢的局限性。
本发明提供的一种基于图像分类的图像检索方法,其步骤包括:
A: 确定在图像分类中图像的类别数Cm,各详细类别(C1,C2,…,Cm)以及与各类别对应的训练图像集(P1,P2,…,Pm);
B: 提取训练图像集的内容特征用以训练分类器得到分类器C;
C: 输入待检索图像M,提取待检索图像M的内容特征作为分类器C的输入,分类器C的输出结果Co即为M的类别;
D: 获得与类别Co对应的检索图像集IPo,并提取检索图像集IPo内每幅图像的内容特征;
E: 根据C、D获得的内容特征运用相似度计算算法得到待检索图像M与检索图像集IPo内每幅图像的相似度距离,对距离进行排序最后得到与待检索图像M距离最小的N幅图像并输出。
优选的,所述步骤B中提取的图像内容特征为SIFT特征,其具体步骤包括:
B11: 提取训练图像集中每幅图像的SIFT特征点,构成一个特征点库,其中每个SIFT特征点都是由128维特征点描述子向量表示;
B12: 对这个特征点库采用k均值聚类方法进行聚类操作,得到K类;
B13: 对于训练图像库中的单幅图像,将它的所有SIFT特征点根据最小距离原则各自映射到K类得到K维的特征向量V1,将特征向量V1中的每个值除以该幅图像的特征点总数得到频率特征向量V2,V2即为该幅图像的SIFT特征。
优选的,诉述步骤B中采用的分类器为支持向量机,可以采用开源的libsvm库进行开发,训练分类器的具体步骤包括:
B21: 选择RBF为支持向量机的核函数;
B22: 将训练图像库中的特征向量结合每幅图像的类别信息作为支持向量机的输入;
B23: 采用交叉印证方法确定分类准确率最高时候的RBF核函数参数,确定参数后即得到支持向量机分类器C。
优选的,步骤C中提取待检索图像M的内容特征的具体步骤包括:
C1: 提取待检索图像M的SIFT特征点,其中每个SIFT特征点都是由128维特征点描述子向量表示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110443434.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序