[发明专利]基于先验知识的图像检索方法无效
申请号: | 201310033058.1 | 申请日: | 2013-01-28 |
公开(公告)号: | CN103064985A | 公开(公告)日: | 2013-04-24 |
发明(设计)人: | 陈宇峰;李凤霞;闫高洁;杨志中;俞文昌 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于先验知识的图像检索方法,属于基于内容的图像检索领域。本发明的图像检索方法使用加入维度权值的欧式距离的度量方法,把图像中的背景部分剔除,只保留用户关注的前景内容;并降低背景部分的维度权值,提高前景维度权值,减少了背景的影响,增加了图像中的前景对最后检索结果的影响。其检索过程为:首先提取目标图像的局部特征,然后选取当前比较的图像类别下相应的维度权值,利用加权欧式距离函数进行相似性度量,最后根据相似度的大小返回相应的图片。本发明提出的基于先验知识的图像检索方法与已有基于内容的图像检索方法相比较,检索更准确、效率更高。 | ||
搜索关键词: | 基于 先验 知识 图像 检索 方法 | ||
【主权项】:
一种基于先验知识的图像检索方法,其特征在于:其操作步骤如下:包括训练过程和测试过程;所述训练过程包括步骤一至步骤三,具体为:步骤一、建立视觉词汇表;依次对训练数据集中的每类图像进行分析处理,为每类图像建立一个视觉词汇表;使用一个类别的图像建立该类别图像的视觉词汇表的具体步骤为:步骤1.1:获取训练数据集中该类别图像中各张图像的特征向量,用符号(f1,f2,...,fn)表示,其中,f1、f2、……、fn分别表示图像的一个特征,n表示特征向量中特征的个数;所述特征是多维的,其维度用N表示,N≥2;步骤1.2:对于步骤1.1得到的该类别图像的特征向量(f1,f2,...,fn)中的特征f1,f2,...,fn进行聚类,得到m个特征类别,m为正整数;步骤1.3:对于步骤1.2得到的m个特征类别,获取每个特征类别的单词;所述每个特征类别的单词为该特征类别中全部特征向量聚类的中心点;步骤1.4:得到该类别图像的视觉词汇表;所述该类别图像的视觉词汇表由该类别类图像的各特征类别的单词组成;步骤二、在步骤一操作的基础上,统计每类图像的单词分布直方图;针对一类图像,统计该类别图像的单词分布直方图的具体操作步骤为:步骤2.1:为该类别图像的视觉词汇表中的每个单词设定一个统计量,分别用符号T1、T2、……、Tm表示,并设置T1、T2、……、Tm的初始值均为0;步骤2.2:依次使用该类别中的每一张图像的特征向量(f1,f2,...,fn)中的每一个特征与该类别图像的视觉词汇表中的单词逐一比较,找出距离最短的单词,并将该单词对应的统计量自增1;步骤2.3:对统计量T1、T2、……、Tm进行归一化处理;具体为:分别用统计量T1、T2、……、Tm除以该类别图像的特征数总和,得到的结果分别用T′1、T′2、……、Tm′;步骤2.4:得到该类别图像的单词分布直方图;所述单词分布直方图由该类别图像的视觉词汇表中的每个单词对应的归一化后的统计量T′1、T′2、……、Tm′组成;步骤三、在步骤二操作的基础上,计算每个类别图像特征对应的特征权值;对于一个类别的图像,该类别图像特征对应的特征权值的计算方法为:步骤3.1:找出该类别图像的单词分布直方图中T′1、T′2、……、Tm′中的最大值,用符号Tmax′表示;步骤3.2:在该类图像的特征向量(f1,f2,...,fn)中找到M个与步骤3.1得到的Tmax′距离最接近的特征,生成M×N的矩阵,矩阵用符号AM×N,M值由人为指定,10≤M≤200并且M≤n;步骤3.3:计算矩阵AM×N中每列数据的方差的倒数,分别用符号σ1、σ2、……、σN;步骤3.4:对步骤3.3中所述矩阵AM×N中每列数据的方差的倒数σ1、σ2、……、σN进行归一化处理,得到该类别图像特征对应的特征权值,分别用ωi表示,1≤i≤N;其中, ω i = σ i / Σ j = 1 N σ j ; 经过上述步骤的操作,对于每一类图像得到该类别图像特征对应的特征权值ωi;所述测试过程包括步骤四,具体为:步骤四、在步骤三操作的基础上,对测试图像进行检索;步骤4.1:获取测试图像的特征向量;步骤4.2:将测试图像的每个特征依次与训练数据集中的每张图像的每个特征进行距离度量;其中,测试图像的某一特征F表示与训练数据集中某一张图像I的某个特征G的距离d可通过公式(1)计算; d = Σ i = 1 N ω i ( f i - g i ) - - - ( 1 ) 其中,fi为测试图像的特征F的第i维数据;gi为训练数据集中图像I的特征G的第i维数据;ωi为训练数据集中的图像I的特征G对应的特征权值;步骤4.3:用符号Pk表示训练数据集中的每张图像对应的匹配点对数,其初始值设定为0;其中,1≤k≤K,K表示训练数据集中图像的数量;针对训练数据集中的每张图像,依次将测试图像的某一特征分别与该张训练图像的每一个特征之间的距离作为一组数据,并从该组数据中挑选出最小值和次小值,分别用符号dmin和d′min表示;如果dmin/d′min<θ,0.5<θ<0.9,则将匹配点对数Pk自增1;步骤4.3:针对训练数据集中的每张图像,按照其对应的匹配点对数Pk从大到小的顺序对训练图像排序并输出;匹配点对数Pk越大,该匹配点对数Pk对应的训练图像与测试图像越相似;经过上述步骤的操作,即可实现对测试图像的检索。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310033058.1/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序