[发明专利]一种大规模数据背景下的快速有效的图像检索方法有效
申请号: | 201610340978.1 | 申请日: | 2016-05-20 |
公开(公告)号: | CN106055576B | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | 李培华;王旗龙;曾辉;孙伟健;鲁潇潇 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/08 |
代理公司: | 大连理工大学专利中心21200 | 代理人: | 温福雪,李宝元 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 大规模 数据 背景 快速 有效 图像 检索 方法 | ||
技术领域
本发明涉及到计算机视觉、统计学习、模式识别技术领域,提出了一种针对大规模数据背景下可以适用于真实复杂场景的快速有效的图像检索方法。
背景技术
早期的图像检索技术主要是基于关键字的搜索,用户通过输入对查询图像的描述,在检索数据库中找到相应的检索结果。随着互联网和大数据时代的到来,基于关键字的图像检索技术已不能适用于海量内容、实时扩展的检索数据库。因此,基于内容的图像检索技术在当前大型的搜索引擎中有着日益广泛的应用。基于内容的图像检索是指用户提供查询图像,检索算法计算图像特征表达,在检索库中搜索相似的图像内容并返回结果的检索技术。
基于内容的图像检索技术的难点在于如何设计算法提取图像特征表达与如何度量图像表达之间的相似性。由于图像采集过程中的光照、拍摄角度与尺度等方面的变化,图像变化显著且不可控。尤其是在大数据背景下真实图像数据分布往往十分复杂,这对图像检索任务带来极大的困难与挑,直接导致了当前存在的一些检索方法的检索准确率低,效率不佳。此外,大规模检索问题对算法的效率的要求很高。因此,设计一种具有鲁棒性和辨别能力的图像表达与快速有效的距离度量算法用于大规模图像检索是本发明的目标所在。
近年来,随着对深度学习技术的研究愈发成熟,深层卷积神经网络(CNN,Convolutional Neural Networks)在计算机视觉中的应用也越来越广泛。当前图像检索领域中领先的方法基本都采用了深度学习技术。例如Babenko等人在文献[Babenko A,Slesarev A,Chigorin A,et al.Neural codes for image retrieval[C],ECCV 2014:584-599]中提出针对特定的图像检索任务(如场景或地标建筑检索),构建相似的图像数据集,在该数据集上训练CNN模型。该研究表明了针对特定任务对CNN模型进行迁移学习的重要性。2015年,他们在文献[Babenko A,Lempitsky V.Aggregating Deep Convolutional Features for Image Retrieval[C],ICCV 2015]中提出使用经过预训练的CNN模型中全连接层的输出作为图像的局部特征,使用平均聚合(Average Pooling)方法得到图像的表达向量。该方法虽然效率很高,但是忽略了图像局部特征对应图像块的空间位置分布,在复杂背景的图像检索问题上不够鲁棒。此外,简单的平均聚合只使用了特征的一阶信息,并没有考虑具有更丰富信息的高阶表达,如二阶的协方差描述子建模。
基于上述的图像检索的挑战与困难以及现有工作的不足之处,本发明从提取图像表达与度量图像相似性两方面入手,提出了一种大规模数据背景下的快速有效的图像检索方法。
发明内容
本发明提出了一种针对大规模数据背景下可以适用于真实复杂场景的快速有效的图像检索方法。
本发明的技术方案:
一种大规模数据背景下的快速有效的图像检索方法,步骤如下:
步骤一,基于迁移学习和深层卷积神经网络的图像局部特征提取
首先使用检索数据库的训练集图像对经过预训练的深层卷积神经网络做迁移学习,即微调卷积神经网络各层参数;然后将待处理的图像作为迁移学习得到的深层卷积神经网络的输入,提取最后一层卷积层的输出作为图像局部特征;
步骤二,基于空间均值池化和鲁棒协方差估计的图像局部特征建模
该步骤由两个相互独立的建模方式组成,分别为使用一阶的空间均值池化和二阶的鲁棒估计的协方差对步骤一提取的图像局部特征进行建模,得到的特征建模向量用于表示图像局部特征的信息;
步骤三,对获得的特征建模向量进行基于大间隔子空间的判别学习
利用给定训练数据中已知的标签信息,分别对步骤二中提出的两种特征建模向量使用大间隔最近子空间学习算法,得到相应的具有判别能力的低秩线性映射矩阵;再利用得到的映射矩阵对两种特征建模向量分别进行有监督的降维;
步骤四,融合降维后的两种特征建模向量得到最终的图像表达向量
将降维后的两种特征建模向量通过加权系数进行加权级联,得到最终的图像表达向量,其中融合系数控制两种建模向量在图像表达中起到作用的大小。
步骤五,图像匹配并返回检索结果
首先根据前面四个步骤计算查询图像的表达向量,然后计算该表达向量与图像数据库中的所有待检索图像的表达向量的欧氏距离,对所有距离排序找到距离最小的n个图像并返回检索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610340978.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低功率太阳能稳压电源
- 下一篇:一种多路数控高压直流电源系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置