[发明专利]一种基于CNN的快速图像检索方法有效
申请号: | 201610211503.2 | 申请日: | 2016-04-05 |
公开(公告)号: | CN105912611B | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 凌强;单廷佳;李峰 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06F16/9535;G06K9/62 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 杨学明;顾炜 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于CNN(卷积神经网络)的快速图像检索方法,第一阶段是利用CNN网络对要检索的图像进行特征提取,得到代表图像的矢量特征。第二阶段是在特征数据库中对此矢量特征进行k近邻检索。本发明选择基于GOOGLENET网络的CNN特征,这是深度学习兴起后在计算机视觉领域的一个突破,它具有鲁棒性较好的特点。提取CNN特征后,本发明基于PQ的快速检索思想,并加入文本检索中的倒排策略,在应用中考虑自身的数据量,合理安排系统参数,并在检索结果重排序方面进行改进,加入快速排序策略,缩短了检测时间,提高了检测效率。 | ||
搜索关键词: | 一种 基于 cnn 快速 图像 检索 方法 | ||
【主权项】:
1.一种基于CNN(卷积神经网络)的快速图像检索方法,其特征在于:该方法包括:步骤一、利用CNN网络对要检索的图像进行特征提取,得到代表图像的矢量特征;利用GoogLeNet网络架构,通过Inception结构实现了在不大幅度增加计算量的情况下,让网络走向更深层次,具体步骤如下:a)训练前统一图像尺寸:采用Center‑crop的方法将尺寸统一到256*256,即先将按照最小边缩放到256的比例系数进行整体缩放,然后对长边以中心为基准向两边分别做等长裁剪,保留256长度,这样基本可以保证图片不变形的同时突出图像的主体;b)保证训练模型的鲁棒性:对训练集通过镜像变换进行扩充并在每次训练中从256*256的图像中随机选取224*224大小的图像块进行训练;c)损失函数以及优化:损失函数选用Softmax损失函数,通过Mini‑batch梯度下降法进行参数寻优以最小化损失函数;d)模型应用:在模型应用上,对每张图片的预测,先将其统一成指定尺寸256*256,然后通过选取其左上、右上、左下、右下、正中以及其各自的镜面变换图进行预测,平均其预测结果,作为最终的预测类别;步骤二、在特征数据库中对此矢量特征进行k近邻检索;其中检索过程分为两个部分,首先是将数据库中的特征进行量化并做成倒排索引结构;然后给定一个待查询的向量时,从此结构体中找出其K近邻的向量,具体步骤如下:a)利用样本数据训练利用数据库中的部分数据,进行量化器的训练,先对N维样本数据进行聚类,生成M个聚类中心,对每个特征向量在M个聚类中心定位到与之距离最近的聚类中心,上述操作完成后,此数据库即形成倒排索引结构,再将N维特征向量分成H段,对样本数据中的每一段进行聚类,生成L个聚类中心,共生成H*L个聚类中心,对数据库中的每一个特征向量,将其分成H段,每一段的子特征向量在其对于的L个聚类中心中进行量化,将数据量化成N/H维,这样减小了存储容量,将特征向量依次进行上述操作,再将量化后的数据挂载到倒排索引结构中,完成样本数据的训练和量化工作;b)检索其K近邻的向量对于待检索特征向量q,为了减小计算量,首先在训练过程中生成的M个聚类中心计算出W近邻的向量,实际检索过程中仅计算此W个聚类中心下挂载的向量集合R,对于欧氏距离准则,首先计算出q与其中一个聚类中心在每H维的欧氏距离,再利用查表的方法快速的计算出q与R中向量的近似距离;3.1遍历部分向量并确定距离阈值给定一个待查询向量y,首先在聚类中心集合K中计算y与每个κι的距离d(y,κι),然后按距离远近的准则找出w个最近邻的聚类中心,对于向量y而言,仅需要遍历分配到此w个聚类中心下的向量即可找出其最近邻的特征向量;在计算向量y与数据库R中特征向量x∈R距离时,利用向量y与量化后向量q(x)的欧氏距离d(y,q(x))=||y‑q(x)||来近似y与x的欧式距离d(y,x)=||y‑x||,由三角形不等式原理,得到如下不等式:d(x,y)<d(x,q(x))+d(x,q(x))设定阈值TH=d(x,q(x))+d(x,q(x)),随着遍历向量的增加,TH逐渐迭代到最小值,并以此为依据,当x与w中某些聚类中心的距离远大于TH时,依据数据的簇状分布,认定此聚类中心的向量均与待查询向量y相距较远,因此舍弃这部分,这样进一步的减少了遍历范围,在保证准确率的情况下提高了运算速度;3.2计算近似距离在计算d(y,q(x))时,首先计算待检索向量y与q(x)在每H维的距离之和,可知每H维度上的聚类中心集合
整个聚类中心的集合∑Kh,h∈Η,计算结束后会形成一个Η*Μ的矩阵T,矩阵中元素Tij代表在第j个聚类中心的第i个H段的子向量与相对应维度上的子向量欧式距离之和;对于分配到此聚类中心下量化后的向量,仅需要在矩阵T中进行查表操作并求和即可得到近似距离d(y,q(x)),这样将计算距离的乘方操作转换为查表的加法操作,极大的减少了计算量,提升了计算速度;3.3计算结果重排序对上面所得到的结果利用“分治法”先选择出前k个最小值,再将此k个值进行快速排序,则得到重排序后的结果,由以上的向量序列找出其相对应的图像ID,最终完成了相似图像检索的过程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610211503.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种智能控制式舞台幕布系统
- 下一篇:互动娱乐系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序