[发明专利]一种图像检索方法及终端在审
申请号: | 201611169213.2 | 申请日: | 2016-12-16 |
公开(公告)号: | CN106649688A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 吴伟华;康春生;蔡复兴 | 申请(专利权)人: | 深圳市华尊科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州三环专利代理有限公司44202 | 代理人: | 郝传鑫,熊永强 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 检索 方法 终端 | ||
技术领域
本发明涉及视频监控技术领域,具体涉及一种图像检索方法及终端。
背景技术
目前来看,以图搜图是通过搜索图像文本或者视觉特征,为用户提供互联网上相关图形图像资料检索服务的专业搜索引擎系统,是搜索引擎的一种细分。涉及了数据库管理、计算机视觉、图像处理、模式识别、信息检索和认知心理学等诸多学科。商用的图像搜索引擎有谷歌图像搜索和百度图像搜索。这些搜索系统都是基于关键字和图像标签的。基于关键字的图像视频检索有着其本质的缺点。图像中内容丰富,仅用几个关键字或数句话很难表达清楚,而且不同的人对图像有不同的理解,导致同一幅图像可能会有相差很大的说明。并且,现在图像的数量呈爆炸式的增加,很多图像只有很少的文字信息或者根本就没有说明文字,想要高效地索引这些图像就需要人们手工的添加标签和说明文字,对于大量的图像来说,这是非常繁重的工作。因此,通过样本的搜索,到查询图像类似的图像搜索,已经逐渐成为现代图像搜索引擎中不可缺少的功能。一个有效的图像相似性度量是在寻找类似的图像的核心。
现有技术中,对于以图搜图算法,常用的方法种类比较多,比如基于颜色、纹理和形状等。深度训练是一种目的在于建立、模拟人脑进行分析训练的深度网络,它模仿人脑的机制来解释数据。通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。它显著的优点是可抽象出高级特征,构建出复杂高性能的模型。基于深度特征训练的以图搜图方法主要包括两个步骤:一是特征提取,提取可靠稳定的特征表达图像内容;二是特征相似度度量,将不同图像特征进行比较和相似度排序,但是,由于得到的相似性特征较为复杂,因而,图像的检索效率较低。
发明内容
本发明实施例提供了一种图像检索方法及终端,以期降低相似性特征的复杂度,从而,提高图像检索效率。
本发明实施例第一方面提供了一种图像检索方法,包括:
获取三元组样本,其中,所述三元组样本包括:待查询图像,正样本图像和负样本图像;
采用预设卷积网络对所述三元组样本进行训练,得到图像特征三元组,其中,所述预设卷积网络至少包含四个卷积层和一个平均池化层;
将所述图像特征三元组映射为目标哈希编码;
采用预设三元组排序损失模型对所述目标哈希编码进行训练,得到目标相似性特征。
可选地,所述将所述图像特征三元组映射为目标哈希编码,包括:
将所述图像特征三元组中处于所述预设卷积网络的指定层特征分割成等长的Q个片段,所述Q为大于1的整数;
通过所述预设卷积网络的全连接层分别将所述Q个片段映射成一维向量,得到所述Q个一维向量;
通过sigmoid激活函数将所述Q个一维向量的值限制在0到1之间,得到所述Q个目标一维向量;
按照如下公式将所述Q个目标一维向量的值转换成二进制的哈希编码,得到所述Q个哈希编码:
其中:ε为预设阈值,s为一维向量的任一位,H为哈希编码;
将所述Q个哈希编码进行连接,得到所述目标哈希编码。
可选地,所述采用预设三元组排序损失模型对所述目标哈希编码进行训练,得到目标相似性特征,包括:
按照如下公式对所述目标哈希编码进行训练,得到目标相似性特征:
其中,Iq表示所述待查询图像,q表示卷积最大激活区域,I+表示所述正样本图像,I-表示所述负样本图像,m为常数,l(Iq,I+,I-)为目标相似性特征。
可选地,所述预设卷积网络的每一卷积层插入了1×1的滤波卷积层,且所述每一卷积层包含矫正激活函数。
可选地,所述采用预设三元组排序损失模型对所述目标哈希编码进行训练,得到目标相似性特征之后,所述方法还包括:
根据所述目标相似性特征,确定所述待查询图像与预设图像库中的N张图像中的每一图像之间的汉明距离,得到所述N个汉明距离值,所述N为正整数;将所述N个汉明距离值中的最小值对应的图像作为目标图像。
本发明实施例第二方面提供了一种终端,包括:
获取单元,用于获取三元组样本,其中,所述三元组样本包括:待查询图像,正样本图像和负样本图像;
第一训练单元,用于采用预设卷积网络对所述三元组样本进行训练,得到图像特征三元组,其中,所述预设卷积网络至少包含四个卷积层和一个平均池化层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市华尊科技股份有限公司,未经深圳市华尊科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611169213.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:大数据联机分析处理方法及装置
- 下一篇:全业务的用户统计方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序