[发明专利]一种利用深度卷积网络生成用于图像检索的哈希码的方法在审
申请号: | 201910003114.4 | 申请日: | 2019-01-03 |
公开(公告)号: | CN109800314A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 马然;郑鸿鹤;安平 | 申请(专利权)人: | 上海大学 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06N3/04;G06N3/08 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 陆聪明 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 哈希码 图像检索 哈希 图像 网络生成 二值化 准确率 卷积 输出 提取图像特征 方法选择 哈希函数 基础模型 基础网络 排序结果 损失函数 相似图像 训练模型 有效地 分类 权重 排序 检索 共享 | ||
本发明的目的在于获得能使图像检索准确率更高的哈希码,提出了一种利用深度卷积网络生成用于图像检索的哈希码的方法。本方法选择当前性能较好的DenseNet模型作为基础模型,提取图像特征,在分类层前添加一个哈希层,哈希层的输出经过二值化后获得图像的哈希码。本发明方法采用两个权重共享的基础网络,在训练模型时,将图像对作为输入,在损失函数中加入了图像的分类损失和图像对的相似损失,训练后获得的相似图像的哈希码更加相似。并且,本发明方法设计了一种新的哈希函数,将哈希层输出的每一位上的值进行排序,根据排序结果对哈希层的输出进行二值化,从而获得哈希码。本发明方法获得的哈希码用于图像检索时能有效地提高检索的平均准确率。
技术领域
本发明涉及一种利用深度卷积网络生成用于图像检索的哈希码的方法。
背景技术
随着各种摄影设备和网络的普及,人们可以随时随地拍摄各种各样的图像和视频,并在网络上与朋友分享,由此带来的是网络上数字图像和视频的爆炸式增长。2013年,Facebook上的总图像数已达2500亿张,并且用户平均每天上传3.5亿张。2016年,微信朋友圈每天上传图像10亿张。面对网络上飞速增长、规模庞大的数字图像,如何在海量的数据中实现快速准确的图像检索,是一项重要的研究。
在语义搜索中,能够构造保持相似性的二进制码(即哈希码),并能进行高效图像搜索的哈希算法受到了高度重视。哈希算法是一种最近邻算法,算法关键在于设计一个能将内容相似的图像映射到相似哈希码中,它首先需要抽取图像的高维特征向量,如颜色、形状、纹理等,再通过哈希函数将特征向量转换为一个固定长度的二进制哈希码(即将高维视觉特征映射到低维的汉明空间中),这个变换过程也称为哈希变换。将每一幅图像都用一串哈希码来表示,并且越相似的图像,它们对应的哈希码的汉明距离越小。因此,在图像检索时,可以通过计算图像哈希码之间的汉明距离即可实现近似最近邻(Approximate NearestNeighbor,ANN)搜索。汉明距离的计算速度快于对图像直接进行相似度计算的速度,这使得检索算法能大幅提高匹配时的计算速度,同时也减小检索系统对存储空间的需求。但是传统的哈希算法是基于人工设计提取图像特征的,算法的性能很大程度上取决于所抽取的特征,这使得检索系统在进行图像检索时容易产生语义鸿沟和意图鸿沟。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910003114.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序