[发明专利]基于深度学习和哈希编码的图像检索方法有效
申请号: | 201710525604.1 | 申请日: | 2017-06-30 |
公开(公告)号: | CN107330074B | 公开(公告)日: | 2020-05-26 |
发明(设计)人: | 陈熙霖;刘昊淼;王瑞平 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06K9/62 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;李科 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 编码 图像 检索 方法 | ||
本发明涉及一种基于深度学习和哈希编码的模型训练方法,包括将部分标注的图像数据作为网络模型的训练数据,通过深度网络将所述训练数据表示为类二值哈希编码,其中,所述类二值哈希编码是指取值是连续值的一种模拟二值哈希编码;将获得的类二值哈希编码作为输入,连接到深度网络的一个或多个任务层,同时使用一个或多个任务进行训练;基于类二值哈希编码获得带有所述可供检索的特征信息的用于表示所述训练数据的二值哈希编码。
技术领域
本发明涉及计算机视觉技术领域,特别涉及一种基于深度学习和哈希编码的图像检索方法。
背景技术
随着科学技术的发展,当今世界已进入大数据时代,尤其是图像数据资源增长迅速,因此对大规模图像数据进行检索以满足用户需求给图像检索技术领域带来了新的挑战。相比于传统的基于文本的图像检索技术(Text-Based Image Retrieval,TBIR),基于内容的图像检索(Content-Based Image Retrieval,CBIR)越来越受到人们广泛的关注。
在CBIR技术中,如何有效地描述图像的特征以及采用何种方式进行快速的相似性检索是近几年的研究热点。由于深度神经网络在特征学习上的优越性以及哈希编码在检索中的计算速度和存储空间上的优越性,出现了利用深度卷积神经网络,或哈希技术,或二者相结合的图像检索方法。
例如,一种基于深度网络提取特征的图像检索方法,利用训练好的深度卷积网络对图像提取特征,通过计算查询图像的特征和数据库中图像特征的欧氏距离并排序来进行图像检索。参考论文“Artem Babenko,Anton Slesarev,Alexandr Chigorin,and VictorLempitsky.Neural Codes for Image Retrieval.ECCV 2014”。该方法的缺陷在于,一方面,使用该方法提取的特征为维度较高的实数向量,因此存储开销和计算量较大,无法满足当前网络数据库规模增长迅速的需求;另一方面,该方法提取特征的深度网络不是针对数据库数据进行训练的,检索效果严重依赖于数据库数据和训练网络使用的数据之间的相似程度,若相似程度较低,则会相应导致检索效果较差。
现有技术中,还有一种基于多视觉属性检索式的图像检索方法,利用视觉属性之间的关联,训练多个视觉属性的联合分类器来预测图像具有的视觉属性。检索时,根据用户给定的检索式和已知的视觉属性之间的关联,构建一个新的检索式,根据数据库中图像的视觉属性与检索式的匹配程度进行检索。参考论文“Behjat Siddiquie,Rogerio S.Feris,and Larry S.Davis.Image Ranking and Retrieval based on Multi-AttributeQueries.CVPR 2011”。该方法的缺陷在于,一方面,由于训练时只在视觉属性数据上训练,该方法无法直接用于其他的检索任务,限制了其应用前景;另一方面,当希望增加数据库上的视觉属性时,联合训练的模型无法直接扩展到新的视觉属性上,需要完全从头开始重新训练,从而限制了该方法的可扩展性。
另外,中国专利公开号CN105512273A还公开了一种基于可变长深度哈希学习的图像检索方法,该方法利用图像三元组对深度网络进行训练,目标是让网络端到端地学习一个二值哈希编码,使得相似的图像具有相似的编码,不相似图像的编码差异较大。该方法的缺陷在于,一方面由于在训练时只能使用一种相似性度量,因此最终得到的二值哈希编码只能用于单一的检索任务,限制了该方法的应用范围;另一方面,该方法在训练时使用了图像三元组,从而导致训练时模型收敛较慢,训练耗时大。
因此,目前需要一种快速有效且扩展灵活的图像检索方法。
发明内容
本发明的目的是提供一种基于深度学习和哈希编码的图像检索方法,该方法能够克服上述现有技术的缺陷。
根据本发明的一个方面,提供一种基于深度学习和哈希编码的模型训练方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710525604.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:景区评价方法和景区评价系统
- 下一篇:一种水泵涡轮及其制造工艺