[发明专利]基于深度学习和哈希编码的图像检索方法有效
申请号: | 201710525604.1 | 申请日: | 2017-06-30 |
公开(公告)号: | CN107330074B | 公开(公告)日: | 2020-05-26 |
发明(设计)人: | 陈熙霖;刘昊淼;王瑞平 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06K9/62 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;李科 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 编码 图像 检索 方法 | ||
1.一种基于深度学习和哈希编码的模型训练方法,包括以下步骤:
步骤1)、将部分标注的图像数据作为网络模型的训练数据,通过深度网络将所述训练数据表示为类二值哈希编码,其中,所述类二值哈希编码是指取值是连续值的一种模拟二值哈希编码,所述部分标注的图像数据指的是所具有的语义类别标注和视觉属性标注中至少一个不是未知的图像数据;
步骤2)、将所述步骤1)获得的类二值哈希编码作为输入,连接到深度网络的多个任务层,同时使用多个任务进行训练,其中,所述多个任务层是指可作为图像检索任务的任务层,所述图像检索任务包括:针对图像的语义类别进行图像检索以及针对图像的视觉属性进行图像检索;
步骤3)、基于所述步骤1)的类二值哈希编码获得带有可供检索的特征信息的用于表示所述训练数据的二值哈希编码。
2.根据权利要求1所述的基于深度学习和哈希编码的模型训练方法,针对所述图像的语义类别,使用分类任务或基于图像对的度量学习任务来训练。
3.根据权利要求1所述的基于深度学习和哈希编码的模型训练方法,针对所述视觉属性,训练一组视觉属性分类器。
4.根据权利要求1至3中任一项所述的基于深度学习和哈希编码的模型训练方法,利用所述网络模型,对标注不完全或无标注的图像数据进行标签预测,从而补全所述图像数据中的所有图像的属性标签。
5.一种采用如权利要求1至4中任一项所述的方法的基于深度学习和哈希编码的图像检索的方法,包括:
根据一张查询图像进行语义类别检索任务时,利用所述网络模型得到所述查询图像的二值哈希编码;通过将所述查询图像的二值哈希编码与图像数据库中的所有图像的二值哈希编码相比较,获得与所述查询图像语义类别相同的图像作为检索结果;或者
根据一种或多种查询图像的视觉属性信息作为检索任务时,利用所述网络模型根据图像的二值哈希编码还原数据库中的所有图像的相应视觉属性信息,获得具有所述视觉属性信息的图像作为检索结果;或者
根据一张查询图像的语义类别以及一种或多种指定的视觉属性信息作为检索任务时,首先利用所述网络模型根据图像的二值哈希编码还原数据库中的所有图像的相应视觉属性信息,并利用所述还原的视觉属性信息对数据库进行筛选;其次利用所述网络模型得到所述查询图像的二值哈希编码;通过将所述查询图像的二值哈希编码,与所述筛选出的图像数据库中的图像的二值哈希编码相比较,获得与所述查询图像语义类别相同的且具有相应的视觉属性的图像作为检索结果。
6.一种图像检索系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器运行所述程序时执行如权利要求5所述的步骤。
7.一种计算机可读存储介质,包括存储在所述可读存储介质上的计算机程序,其中,所述程序执行如权利要求5所述的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710525604.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:景区评价方法和景区评价系统
- 下一篇:一种水泵涡轮及其制造工艺