[发明专利]一种基于深度哈希的类别失衡图像分层检索方法在审
申请号: | 202210571972.0 | 申请日: | 2022-05-24 |
公开(公告)号: | CN115080781A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 李冰;赵生捷;姚晗 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06N3/04;G06N3/08;G06V10/40;G06V10/764;G06V10/774 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 宣慧兰 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 类别 失衡 图像 分层 检索 方法 | ||
本发明涉及一种基于深度哈希的类别失衡图像分层检索方法,包括:S1、获取训练数据集输入到网络模型的特征提取模块,经多个卷积层处理后得到图像的高维特征向量;S2、高维特征向量输入到网络模型的隐含层,隐含层根据高维特征向量来学习图像的特征表示,同时输出图像对应的近似哈希码;S3、近似哈希码经激活函数与量化处理后形成离散的二进制串,作为最终哈希码输入到隐含层的分类层中,分类层通过二次检索方法计算出图库中对应的图像,完成分类模型的训练;S4、将待检索图像输入到完成训练的分类模型中,输出待检索图像在图库中对应的图像。与现有技术相比,本发明具有提高图像检索精度,减少模型参数量,使模型移植、存储更为方便等优点。
技术领域
本发明涉及图像识别技术领域,尤其是涉及一种基于深度哈希的类别失衡图像分层检索方法。
背景技术
二十一世纪,世界进入“互联网时代”,互联网的发展给人类生活提供了巨大的便利,各类社交软件和电商平台的出现,让人们不出家门便可实现与亲朋好友分享所见所景和购遍全球好物的愿望。这些软件的快速发展也使得互联网上相关图像、视频的数据量飞速增加。据有关资料显示,全球用户每天在社交平台上上传的图片量接近10亿张,而线上购物平台内更是存储有286亿多张图片。在这种情况下,如何使得每个用户都能从大规模图像数据中快速找到想要的图像变成了一个亟待解决的难题,该问题的解决方案就是使用图像检索技术。
图像检索技术的主要流程首先需要找到图像的一种可量化的表达方式,然后利用一种距离度量方式将待检索图像与图像库中的图像进行一一对比,求得它们之间的相似性度量,然后根据度量结果进行排序并输出对应的图像,即获得图像检索的结果。在图像检索技术发展的早期,主要使用基于文本的图像检索方法(Text-Based Image Retrieval,TBIR),主要思想是先将图像的内容用文字来表示,即人为对图像进行标注,接下来的图像检索过程其实就是对标注内容进行匹配的过程,根据搜索的内容找到匹配的图像标注后,再根据标注找到其对应的图像数据。这种方式操作简单、检索效率高,但是在图像数据规模急剧增大的情况下,对图像进行标注极其耗费人力、物力,并且图像标注的内容受人的主观意识所控制,不同人可能对相同的图像有不同的看法。所以基于内容的图像检索方法(Content-Based Image Retrieval,CBIR)逐渐取代了基于文本的图像检索方法。该方法首先得到图像的特征表示,然后通过比较特征之间的相似性进行图像检索操作,这种使用内容检索的方法形象化的描述就是“以图搜图”的过程,这种方法如今广泛应用于搜索引擎、电商平台等场景。
图像检索技术不仅仅只适用于以上的场景,它在其他很多方面都有着重要的作用:1)公安、刑侦领域:可以进行嫌疑人照片的比对、指纹检索等;2)智慧医疗领域:疾病早期自检系统、辅助医生诊断、相似病例查询等;3)交通管理:车辆检索识别、车辆追踪等。
但是因为图片质量增高和数量增多等原因,图像特征向量维度越来越高,数量也越来越多,导致基于内容的图像检索速度快速下降,占用空间也快速增加,被称为“维度灾难”。为了解决以上问题,基于哈希的检索方法被提出,它可以将图像的高维特征向量通过哈希函数映射为低维的二进制串,利用这种哈希码进行图像检索可以加快速度并节省空间。
近年来,计算机GPU计算能力的快速增长推动着深度学习技术的发展,特别是2012年AlexNet出现之后,深度学习技术在计算机视觉领域包括图像分类、目标检测、图像分割等任务处理上都产生了突破性的进展。研究人员也将其用在了图像检索任务上,结合深度学习和哈希编码技术提出基于深度哈希的图像检索方法,产生了非常好的效果,既提高了检索精度又加快了检索速度。
综合以上内容,图像检索技术在当今具有广阔的应用场景和研究价值。结合哈希编码、深度学习技术的基于深度哈希的图像检索方法更能充分利用大数据资源实现精度高、速度快、占用空间少的目标,加速人工智能应用从理论到落地的过程,为人们生活提供便利。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210571972.0/2.html,转载请声明来源钻瓜专利网。