[发明专利]基于图卷积网络的深度哈希方法及交通数据检索方法有效
申请号: | 202310195620.4 | 申请日: | 2023-03-03 |
公开(公告)号: | CN115878823B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 胡超;夏方尚元;施鹤远;刘荣凯;梁锴 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06N3/0464;G06N3/048;G06N3/08;G06V10/44;G06V10/764;G06V10/82;G06F16/55;G06F16/583 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图卷 网络 深度 方法 交通 数据 检索 | ||
本发明公开了一种基于图卷积网络的深度哈希方法,包括获取训练图像;对图像数据进行数据增强;构建视觉转换器模块;将视觉转换器模块的输出数据输入到图卷积网络中进行相关性优化;将图卷积网络的输出图像经过全连接层和激活函数映射得到哈希码;构建综合损失函数优化哈希过程;根据最终的优化结果完成实际的深度哈希过程。本发明还公开了一种包括所述基于图卷积网络的深度哈希方法的交通数据检索方法。本发明保证低维汉明空间与原始图像高维空间一致的相关性关系,生成更加高效、紧凑的二进制哈希码,提高大规模图片检索的有效性,而且可靠性高、有效性好且简单方便。
技术领域
本发明属于计算机技术领域,具体涉及一种基于图卷积网络的深度哈希方法及交通数据检索方法。
背景技术
随着经济技术的发展和人们生活水平的提高,压缩映射技术已经广泛应用于人们的生产和生活当中,给人们的生产和生活带来了无尽的便利。深度哈希作为一种压缩映射技术,其核心思想是通过学习一个哈希函数将高维图像信息映射成低维二进制码,同时保持图像本身的语义信息和相似关系。深度哈希技术被广泛应用于智能交通、教育大数据等领域的大规模图像检索任务中。
目前,主流的深度哈希方法是基于视觉转换器(VIT, Vision Transformer)来提取图像的特征,通过全连接层将图像特征映射到低维汉明空间,以构建损失函数来优化哈希模型,从而使得生成的哈希码能够保持原始图像的语义信息和相似性关系。
但是,目前的这种深度哈希方法,只考虑通过相关的损失函数来加强图像的相关性,从而使得生成的哈希码能够很好地保持相似关系。但是,这种方法的效果极其依赖于损失函数的有效性,而设计极其有效的损失函数是非常困难的;而且设计损失函数时若考虑不全面,则将导致哈希方法的效果不尽人意。
此外,基于现有的哈希方法的交通数据检索过程,也存在可靠性较差、效率不高且检索算法极其复杂的缺陷。
发明内容
本发明的目的之一在于提供一种可靠性高、有效性好且简单方便的基于图卷积网络的深度哈希方法。
本发明的目的之二在于提供一种包括了所述基于图卷积网络的深度哈希方法的交通数据检索方法。
本发明提供的这种基于图卷积网络的深度哈希方法,包括如下步骤:
S1. 获取训练图像;
S2. 对步骤S1获取的图像进行随机裁剪,完成图像数据的数据增强;
S3. 基于块嵌入、位置嵌入和编码器,构建视觉转换器模块;
S4. 将步骤S3构建的视觉转换器模块的输出数据,输入到图卷积网络中进行相关性优化;
S5. 将步骤S4得到的图卷积网络的输出图像经过全连接层和激活函数映射,得到哈希码;
S6. 基于相似性损失和语义损失,构建综合损失函数,并对步骤S3~S5的哈希过程进行优化;
S7. 根据最终的优化结果,完成实际的深度哈希过程。
所述的步骤S2,具体包括如下步骤:
将步骤S1获取的图像统一成256×256的正方形图像;
采用224×224的裁剪框,对统一后的图像进行随机裁剪,从而完成图像数据的数据增强。
所述的步骤S3,具体包括如下步骤:
视觉转换器包括依次串接的块嵌入模块、位置嵌入模块和编码器模块;
块嵌入模块用于将输入的图像切分成若干块,并添加一个待学习的类令牌,得到图像块和嵌入向量,并一同输入到位置嵌入模块;
位置嵌入模块用于为输入的图像块添加序列信息,从而生成一个用于分类的向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310195620.4/2.html,转载请声明来源钻瓜专利网。