[发明专利]基于三重矩阵分解的数据检索方法、系统及设备有效
申请号: | 202211298601.6 | 申请日: | 2022-10-24 |
公开(公告)号: | CN115374165B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 刘兴波;李佳敏;聂秀山;王少华;尹义龙 | 申请(专利权)人: | 山东建筑大学 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/22;G06F17/16;G06F17/18;G06F18/214 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 于凤洋 |
地址: | 250100 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 三重 矩阵 分解 数据 检索 方法 系统 设备 | ||
本公开提供了一种基于三重矩阵分解的数据检索方法、系统及设备,属于信息检索领域,包括获取待检索的图像和文本两种模态的数据样本,对数据样本进行三重矩阵分解,设定对数据样本进行三重矩阵分解的约束值,构建目标函数;基于目标函数得到哈希函数,再根据哈希函数对数据样本进行投影,对应生成数据样本的哈希编码;计算数据样本的哈希编码和已经训练好的哈希编码之间的汉明距离,并进行排序,得到数据样本的检索结果,有效的挖掘到模态内的多样性和模态间的一致性信息,从而提升哈希函数和哈希编码的判别性,具有训练和检索速度快、检索性能高的特点。
技术领域
本公开涉及信息检索技术领域,具体涉及一种基于三重矩阵分解的数据检索方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
随着互联网、云计算和多媒体等技术的迅速发展,社交媒体中不同模态数据的呈现爆炸式的增长趋势,因此用户不再满足于单一模态数据间的相似性检索,而更多的关注于跨模态数据间相互检索,跨模态检索的任务是给定一个模态的查询对象,期望找到另一模态中的与之语义相似的集合,如文本检索图像、图像检索文本等。
然而,现有的多模态数据具有维度高和样本海量的特点,多数方案中并没有考虑异构性、语义鸿沟和可靠的标签信息数据,并且上述数据也比较难以获取到。
发明内容
本公开为了解决上述问题,提出了基于三重矩阵分解的数据检索方法及系统,利用三重矩阵分解模型将异构数据投影到统一的低维子空间,自适应地学习类属性特征,获得具有语义嵌入信息的公共表示;引入一种鲁棒的损失函数,增强模型对离群点样本的鲁棒性,生成高质量的公共表示和哈希编码;针对样本外扩展问题,提出了一种双重哈希函数策略,期望挖掘到模态内的多样性和模态间的一致性信息,从而提升哈希函数和哈希编码的判别性,具有训练和检索速度快、检索性能高的特点。
根据一些实施例,本公开采用如下技术方案:
基于三重矩阵分解的数据检索方法,包括以下步骤:
获取待检索的图像和文本两种模态的数据样本,并进行预处理;
对数据样本进行三重矩阵分解,设定对数据样本进行三重矩阵分解的约束值,构建目标函数;
基于目标函数得到哈希函数,再根据哈希函数对数据样本进行投影,对应生成数据样本的哈希编码;
计算数据样本的哈希编码和已经训练好的哈希编码之间的汉明距离,并进行排序,得到数据样本的检索结果。
根据另一些实施例,本公开采用如下技术方案:
基于三重矩阵分解的数据检索系统,包括:
数据采集模块,用于获取待检索的图像和文本两种模态的数据样本,并进行预处理;
模型构建模块,用于对数据样本进行三重矩阵分解,设定对数据样本进行三重矩阵分解的约束值,构建目标函数;
哈希码矩阵和哈希函数生成模块,用于基于目标函数得到哈希函数,再根据哈希函数对数据样本进行投影,对应生成数据样本的哈希编码;
检索结果获取模块,用于计算数据样本的哈希编码和已经训练好的哈希编码之间的汉明距离,并进行排序,得到数据样本的检索结果。
根据一些实施例,本公开还采用如下技术方案:
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现所述的基于三重矩阵分解的数据检索方法中的步骤。
与现有技术相比,本公开的有益效果为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东建筑大学,未经山东建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211298601.6/2.html,转载请声明来源钻瓜专利网。