[发明专利]一种鲁棒离散监督跨媒体哈希检索方法有效

专利信息
申请号: 201910096204.2 申请日: 2019-01-31
公开(公告)号: CN109871454B 公开(公告)日: 2023-08-29
发明(设计)人: 姚涛;闫连山;吕高焕;崔光海;岳峻 申请(专利权)人: 鲁东大学
主分类号: G06F16/48 分类号: G06F16/48;G06F16/43;G06F16/41
代理公司: 烟台双联专利事务所(普通合伙) 37225 代理人: 梁翠荣
地址: 264000 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种鲁棒离散监督跨媒体哈希检索方法,通过学习一个鲁棒的两两样本间相似度矩阵挖掘异构样本间的语义关联,利用该方法可实现基于内容的跨媒体检索,该方法包括以下步骤:建立图像和文本数据集,并对数据集中的图像和文本样本分别提取视觉和文本特征;利用样本的类标签、图像和文本特征分别构建两两样本间相似度矩阵,并利用两两样本间相似度矩阵的低秩和样本噪声的稀疏特性学习一个鲁棒的两两样本间相似度矩阵;进而利用该鲁棒两两样本间相似度矩阵学习区分性更好的哈希码;对哈希函数施加范数正则项约束,以学习更为鲁棒的哈希函数;提出一种离散迭代优化算法,直接得到哈希码的离散解;本发明方法的学习一个鲁棒两两样本间相似度矩阵可以有效的抵抗样本中可能存在的噪声,从而大幅提高多媒体检索的性能。
搜索关键词: 一种 离散 监督 媒体 检索 方法
【主权项】:
1.一种鲁棒离散监督跨媒体哈希检索方法,其特征在于,该方法包括如下步骤:第一步:搜集含有类标签的图像和文本样本对,构成图像、文本一一对应的跨模态检索的图文数据集;第二步:分别对图像和文本模态样本提取特征,并分别对图像和文本模态样本的特征去均值,使两个模态样本的特征数据均值为0;第三步:将数据集中的所有样本对随机划分为训练集和测试集;第四步:利用训练集中样本对的类标签、图像和文本模态的样本特征分别构造两两样本间相似度矩阵,并利用两两样本间相似度矩阵的低秩特性和噪声样本的稀疏特性,学习一个鲁棒的两两样本间相似度矩阵;训练样本对的特征设为X,X={X(1),X(2)},其中X(1)表示训练集中图像模态的样本特征,X(2)表示训练集中文本模态的样本特征,其中d1和d2分别表示图像和文本模态样本特征的维度,N表示训练集中图像或文本模态样本数量,样本对的类标签用L表示,c表示样本类别的数量,li∈{0,1}c,如果lij=1,表示第i个样本属于第j类;反之,如果lij=0,表示第i个样本不属于第j类;学习鲁棒两两样本间相似度矩阵的目标函数包括以下步骤:(1)利用图像模态的样本特征计算基于图像模态特征的两两样本间的相似度矩阵,定义如下:其中||·||F表示Frobenius范数,S(1)表示图像模态的两两样本间相似度矩阵,表示第i个图像样本和第j个图像样本的相似度,σ1为尺度参数;(2)利用文本模态的样本特征计算基于文本模态特征的两两样本间相似度矩阵,定义如下:其中S(2)表示文本模态的两两样本间相似度矩阵,表示第i个文本样本和第j个文本样本的相似度,σ2为尺度参数;(3)利用样本对的类标签计算基于类标签的两两样本间相似度矩阵,定义如下:其中S(3)表示样本对标签的两两相似度矩阵,表示第i个样本对标签和第j个样本对标签的相似度;(4)学习鲁棒两两样本间相似度矩阵的目标函数定义如下:s.t.S(i)=S+||E(i)||0其中S表示学习的鲁棒样本间两两相似度矩阵,E(i)表示第i个两两相似度矩阵中的噪声,rank(·)表示矩阵的秩,||·||0表示l0范数;(5)上述(4)中的目标函数存在离散低秩和l0范数的约束,上式可改写为s.t.S(i)=S+||E(i)||1其中||·||*表示核范数,||·||1表示l1范数,(6)利用増广拉格朗日乘子法求解这个问题,得到鲁棒两两样本间相似度矩阵;第五步:构造目标函数,具体包括以下步骤:(1)在汉明空间保持基于鲁棒两两样本间相似度矩阵的相似性,哈希码学习的目标函数定义如下:其中k表示哈希码的长度,B1为图像模态样本的哈希码,B2为文本模态样本的哈希码,λ为权重参数;(2)利用线性映射作为哈希函数,并利用l2,1范数作为正则项约束图像和文本模态哈希函数的学习,各模态哈希函数学习的目标函数定义如下:其中W1,W2分别表示图像模态和文本模态的哈希函数,Reg(·)表示正则项防止过拟合,在这里βi和μ为权重参数;(3)将哈希码和哈希函数学习的目标函数相加即为本方法的目标函数,定义如下:其中βi为权重参数;第六步:目标函数利用迭代优化算法求解,求解过程包括以下步骤:(1)固定W1,W2和B2,求解B1:去除常数项,目标函数可写为:在此可以逐样本求解,令b1i表示B1的第i列,b2j表示B2的第j列,去除常数项目标函数可写为:在此采用循环坐标梯度下降法逐比特求解,设b1im表示b1i的第m比特,表示b1i除了第m比特外的其他比特构成的向量,则b1im可由下式得到:重复上式直至求解完所有图像模态样本的哈希码;(2)固定W1,W2和B1,求解B2:与求解B1类似,可得重复上式直至求解完所有文本模态样本的哈希码;(3)固定W2,B1和B2,求解W1:去除常数项,目标函数可写为:这个问题存在闭合解其中D1为对角阵,(4)固定W1,B1和B2,求解W2:与求解W1类似,W2存在闭合解其中D2为对角阵,(5)重复执行(1)‑(4)至算法收敛或达到最大迭代次数;第七步:用户输入查询样本,提取其特征,并对提取的特征去均值;第八步:利用已学习的哈希函数生成查询样本的哈希码:第九步:计算查询样本与目标(训练)集中异构样本的汉明距离,并对汉明距离按升序排列,前r个汉明距离对应的样本即为检索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鲁东大学,未经鲁东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910096204.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top