[发明专利]一种基于有监督多视角离散化的多媒体二值编码方法有效
申请号: | 201810288688.6 | 申请日: | 2018-03-30 |
公开(公告)号: | CN108510559B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 王轩;漆舒汉;蒋琳;姚霖;廖清;李晔;关键;刘泽超;吴宇琳;张喜 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G06T9/00 | 分类号: | G06T9/00 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 张立娟 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 视角 离散 多媒体 编码 方法 | ||
1.一种基于有监督多视角离散化的多媒体二值编码方法,其特征在于,包括以下步骤:
S1.假设一个由n幅图像组成训练集,通过学习得到包含一系列子函数的哈希函数,将样本的两种不同模态的特征映射到经过优化的特征空间中,得到的一系列与哈希子函数对应的哈希值,然后通过二值量化将哈希值转化为二值化哈希码:
S2.基于有监督训练的哈希函数:定义一个线性多分类模型并对模型函数进行优化,采用最小平方损失作为目标函数;
S3.基于最小量化损失的哈希函数:假设一种模态的特征,通过哈希函数优化至量化损失最小;
S4.基于多视角锚图的哈希函数:构造锚图,并采用锚图正则化哈希函数;
S5.优化算法;
所述步骤S5具体包括:
整合,得到最后的优化目标:
所述步骤S5的算法过程为:
输入:多模态特征矩阵X(m),m=1,2,…j;
Y∈{0,1}l×n类别标签;
c:哈希码长;
η,δ,λ,τ:权重参数;
输出:哈希映射矩阵Pm,m=1,2,...,j;
初始化:B(0)=sgn(B*);
随机初始化P(0),生成每种模态特征的归一化仿射矩阵Hm;
步骤:
循环执行;
P-矩阵优化:
W-矩阵优化:W(t+1)=(BBT+λI)-1B(t)TYT:
B-矩阵优化:对于r=1,…,c.执行:
其中:
α-向量优化:利用二次规划工具包CVX优化函数
2.根据权利要求1所述的基于有监督多视角离散化的多媒体二值编码方法,其特征在于,所述步骤S1包括:
假设训练集O={oi},i=1,2,...,n包含n个样本,其中oi=(xi(1),xi(2),...,xi(j));xi(j)表示第i个样本的第j种媒体内容的特征向量,Y=[y1,y2,...,yn]∈{0,1}c×n表示训练样本的真实类别标签矩阵有:
跨媒体哈希算法通过学习得到包含一系列子函数的哈希函数:
H(x)={h1(x),h2(x),...,hk(x)},
将样本的两种不同模态的特征映射到经过优化的特征空间中,得到的一系列与哈希子函数对应的哈希值,然后通过二值量化将哈希值转化为二值化哈希码,过程如下:
bi=sgn(H(xi)),i=1,...,n
其中sgn()是符号函数,生成的哈希码bi与bj保留了原始特征oi与oj之间的语义相关性,即如果oi与oj具有相似的语义,则bi和bj在汉明空间中的汉明距离应该较小,反之亦然。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810288688.6/1.html,转载请声明来源钻瓜专利网。