[发明专利]一种基于有监督多视角离散化的多媒体二值编码方法有效
申请号: | 201810288688.6 | 申请日: | 2018-03-30 |
公开(公告)号: | CN108510559B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 王轩;漆舒汉;蒋琳;姚霖;廖清;李晔;关键;刘泽超;吴宇琳;张喜 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G06T9/00 | 分类号: | G06T9/00 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 张立娟 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 视角 离散 多媒体 编码 方法 | ||
本发明涉及一种基于有监督多视角离散化的多媒体二值编码方法。该方法包括:S1.假设一个由n幅图像组成训练集,通过学习得到包含一系列子函数的哈希函数,将样本的两种不同模态的特征映射到经过优化的特征空间中,得到的一系列与哈希子函数对应的哈希值,然后通过二值量化将哈希值转化为二值化哈希码:S2.基于有监督训练的哈希函数:定义一个线性多分类模型并对模型函数进行优化,采用最小平方损失作为目标函数;S3.基于最小量化损失的哈希函数:假设一种模态的特征,通过哈希函数优化至量化损失最小;S4.基于多视角锚图的哈希函数:构造锚图,并采用锚图正则化哈希函数;S5.优化算法。本发明既可以保持数据在原始空间相似性,又能提高检索的准确率。
技术领域
本发明涉及信息存储检索领域,特别涉及一种基于有监督多视角离散化的多媒体二值编码方法。
背景技术
互联网上不断产生的大量半结构化和非结构化数据产生,使如何有效存储这些数据,减少存储空间消耗成为了一个亟待解决的问题。跨媒体哈希(Cross-media Hashing)方法为解决以上问题提供了有效途径。首先跨媒体哈希方法将多媒体数据编码成一串长度固定的二值码(0/1或者-1/1),可以极大减少数据的存储空间;其次在进行计算时,仅需要通过简单的异或运算比较哈希码之间的汉明距离就可以实现特征距离计算。
跨媒体检索性能好坏主要取决于所学的哈希码的质量。通常假设哈希码的质量在于其是否能有效保留原始数据内部隐含的语义信息,比如,原始特征空间中两个相似数据点在映射到汉明空间中距离较小,而原始特征空间中两个差异化的数据点在映射到汉明空间中距离较大。为了提高哈希码的质量,通常采用机器学习方法生成哈希函数,并且在优化模型时要求生成的哈希码要与原始特征满足特定的统计分布规律。
采用机器学习方法学习跨媒体哈希函数主要有几点问题:1)哈希函数将原始特征从连续特征空间映射至二值化空间是一个NP难题;2)如何在特征映射时保持数据之间的语义相似性。3)如何对异构多媒体数据之间的关系建模。
发明内容
本发明提供一种基于有监督多视角离散化的多媒体二值编码方法,旨在解决多媒体信息存储检索问题的高效哈希码生成问题。
本发明提供一种基于有监督多视角离散化的多媒体二值编码方法,包括以下步骤:
S1.假设一个由n幅图像组成训练集,通过学习得到包含一系列子函数的哈希函数,将样本的两种不同模态的特征映射到经过优化的特征空间中,得到的一系列与哈希子函数对应的哈希值,然后通过二值量化将哈希值转化为二值化哈希码:
S2.基于有监督训练的哈希函数:定义一个线性多分类模型并对模型函数进行优化,采用最小平方损失作为目标函数;
S3.基于最小量化损失的哈希函数:假设一种模态的特征,通过哈希函数优化至量化损失最小;
S4.基于多视角锚图的哈希函数:构造锚图,并采用锚图正则化哈希函数;
S5.优化算法。
作为本发明的进一步改进,所述步骤S1包括:
假设训练集O={oi},i=1,2,...,n包含n个样本,其中oi=(xi(1),xi(2),...,xi(j))。xi(j)表示第i个样本的第j种媒体内容的特征向量,Y=[y1,y2,...,yn]∈{0,1}c×n表示训练样本的真实类别标签矩阵有:
跨媒体哈希算法通过学习得到包含一系列子函数的哈希函数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810288688.6/2.html,转载请声明来源钻瓜专利网。