[发明专利]一种基于有监督超图离散化图像二值编码方法有效
申请号: | 201810402753.3 | 申请日: | 2018-04-28 |
公开(公告)号: | CN109284411B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 王轩;张喜;漆舒汉;蒋琳;廖清;姚霖;李晔;关键;刘泽超;吴宇琳 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06K9/62;G06V10/74;G06V10/764 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 胡玉 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 超图 离散 图像 编码 方法 | ||
本发明涉及图像数据处理领域,特别涉及一种基于有监督超图离散化图像二值编码方法。该方法包括以下步骤:S1.假设一个由n幅图像组成训练集,将训练集所有样本通过学习哈希函数映射到汉明空间的二值化哈希码;S2.定义一个线性多分类模型,采用优化函数对离散化变量进行优化,得出第一目标函数;S3.采用超图对数据哈希码之间的距离度量一致性进行约束,得出第二目标函数;S4.整合第一目标函数和第二目标函数,得到完整的目标函数,采用“位循环坐标下降方法”学习哈希码矩阵,并通过迭代运算优化目标函数。本发明既可以保持数据在原始空间相似性,又能提高检索的准确率。
技术领域
本发明涉及图像数据处理领域,特别涉及一种基于有监督超图离散化图像二值编码方法。
背景技术
随着互联网的快速发展,互联网上图像的数据量呈现出爆炸式的增长。与此同时,迅速增长的图片资源使得用户难以在浩如烟海的图像中找到真正所需要的图片信息。基于文本的传统图像检索方法是采用人工的手段对图像标注,利用文字标签信息进行检索。但是,随着图像数据的快速增加,人工标注图片太过费力,耗时较长,并带有主观偏差,而且有些图片根本无法用文本信息来进行描述。因此基于内容的图像检索(CBIR)便应运而生。
基于内容的图像检索(CBIR)核心是利用图像的可视化特征对图像进行检索,典型的CBIR系统,允许用户输入一张图片,以检索具有相同或者相似内容的图片。CBIR所面临的一个基本问题是当特征维度高且数据量非常庞大时,数据存储空间将随着特征维度的增加,迅速增加,检索效率会随之降低,这种现象称为“维度灾难”。
为了解决这个问题,人们发明了哈希的相关算法,即基于哈希的图像检索方法,可以有效解决维度灾难带来检索效率低等问题。哈希方法引入近似的概念,认为在大规模数据检索中,用户更注重的是检索效率,而对检索的准确性不做过高的要求。对于大规模数据的检索,近似的检索结果就能满足用户的检索需求。从而在解决实际大规模数据检索问题时,可以合理的牺牲检索精度,来提高检索的效率。
基于哈希的图像检索方法,寻求在保持原始空间相似性前提下,将高维数据通过哈希函数映射到汉明空间,并保持原始空间的语义相似性,因此可以直接在汉明空间,用汉明距离代替原始空间的欧氏距离行快速检索,同时还能保持较高的准确性。通过线下学习原始数据的哈希码,对于新查询的数据,可以大幅提高其在数据中的检索速度,满足实际的检索需求。
发明内容
本发明提供一种基于有监督超图离散化图像二值编码方法,旨在解决大规模图像数据的检索质量和检索效率问题。
本发明提供一种种基于有监督超图离散化图像二值编码方法,包括以下步骤:
S1.假设一个由n幅图像组成训练集,将训练集所有样本通过学习哈希函数映射到汉明空间的二值化哈希码;
S2.定义一个线性多分类模型,采用优化函数对离散化变量进行优化,得出第一目标函数;
S3.采用超图对数据哈希码之间的距离度量一致性进行约束,得出第二目标函数;
S4.整合第一目标函数和第二目标函数,得到完整的目标函数,采用“位循环坐标下降方法”学习哈希码矩阵,并通过迭代运算优化目标函数。
作为本发明的进一步改进,所述步骤S1具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810402753.3/2.html,转载请声明来源钻瓜专利网。