[发明专利]一种基于归纳型矩阵补全的大规模社交图像自动标注算法在审
申请号: | 201710036828.6 | 申请日: | 2017-01-18 |
公开(公告)号: | CN107590167A | 公开(公告)日: | 2018-01-16 |
发明(设计)人: | 陈蕾;刘梦迪;叶文采;周宇轩;杨庚;戴华 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/46;G06Q50/00 |
代理公司: | 南京知识律师事务所32207 | 代理人: | 李湘群 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 归纳 矩阵 大规模 社交 图像 自动 标注 算法 | ||
技术领域
本发明属于计算机技术领域中的图像自动标注技术领域,具体涉及一种基于归纳型矩阵补全的大规模社交图像自动标注算法。
背景技术
随着数码技术和互联网技术的迅速发展,出现了大量的社会化多媒体共享平台,海量的图像资源被互联网用户共享到这些平台上。在如此大规模的图像资源中,如何有效地管理和查询所需资源成为了一个迫切需要解决的问题。在过去的几十年里,计算机领域的研究人员从不同角度对其进行了大量研究。最初的一些研究是基于文本的图像检索,但其图像标签需要手工标注,耗时耗力、带来主观性和不精确性等问题;还有一些研究是基于内容的图像检索,但它存在底层视觉特征多样性和“语义鸿沟”等问题。如今,它们都不能很好地满足用户进行图像检索的需求。
由于用户习惯于使用标签进行需求查询,并且现有的互联网搜索引擎大都是提供基于标签的图像检索,但是手工标注带来的问题使得图像检索的效率降低。为了解决这一问题,图像自动标注逐渐被提出,并成为了诸多研究者关注的热点。图像自动标注能让计算机自动给无标注或已部分标注图像加上能够反映图像视觉内容的语义标签,它也能很好地解决一定程度的“语义鸿沟”问题。大部分现有图像自动标注算法往往要求数据集中的图像被标注完整且精确地标签。然而,如今社会化多媒体共享平台上的图像大都是被互联网用户进行上传、编辑及共享的,它们允许用户使用自定义的标签进行图像分类和管理,而互联网用户经常使用涉及上下文环境及个人心态的标签进行图像标注,这往往造成大多数图像标签都是不完整和不精确的,从而引起图像标签的缺失和含噪问题。为了解决图像标签的缺失和含噪问题,图像标签修正算法逐渐被提出来。经对现有文献的检索发现,Zhu等人将图像标签矩阵分解成低秩矩阵和噪声稀疏矩阵,并利用图像间语义和视觉特征一致性的约束条件优化图像和标签之间的对应关系完成图像标签的修正。Wu等人提出一种在图像标签矩阵的稀疏性制约下的最优化方法,通过最小化每幅图像的标签与图像视觉内容之间的差异进行标签的补全。Xia 等人提出一种正则化最优算法,通过非负矩阵分解算法和考虑图像整体视觉离散度来改善图像和标签之间的相关关系,并在图像标签矩阵的稀疏性等制约下来进行标签的补全。Feng等提出一种低秩矩阵恢复算法,通过引入图拉普拉斯统计图像特征和标签之间的依赖性,并在图像标签矩阵的低秩性制约下完成图像标签的修正。
从上面提出的这些算法可以看出,现有的图像自动标注算法对图像标签矩阵的低秩性和其所固有的稀疏性这两种特性大多只考虑其一,在一定程度上影响了算法性能;而且现有大多数算法无法对新加入图像或无标签图像进行标注,以及解决大规模应用问题。
发明内容
本发明的主要目的是用于解决图像标签的缺失和含噪问题、新加入图像或无标签图像的标注问题及大规模应用问题,从而提高了图像自动标注的准确性和规模性。
为了实现上述目的,本发明提出一种基于归纳型矩阵补全的大规模社交图像自动标注算法,该算法采用了归纳性矩阵补全技术,同时融合了图像标签矩阵的低秩性及其固有稀疏性,并采用ADMM的改进算法进行大规模求解,其包括以下步骤:
(1)选择大规模社交图像数据集,对其进行预处理后,产生用于问题模型训练的图像标签的采样矩阵;
(2)根据图像视觉内容和语义标注一致性原则,并利用图像标签的低秩性和稀疏性的融合以及归纳性矩阵补全技术,对图像自动标注问题进行建模;
(3)引入并行多块ADMM进行问题模型求解,得到问题模型的求解结果;对求解结果进行迭代更新求解,直至收敛或满足终止条件得到最终所需结果,进而得到补全的图像标注结果;
(4)对新加入的图像进行图像标注。
进一步,步骤1具体包括如下步骤:
(2-1)选择大规模社交图像作为数据集,对数据集中的图像进行特征提取;
(2-2)提取图像中底层视觉特征和图像标注的语义特征,构建出图像-特征矩阵和图像-标签矩阵;
(2-3)基于步骤2-2中所构建的矩阵,进行移除标记图像过少的标签等预处理,得到新的图像-特征矩阵和图像-标签矩阵,其中图像-标签矩阵中的某些行可以是全零元素,即可以含有无标签图像;
(2-4)基于步骤2-3中的图像-标签矩阵,对其生成一个元素缺失且可能包含噪声的图像标签的采样矩阵,将其作为初始化图像-标签矩阵用于问题模型训练。
步骤2中,所述图像自动标注的问题模型表示如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710036828.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种城轨列车软件版本评估方法及系统
- 下一篇:用于关系推断的系统和方法