[发明专利]一种图像标签的自动标注与排序方法在审
申请号: | 202211539530.4 | 申请日: | 2022-12-02 |
公开(公告)号: | CN115952312A | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 马楠;许根宝;梁晔;郭聪;姚永强;汪成;张进;汪墨涵;肖传胜 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06V10/26;G06V10/46 |
代理公司: | 北京驰纳南熙知识产权代理有限公司 11999 | 代理人: | 马栋敏 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 标签 自动 标注 排序 方法 | ||
本发明提供一种图像标签的自动标注与排序方法,包括以下步骤:构建基准图像集;对无标签的测试图像进行标注;对测试图像的标签进行排序。本发明提出了一种图像标签的自动标注和排序方法,一方面,通过基准图像集得到标签和视觉词的对应关系,实现测试图像标签的自动标注;另一方面,图像的对象性检测结果具有很强的语义性,将对象性检测技术用于标签排序,排序后的标签带有的语义信息和图像反映出的语义信息一致性更强,更准确的标签信息能够更好的用于图像检索等其他视觉任务,同时也能够为研究提供海量的可靠训练样本。
技术领域
本发明涉及图像处理的技术领域,特别是一种图像标签的自动标注与排序方法。
背景技术
随着Web2.0技术的快速发展,社交网站变得越来越流行,其中最具有代表性的社交媒体网站Facebook,Google的社交视频分享网站Youtube以及Yahoo的社交图像分享网站Flickr。社交媒体的一个重要特点是用户不仅可以创建自己的多媒体内容,而且可以使用关键字来描述媒体的内容,该关键字被称为标签(Tag)。这些标签极大地方便了用户组织和索引媒体内容,为大规模信息检索系统提供了有效途径。这些社群标注信息可以直接作为互联网图像索引,然而仍然存在大量的图像并没有标注信息。众所周知,人工标注会耗费大量的人力物力,成本非常昂贵。由于受用户知识背景和主观感情的影响,导致用户对图像内容的描述是模糊的、杂乱无序的,标签质量远远不能满足作为可靠的图像索引关键字的需要。为了给研究提供海量的可靠训练样本,自动图像标签的标注与排序技术一直是研究的热点。对象性检测技术是检测一幅图像中的潜在对象的位置,以矩形框的方式标出,并给出对象存在的可能性,带有很强的语义性。虽然目前有相关文献将对象性检测用于图像显著性分析、目标检测、图像检索等视觉任务,但缺少将对象性用于图像标签排序任务。
2015年3月17日的道客巴巴上公开了一篇题目为《海量图像标签自动排序算法的研究与实现》的北京交通大学硕士学位论文,该论文提出近年来,随着电子摄影产品的迅速普及,数字图像以惊人的速度涌现在网络上。如何从海量的图像中检索出所需图像成为一个亟待解决的问题。合理的图像标签顺序对图像检索和分析有着至关重要的作用,如何对杂乱无序的图像标签进行合理有效的重排序成为当前多媒体领域中一个研究热点。该论文着重研究如何建立有效的学习模型来解决图像标签的自动排序问题。现有的图像标签排序算法大致分为两类:基于相关性(Relevance-based)的标签排序算法和基于视觉显著性(Saliency-based)的标签排序算法。通过分析现有图像标签排序算法的优缺点,该论文提出了一种自适应的图像标签排序算法。该算法同时考虑了图像标签的语义相关性和标签的视觉显著性特征。具体地,首先对图像进行显著区域检测并生成相应的显著度图;然后利用显著度图信息对图像进行显著性分析;最后进行自适应的标签排序。若图像中存在显著区域,其标签按照所对应区域的视觉显著性高低进行重排序;反之,若图像中不存在显著区域,则标签按照与图像的语义相关度进行重排序。在上述标签排序算法中,为了判别图像是否存在显著区域,该论文首次提出了一种基于灰度分布直方图统计的显著性分析方法。该方法充分利用图像的显著度图信息,并借助LIBSVM机器学习技术对图像是否存在显著区域进行自动分析。为了验证基于显著性分析的自适应图像标签排序算法的可行性,该论文在COREL图像库和MSRC图像库上进行了实验,并同已有的方法进行了比较。实验结果表明,这种自适应的标签排序算法是有效可行的。该方法解决的问题是标签的自动排序问题,但是前提是图像已经具有了标签,所以这种方法的缺点是无法实现对无标签的图像标签进行自动标注和排序。此外,论文的方法在标签排序的过程中通过多示例方法将标签对应到图像区域,然后根据区域的显著性进行排序,这种方法的缺点是通过多示例方法将标签对应到图像区域准确度不高,且效率较低。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211539530.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序