[发明专利]一种基于属性判别的自动图像标注方法有效
申请号: | 201610036626.7 | 申请日: | 2016-01-20 |
公开(公告)号: | CN105701516B | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 柯逍;周铭柯;杜明智 | 申请(专利权)人: | 福州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 属性 别的 自动 图像 标注 方法 | ||
本发明涉及一种基于属性判别的自动图像标注方法:针对数据集不均衡导致整体标注效果不理想的问题,提出一种基于属性判别的图像标注方法,利用每一个关键词的语义概念构建局部均衡数据集,并基于此数据集提出一种有效提升中低频标签标注准确率的语义传播算法。最后结合栈式自动编码器模型,通过判别图像的高低频属性来选择不同标注过程,提升了整体图像标注效果。该方法利用SAE模型较好预测高频标签和SP算法较好预测中低频标签的特点,通过判别未知图像的高低频属性来选择不同的标注过程,提升了整个模型的标注效果,该方法简单灵活,具有较强的实用性。
技术领域
本发明涉及模式识别与计算机视觉领域,特别是一种基于属性判别的自动图像标注方法。
背景技术
随着多媒体影像技术快速发展,互联网上图像信息呈爆炸性增长。这些数字图像的应用非常广泛,如商业、新闻媒体、医学、教育等方面。因此,如何帮助用户快速、准确地找到需要的图像成为近年来多媒体研究的热点课题之一。而解决这一课题最重要的技术就是图像检索和自动图像标注技术。
自动图像标注是指自动给图像添加若干关键词来表示图像的语义内容。自动图像标注可以利用已标注的图像集,自动学习语义概念空间与视觉特征空间的关系模型,并用此模型标注未知语义的图像。一方面,自动图像标注试图给高层语义特征和底层视觉特征之间建立一座桥梁,因此,它可以一定程度解决大多数基于内容图像检索方法存在的语义鸿沟问题,并且具有较好的客观性。另一方面,自动图像标注可以生成与图像内容相关的文字信息,具有更好的准确性。如果能实现自动图像标注,那么现有的图像检索问题实际上可以转化成较成熟的文本检索问题。因此,图像自动标注技术可以很方便地实现基于关键字的图像检索,符合人们的检索习惯。总的来说,自动图像标注涉及计算机视觉、机器学习、信息检索等多方而的内容,具有很强的研究价值和潜在的商业应用,如图像分类、图像检索、图像理解以及智能图像分析等。
根据现有自动图像标注方法的主要实现特点,可以分为两类:基于概率统计的标注方法和基于机器学习的标注方法。基于概率统计的方法虽然可以很方便的扩展到大数据集,但总体标注效果不够理想。基于机器学习的方法,一旦模型训练完毕,就可以进行快速标注,然而大部分图像标注方法都仅用一个模型预测所有的测试图像,只要模型训练好了,每一张测试图片的结果就已经确定了。即便对模型进行了改进,测试效果好的还是原先效果好的那些图片,原本效果不好的图片,改进模型后测试效果还是不够理想。针对这种情况,我们提出了一种基于属性判别的方法。即,在测试每一张图片时,先判断这张图片适合用哪一种模型测试,然后再用最合适的模型进行预测。
发明内容
本发明的目的在于提供一种基于属性判别的自动图像标注方法,以克服现有技术中存在的缺陷,并解决针对多对象多标签的自动图像标注问题。
为实现上述目的,本发明的技术方案是:一种基于属性判别的自动图像标注方法,按照如下步骤实现:
步骤S1:根据每一个关键词对训练集划分语义组,构造未知图像的局部均衡数据集;
步骤S2:利用整个训练集训练栈式自动编码器,获取栈式自动编码器模型;
步骤S3:利用所述局部均衡数据集训练语义重播模型;
步骤S4:从所述语义组中获得全局词频信息,从所述局部均衡数据集中获得局部词频信息,对所述全局词频信息以及所述局部词频信息取交集对未知图像进行属性判别;若判别未知图像为高频属性,则通过所述栈式自动编码器模型预测关键词;若判别未知图像为低频属性,则通过所述语义传播模型预测关键词。
在本发明一实施例中,在所述步骤S1中,通过如下步骤构造所述局部均衡数据集:
步骤S11:划分每一个标签所包含的所有图像为一个语义组,对于每一幅测试图像I,从每一个语义组中选取n幅与所述测试图像I视觉相似度最高的图像构造子训练集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610036626.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种显示器的背板、显示器的壳体以及显示器
- 下一篇:一种版权交易可翻折显示屏