[发明专利]一种多标签图像识别方法及装置在审

专利信息
申请号: 201711366072.8 申请日: 2017-12-18
公开(公告)号: CN108133233A 公开(公告)日: 2018-06-08
发明(设计)人: 林倞;陈添水;王州霞;李冠彬;余伟浩;许琳 申请(专利权)人: 中山大学
主分类号: G06K9/62 分类号: G06K9/62;G06K9/46;G06N3/04
代理公司: 广州番禺容大专利代理事务所(普通合伙) 44326 代理人: 刘新年
地址: 510000 广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 标签图像 感知模块 标签 特征图 注意力机制 计算效率 区域特征 图片特征 一次循环 最终结果 剪切 调用 融合 输出 分类 学习
【说明书】:

发明公开了一种多标签图像识别方法及装置,所述方法包括如下步骤:步骤S1,获取多标签图像,提取图片特征,获得所述多标签图像的特征图;步骤S2,于所述特征图上进行剪切获得区域特征,多次调用已训练好的循环注意感知模块进行处理,以获得所有区域的标签分数;步骤S3,融合每一次循环注意感知模块得到的各区域的标签分数,获得最终的标签分布,输出最终结果,本发明通过将循环注意力机制和增强学习相结合的方法应用到多标签图像的识别中,提高了多标签图像识别的计算效率和分类精度。

技术领域

本发明涉及计算机视觉、模式识别领域,特别是涉及一种识别出多标签图像中各个物体的标签的多标签图像识别方法及装置。

背景技术

图像分类作为一个计算机视觉领域的基础问题在研究领域中得到了日益增加的关注。因为深度卷积神经网络(CNNs)的巨大成功,图像分类获得了显著的进步。但是现有的方法大多只关注只包含单个物体的单标签图像分类。相比,多标签图像识别更具实际价值,因为现实世界中的图像一般具有图像标签,而且对这些丰富的语义信息进行建模有助于高级别图像理解任务。

目前,对于多标签图像识别,一种直接的方法就是扩展卷积神经网络到多标签图像识别任务:通过微调已经在单标签数据集上进行预训练的网络来为多标签识别任务提取整张图片的特征。尽管这个方法是可端到端训练,但因为多标签图像具有多个区域、大小、占比和类别,这个基于整张图像特征表达训练的分类器往往不能在多标签图像中泛化。

另外一种替代的方法是引入物体候选区域,这些候选区域包含图像中所有可能的前景物体,然后从这些候选区域中提取特征并融合这些局部信息以用于多标签图像识别。尽管相比整张图片的特征提取,该方法有显著性的改进,但仍旧有许多瑕疵:首先,该方法需要提取几百个候选区域来达到较高的查全率,但是把这些候选区域送入卷积神经网络进行分类很耗时;其次,一张照片经常只包含几个物体,大多数候选区域要么提供了非常粗略的信息,要么往往都指向同一个物体,因此在这种方法中,多余的计算量和次优的性能不可避免,特别是在复杂的情况下;再者,该方法经常简化各个前景物体的全局依赖性,导致无法捕获图片中正确的标签。

发明内容

为克服上述现有技术存在的不足,本发明之目的在于提供一种多标签图像识别方法及装置,以通过将循环注意力机制和增强学习相结合的方法应用到多标签图像的识别中,提高了多标签图像识别的计算效率和分类精度。

为达上述及其它目的,本发明提出一种多标签图像识别方法,包括如下步骤:

步骤S1,获取多标签图像,提取图片特征,获得所述多标签图像的特征图;

步骤S2,于所述特征图上进行剪切获得区域特征,多次调用已训练好的循环注意感知模块进行处理,以获得所有区域的标签分数;

步骤S3,融合每一次循环注意感知模块得到的各区域的标签分数,获得最终的标签分布,输出最终结果。

进一步地,所述循环注意感知模块包括长短时记忆网络和全连接网络,其输入为截取的各个特征区域和上一次运行该模块得到的隐藏状态,输出为各个特征区域的分类向量以及预测的下一次运行最佳位置。

进一步地,步骤S2包括:

在特征图上截取不同形状、不同尺度的区域,并把该些区域缩放到统一尺度;

于该些区域特征提取后,利用长短时记忆网络将之前运行的隐藏态以及该些区域特征作为输入,输出为每个区域的分类分数和搜索到的下一次运行的最优位置,该过程不断重复直到达到最大运行次数,获得各区域的标签分数。

进一步地,于步骤S3中,对于每一次循环注意感知模块得到的各区域的标签分数的融合,使用种类最大池化方法来得到最终的结果。

进一步地,于步骤S1之前,还包括如下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711366072.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top