[发明专利]一种协同门控循环融合LSTM图像标注方法有效

专利信息
申请号: 202110794816.6 申请日: 2021-07-14
公开(公告)号: CN113627424B 公开(公告)日: 2023-09-12
发明(设计)人: 杨有;陈立志;胡峻滔;余平;杨学森 申请(专利权)人: 重庆师范大学
主分类号: G06V30/146 分类号: G06V30/146;G06V30/19;G06V10/82;G06N3/0464;G06N3/049;G06N3/08
代理公司: 重庆莫斯专利代理事务所(普通合伙) 50279 代理人: 刘强
地址: 401331 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 协同 门控 循环 融合 lstm 图像 标注 方法
【说明书】:

发明涉及协同门控循环融合领域,具体涉及一种协同门控循环融合LSTM图像标注方法,通过协同门控注意方法执行图像‑文本匹配的多模态任务;由生成注意权值的注意LSTM循环融合组成注意rLSTM;由生成单词的语言LSTM循环融合组成语言rLSTM;把协同门控注意SGA和循环融合LSTM整合在一起,形成rLSTM‑SGA;使用数据集对方法进行评论,从而通过SGA方法不仅注意图像的显著区域特征,还可以注意图像的空间特征信息,rLSTM方法,它可以代替传统单一的LSTM单元生成机制,每一时刻通过循环多个相同的LSTM对同一输入进行融合建模,进而对同一语义获取不同的上下文信息,以此提高模型序列学习的能力,生成更加准确的描述语句,整合上述两种创新方法在MSCOCO数据集上进行了评估。

技术领域

本发明涉及协同门控循环融合技术领域,尤其涉及一种协同门控循环融合LSTM图像标注方法。

背景技术

近年来,深度学习方法有着非常大的进步,驱动着图像描述生成朝着深度学习的方法快速发展,并取得了突破性的结果。在机器翻译以及序列到序列任务启发下,基于编码器译码器框架的图像描述生成方法得到了广泛应用。人们为了更好地探索视觉区域之间关系,挖掘图像中可用的语义信息,最近出现一些建立场景图的方法,通过构造视觉关系图来增强图像表示和描述生成。

目前图像描述生成的大量工作在译码端,探索RNN如何更加有效的译码图像特征,使其能够更加快速的收敛模型,更加准确的预测目标单词概率。而LSTM作为一种时间循环神经网络,在图像描述模型的译码器中被广泛使用。它在处理序列数据过程中起着关键的作用,通过引入输入门、遗忘门与输出门,LSTM能够有效解决RNN中存在的梯度消失问题。但是,LSTM序列生成的链状结构相对比较单一,每一时刻只有一个LSTM单元的状态输出。对比传统的LSTM方法提出了一种并行LSTM机制,即pLSTM模型,在每一层并行多个LSTM对同一输入获取不同的上下文信息。然而,每一层并行LSTM的方法虽然可以对输入信息进行多种不同的建模,但是LSTM单元之间是缺少序列关联性的。

发明内容

本发明的目的在于提供一种协同门控循环融合LSTM图像标注方法,旨在解决现有技术中的对比传统的LSTM方法提出了一种并行LSTM机制,即pLSTM模型,在每一层并行多个LSTM对同一输入获取不同的上下文信息。然而,每一层并行LSTM的方法虽然可以对输入信息进行多种不同的建模,但是LSTM单元之间是缺少序列关联性的的技术问题。

为实现上述目的,本发明采用的一种协同门控循环融合LSTM图像标注方法,包括如下步骤,

通过协同门控注意方法执行图像-文本匹配的多模态任务;

由生成注意权值的注意LSTM循环融合组成注意rLSTM,表示为rLSTMa

由生成单词的语言LSTM循环融合组成语言rLSTM,表示为rLSTMl

把协同门控注意SGA和循环融合LSTM整合在一起,形成rLSTM-SGA;

使用数据集对方法进行评论。

其中,在“通过协同门控注意方法执行图像-文本匹配的多模态任务”中,所述方法还包括,

使用卷积神经网络模型提取空间语义信息;

使用Faster-RCNN提取显著区域信息;

将提取的空间语义信息和显著区域信息融合在一起,同时利用图像不同的区域信息和空间信息生成当前的描述文本。

其中,在“由生成注意权值的注意LSTM循环融合组成注意rLSTM”中,所述方法还包括,

在第一层上,rLSTMa网络的隐藏状态计算公式如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆师范大学,未经重庆师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110794816.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top