[发明专利]基于迭代学习的图像描述重生成系统及方法有效

申请号：	201811176057.1	申请日：	2018-10-10
公开（公告）号：	CN109447242B	公开（公告）日：	2021-08-20
发明（设计）人：	张玥杰;周练;田勇;张涛	申请（专利权）人：	复旦大学
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08;G06T11/00
代理公司：	上海正旦专利代理有限公司 31200	代理人：	陆飞;陆尤
地址：	200433 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明为基于迭代学习的图像描述重生成系统及方法，包括：深度卷积网络、第一轮循环神经网络、知识抽取模块以及第二轮循环神经网络。深度卷积网络对图像进行细粒度的编码。第一轮循环神经网络为图像生成初步的句子描述以及视觉注意力图序列。知识抽取模块根据注意力图，利用显著性区域检测算法来生成显著性区域掩码。此外，知识抽取模块从初步生成的句子描述中提取名词序列作为图像的主题词。第二轮循环神经网络通过三种机制将显著性区域掩码和主题词融入第二轮训练，即基于显著性区域掩码的全局图像视觉表示精炼，基于主题词的多模态图像表示优化以及基于主题词的多模态注意力机制。基于上述机制，第二轮循环神经网络可生成精炼的图像描述。
搜索关键词：	基于学习图像描述生成系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于迭代学习的图像描述重生成系统，其组件包括：深度卷积网络、第一轮循环神经网络、知识抽取模块以及第二轮循环神经网络；其中，所述深度卷积网络用于对图像进行细粒度的编码，即计算图像区域的特征向量表示，并将图像的特征向量表示输出到第一轮循环神经网络和第二轮循环神经网络；所述第一轮循环神经网络利用均匀的区域权重对图像的区域特征向量进行加权平均，得到粗糙的全局图像视觉表示，然后生成初步的图像描述以及与句子中每个词语对应的视觉注意力图，并将这些信息输出到知识抽取模块；所述知识抽取模块根据视觉注意力图，利用基于滑动窗口的显著性区域检测算法来识别图像的显著性区域，并生成显著性区域掩码；此外，所述知识抽取模块根据词性从初步生成的句子描述中提取名词序列，作为图像的主题词；所述知识抽取模块将显著性区域掩码和主题词作为图像的额外知识输出到第二轮循环神经网络；所述第二轮循环神经网络通过三种机制将显著性区域掩码和主题词融入到第二轮训练当中，即利用显著性区域掩码来计算精炼的全局图像视觉表示，利用主题词来计算初始时刻多模态图像表示以及利用主题词来执行多模态注意力机制；基于上述三种机制，第二轮循环神经网络最终生成精炼的图像描述。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于复旦大学，未经复旦大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811176057.1/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于迭代学习的图像描述重生成系统及方法有效

专利文献下载