[发明专利]一种从结构化文本到图像描述的生成方法有效
申请号: | 201610854169.2 | 申请日: | 2016-09-27 |
公开(公告)号: | CN106503055B | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 马书博;韩亚洪;李广 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/58 | 分类号: | G06F16/58;G06F16/51 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种从结构化文本到图像描述的生成方法,从互联网下载图片,构成图片训练集;对训练集中图像对应的描述进行词法分析,构造结构化文本;利用现有的神经网络模型,提取训练集图像的卷积神经网络特征,并以<图像特征,结构化文本>作为输入,构造多任务识别模型;以训练集中提取的结构化文本和相应描述作为递归神经网络的输入,训练得到递归神经网络模型的参数;输入待描述图像的卷积神经网络特征,通过多任务识别模型得到预测结构化文本;输入预测结构化文本,通过递归神经网络模型得到图像描述。与现有技术相比,本发明能够产生更好的图像描述效果和准确性以及句子的多样性,可以有效地推广到图像检索的应用当中。 | ||
搜索关键词: | 一种 结构 文本 图像 描述 生成 方法 | ||
【主权项】:
1.一种从结构化文本到图像描述的生成方法,其特征在于,该方法包括以下步骤:步骤(1)、从互联网下载图片,并对每个图片进行描述,形成<图像,描述>对,构成文本描述训练集;图像表示为集合
Nd是集合IMG中的图像总数;每个图像对应多个描述,描述表示为集合Sentences={Sentence1,…,SentenceN},N表示每一个图像所对应的句子(Sentence1,…,SentenceN)的描述个数,通过现有的图像集合IMG以及每个图像对应的句子描述Sentences组成<图像,描述>对,构成文本描述训练集;步骤(2)、对训练集中图像对应的描述进行词法分析,构造结构化文本,结构化文本组成包括物体和属性、活动、场景;步骤(3)、利用现有的神经网络模型,提取训练集图像的卷积神经网络特征,并以<图像特征,结构化文本>作为输入,构造多任务识别模型,模型表示如下:
其中,i=1,2,3,l=3表示该模型分为三个任务,第一个任务为识别图像存在的物体和相应的属性,第二个任务为识别图像中存在的活动,第三个任务为识别图像中具有的场景;Xi表示从图像中提取的卷积神经网络特征,Yi指的是从文本描述中获得物体及对应描述、活动、场景;1Ti表示单位矩阵,L表示是超图拉普拉斯,
表示矩阵
的迹,α,β,γ为目标函数的正则项参数,Wi,bi为待优化参数;步骤(4)、以训练集中提取的结构化文本和相应描述作为递归神经网络的输入,训练得到递归神经网络模型的参数;步骤(5)、输入待描述图像的卷积神经网络特征,通过多任务识别模型得到预测结构化文本;步骤(6)、输入预测结构化文本,通过递归神经网络模型得到图像描述。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610854169.2/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序