[发明专利]用于图像标注的空间注意力模型有效
申请号: | 201780071579.2 | 申请日: | 2017-11-18 |
公开(公告)号: | CN110168573B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 卢家森;熊蔡明;R·佐赫尔 | 申请(专利权)人: | 硕动力公司 |
主分类号: | G06N3/0442 | 分类号: | G06N3/0442 |
代理公司: | 北京市联德律师事务所 11361 | 代理人: | 黄大正;张来光 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 所公开的技术提出了一种新颖的空间注意力模型,其使用解码器长短期记忆(LSTM)的当前隐藏状态信息来引导注意力并提取空间图像特征用于图像标注(image captioning)。所公开的技术还提出了一种用于图像标注的新颖的自适应注意力模型,其混合来自卷积神经网络(CNN)的视觉信息和来自LSTM的语言信息。在每个时间步长处,与语言模型相比,自适应注意力模型自动决定依赖图像的程度,以发出下一个字幕单词。所公开的技术进一步将新的辅助哨兵门添加到LSTM架构并产生哨兵LSTM(Sn‑LSTM)。哨兵门在每个时间步长处产生视觉哨兵,这是从LSTM的内存得到的长期和短期视觉和语言信息的附加表示。 | ||
搜索关键词: | 用于 图像 标注 空间 注意力 模型 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于硕动力公司,未经硕动力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780071579.2/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序