[发明专利]可生成依存树的图像描述生成方法和装置在审
申请号: | 202010433735.9 | 申请日: | 2020-05-21 |
公开(公告)号: | CN111695574A | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 马志明;袁春 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06F40/14;G06F40/279;G06N3/04 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 王震宇 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种可生成依存树的图像描述生成方法,所述方法包括对图像描述文本的依存树的三叉树进行建模,从输入的图像中提取出图像特征,然后基于所述图像特征生成所述三叉树的根节点,再生成所述根节点的三个孩子节点,以此类推,递归地生成每一个节点的三个孩子节点,由此生成三叉树,再将生成的三叉树转化成图像描述文本的依存树;较佳地,通过注意力模块在生成每个节点时动态地为每个局部图像特征分配权重。本发明中,节点生成的依赖路径较序列模型更短,且在生成过程中可优先生成重要的单词,生成模式与人类更为接近,达到了高于基准模型的表现。 | ||
搜索关键词: | 生成 依存 图像 描述 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010433735.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种自密实混凝土及其制备方法
- 下一篇:一种跨音压气机组合机匣处理结构
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序