[发明专利]基于复合注意力的原始特征注入网络的视觉问答方法有效
申请号: | 202110010417.6 | 申请日: | 2021-01-06 |
公开(公告)号: | CN112905819B | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 吴春雷;路静;王雷全;吴杰;段海龙 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G06F16/532 | 分类号: | G06F16/532;G06F16/538;G06F16/583;G06V10/44;G06V10/70;G06N20/00;G06F40/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于复合注意力的原始特征注入网络的视觉问答方法。以往的方法主要采用注意机制和密集的迭代操作进行细粒度匹配。然而,这些方法使得图像区域的自相关信息被忽略,这将导致整体语义理解上的偏差。此外,我们注意到在多次双边共同注意力操作之后,图像的一些有价值但不被关注的边缘信息常常被完全忽视。本发明首次提出了基于复合注意力的原始特征注入网络来研究图像和问题之间的对应关系。设计一个具有复合注意的区域强化网络,通过考虑区域间的关系,利用双边信息和自相关性,挖掘更完整的视觉语义并避免理解偏差。并提出原始特征注入模块,恢复图像有价值但不被关注的边缘信息。本发明在VQA2.0上进行大量实验证明了提出模型的有效性。 | ||
搜索关键词: | 基于 复合 注意力 原始 特征 注入 网络 视觉 问答 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110010417.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于低空拒止系统的低慢小飞行目标指定点诱骗方法
- 下一篇:一种智能断路器