[发明专利]基于视觉对比注意力的隐式多模态匹配方法及系统在审
申请号: | 202210169569.5 | 申请日: | 2022-02-23 |
公开(公告)号: | CN114626441A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 殷亚珏;李寿山;王晶晶 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/205;G06F40/284;G06N3/04;G06N3/08;G06V10/40;G06V10/82 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 王广浩 |
地址: | 215000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于视觉对比注意力的隐式多模态匹配方法,包括:S1、进行语料标注,在存在隐式对齐关系的图像区域和文本短语之间建立起一一映射关系;S2、根据建立的映射关系,对输入图片‑文本对进行特征提取,得到图片对象特征序列和文本短语特征序列;S3、对图片对象特征和文本短语特征进行特征交互,计算出对齐和未对齐的视觉表示;S4、计算真值标签的对齐和未对齐视觉表示的预测概率,将对齐和未对齐视觉表示的预测概率都作为对比感知损失函数共同组成目标函数。本发明通过识别出文本和图像中实体间的隐式的匹配关系,来帮助模型更好地理解多模态的语义信息,显著地提升了隐式语料集上的匹配性能。 | ||
搜索关键词: | 基于 视觉 对比 注意力 隐式多模态 匹配 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210169569.5/,转载请声明来源钻瓜专利网。