[发明专利]基于图文协同注意力的跨模态检索模型构建及检索方法在审
申请号: | 202111406136.9 | 申请日: | 2021-11-24 |
公开(公告)号: | CN114201621A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 单丽莉;苏宇;孙承杰;林磊;刘秉权 | 申请(专利权)人: | 人民网股份有限公司;哈尔滨工业大学 |
主分类号: | G06F16/43 | 分类号: | G06F16/43;G06F16/583;G06V10/25;G06V10/774;G06K9/62;G06N3/04 |
代理公司: | 北京隆源天恒知识产权代理有限公司 11473 | 代理人: | 戴棋钦 |
地址: | 100032 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于图文协同注意力的跨模态检索模型构建及检索方法,所述方法包括:获取训练图像和训练文本,分别提取图像样本和文本样本的局部特征;将图像样本所有的局部图像特征和文本样本所有的局部文本特征分别映射为特征向量,并将图像样本和文本样本的特征向量分别表示成矩阵,再得到各自的Key矩阵、Query矩阵和Value矩阵;基于该多个矩阵,计算出图像样本和文本样本的跨模态注意力特征、模态内注意力特征;将跨模态注意力特征和模态内注意力特征进行融合,得到图像样本的全局特征表示和文本样本的全局特征表示;基于所述全局特征表示,训练得到跨模态检索模型。本发明可直接对不同模态的数据进行相似度匹配,具有较高的匹配准确性。 | ||
搜索关键词: | 基于 图文 协同 注意力 跨模态 检索 模型 构建 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人民网股份有限公司;哈尔滨工业大学,未经人民网股份有限公司;哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111406136.9/,转载请声明来源钻瓜专利网。