[发明专利]一种跨模态检索方法和系统在审
申请号: | 202211435114.X | 申请日: | 2022-11-16 |
公开(公告)号: | CN115718815A | 公开(公告)日: | 2023-02-28 |
发明(设计)人: | 黄润辉;龙衍鑫;梁小丹 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/58 | 分类号: | G06F16/58;G06F16/583;G06F40/30;G06F18/22 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 高棋 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种跨模态检索方法和系统,涉及深度学习的技术领域,包括:获取图文对数据集,构建初始视觉‑语言检索模型;利用视觉编码器获得掩码块图像编码和图像数据编码,设置图像重建损失函数;在视觉概念词汇库中搜索视觉概念词,利用文本编码器获得视觉概念增强的文本编码,设置图像描述损失函数;利用跨模态解码器生成纯文本数据编码和重建文本数据,计算图文对噪声概率,设置噪声自适应对比损失函数;并利用噪声概率和重建文本数据获得重建图文对数据;构建总损失函数并进行优化,获得优化后的视觉‑语言检索模型,进行跨模态检索,获得检索结果;本发明提高了检索结果的准确性,还可以对文本数据不完整的图文对数据集进行补全。 | ||
搜索关键词: | 一种 跨模态 检索 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211435114.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种包样收缩装置
- 下一篇:货运信息查询方法、系统、设备及存储介质