[发明专利]多模态预训练模型的训练方法、训练装置及电子设备有效
申请号: | 202110828433.6 | 申请日: | 2021-07-22 |
公开(公告)号: | CN113283551B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 李子中;李飞阳;史雅雅;薛娇 | 申请(专利权)人: | 智者四海(北京)技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 何明伦 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种多模态预训练模型的训练方法、训练装置及电子设备。本申请通过将每一组图文对产生的图像特征向量和文本特征向量输入至多模态预训练模型完成对多模态预训练模型的训练。其中图像特征向量包括了第一类图像特征向量和第二类图像特征向量。第一类图像特征向量包括原始图片的全局特征,第二类图像特征向量包括原始图片的局部特征和局部特征的位置坐标。本申请中设置第二类图像特征向量可以将强相关的视觉‑语义场景准确的描述。本申请提供的多模态预训练模型的训练方法可以大量的节约在预训练时所花费的时间和计算资源,得到一个需要少量的数据就能够快速准确的进行文匹配的多模态预训练模型。 | ||
搜索关键词: | 多模态预 训练 模型 方法 装置 电子设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智者四海(北京)技术有限公司,未经智者四海(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110828433.6/,转载请声明来源钻瓜专利网。
- 上一篇:基于语音识别结果的匹配方法
- 下一篇:断路器监控系统与方法