[发明专利]模型训练方法、装置、设备及存储介质在审
申请号: | 202310673422.4 | 申请日: | 2023-06-07 |
公开(公告)号: | CN116663609A | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 杨志雄;杨延展 | 申请(专利权)人: | 抖音视界有限公司 |
主分类号: | G06N3/045 | 分类号: | G06N3/045;G06N3/0499;G06N3/048;G06N3/08;G06F8/60 |
代理公司: | 北京远智汇知识产权代理有限公司 11659 | 代理人: | 高学锋 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开实施例提供了一种模型训练方法、装置、设备及存储介质,用于训练多模态融合网络。获取多模态数据;其中,所述多模态数据包括图像数据、文本数据及音频数据中至少两种模态的数据;将所述多模态数据依次输入所述多模态融合网络,输出多模态数据处理结果;基于所述多模态数据处理结果训练所述多模态适配子网络、模态融合子网络及目标任务子网络中的至少一项,获得训练后的多模态融合网络。本公开实施例提供的模型训练方法,训练多模态融合网络中除预训练多模态子网络外的其他子网络,能够有效降低训练所需内存和显存等资源,同时又能利用预训练好的大模型,可以极大的节省计算资源及时间,从而提高多模态融合网络的训练及部署效率。 | ||
搜索关键词: | 模型 训练 方法 装置 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于抖音视界有限公司,未经抖音视界有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310673422.4/,转载请声明来源钻瓜专利网。
- 上一篇:洗衣机的主洗涤空间入口通道结构及其洗衣机
- 下一篇:定型剂及其制备方法和应用