[发明专利]一种模型迁移方法及装置在审
申请号: | 202211049409.3 | 申请日: | 2022-08-30 |
公开(公告)号: | CN115408992A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 成臻;徐国强 | 申请(专利权)人: | 太保科技有限公司 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F40/103 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 付丽 |
地址: | 200010 上海市黄浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种模型迁移方法,包括:将语言处理任务集合转换为预设格式;对所述转换为预设格式的语言处理任务集合进行大任务预训练,得到所述语言处理任务的统一生成式模型;将待处理任务转换为预设格式,所述待处理任务包括待处理输入内容和待处理输出内容;将所述统一生成式模型迁移至所述待处理任务,得到可处理模型。这样,采用大任务预训练的模式,在小样本迁移过程中无需引入新的参数,通过设置相同的预设格式,将待处理任务转换为模型可以直接处理的指令,从而进行小样本迁移,缩小了上游预训练任务和下游任务训练模式之间的差距,可以在下游小样本迁移任务上取得更好的效果。 | ||
搜索关键词: | 一种 模型 迁移 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太保科技有限公司,未经太保科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211049409.3/,转载请声明来源钻瓜专利网。