[发明专利]一种基于元任务池优化设计的主动元学习方法与装置在审
申请号: | 202210515710.2 | 申请日: | 2022-05-12 |
公开(公告)号: | CN114973316A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 王俊 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/764;G06V10/774;G06V10/778 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 付婧 |
地址: | 518048 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 优化 设计 主动 学习方法 装置 | ||
本申请涉及元学习、小样本学习及目标识别技术领域,更为具体来说,本申请涉及一种基于元任务池优化设计的主动元学习方法与装置。所述方法包括:获取第一数据集和第二数据集;在第一数据集上进行元学习,得到粗元学习模型;利用第二数据集精调初级元学习模型得到细元学习模型;基于元任务池优化设计对细元学习模型进行主动元学习,得到主动元学习模型;对主动元学习模型基于二重梯度进行迭代循环训练,得到训练好的主动元学习模型;采用训练好的主动元学习模型对目标数据进行识别。本申请指导了元学习框架中元训练任务的选择,使模型优先聚焦到更重要的元任务上,从而提升了元模型在测试任务上的表现,进而对目标数据的识别更为精准。
技术领域
本申请涉及元学习、小样本学习及目标识别技术领域,更为具体来说,本申请涉及一种基于元任务池优化设计的主动元学习方法与装置。
背景技术
近年来,借助强大的拟合能力,深度学习在图像识别、语言理解和AI辅助诊疗等领域取得了飞速的发展。但是,深度神经网络的问题在于,需要拥有大量的训练集来训练模型,而当我们针对每个任务,只有少量的数据点时,它通常会失败,尤其是在预测效果较差的小样本场景。所以目前的模型受限于训练数据,普适性和泛化性有限。
假设我们训练了一个深度学习模型,来执行葡萄牙语的句子情感分类任务,现在,当我们有另一个新任务即进行西班牙语的句子情感分类时,即使第二个任务与第一个任务密切相关,我们也不能使用相同的模型,而需要从头开始,为所谓新任务收集大量的语料数据作为训练样本,去训练有效的预测模型。这消耗了大量的时间,使效率降低。
发明内容
基于上述技术问题,本发明旨在利用优化的元任务池进行训练主动元学习模型,再采用训练好的主动元学习模型去识别目标数据,其实质是指导元学习框架中元训练任务的选择,使模型优先聚焦到更重要的元任务上,以便于有效提升元模型在测试任务上的表现。
本发明第一方面提供了一种基于元任务池优化设计的主动元学习方法,所述方法包括:
获取第一数据集和第二数据集;
在所述第一数据集上进行元学习,得到粗元学习模型;
利用所述第二数据集精调所述初级元学习模型得到细元学习模型;
基于元任务池优化设计对所述细元学习模型进行主动元学习,得到主动元学习模型;
对所述主动元学习模型基于二重梯度进行迭代循环训练,得到训练好的主动元学习模型;
采用所述训练好的主动元学习模型对目标数据进行识别。
在本发明的一些实施例中,所述元任务池优化设计,包括:
获取元任务池,其中,所述元任务池包括类别标签和数据样本;
筛选所述元任务池中的高价值数据样本;
将筛选的高价值数据样本标注出所述筛选的高价值数据样本对应的类别标签。
在本发明的一些实施例中,所述获取元任务池,其中,所述元任务池包括类别标签和数据样本,包括:
获取元任务池,所述元任务池中包含有多个元任务;
配置每个元任务中包含有第一预设数目个类别标签和第二预设数目个数据样本;
将第一预设数目个类别标签对应的已标注数据样本作为支持数据样本;
将所述第二预设数目个数据样本减去所述第三预设数目个数据样本得到的数据样本作为每个元任务的验证数据样本;
将所有元任务的验证数据样本作为待筛选数据样本。
在本发明的一些实施例中,所述筛选所述元任务池中的高价值数据样本,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210515710.2/2.html,转载请声明来源钻瓜专利网。