[发明专利]一种基于元任务池优化设计的主动元学习方法与装置在审

申请号：	202210515710.2	申请日：	2022-05-12
公开（公告）号：	CN114973316A	公开（公告）日：	2022-08-30
发明（设计）人：	王俊	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06V40/10	分类号：	G06V40/10;G06V10/764;G06V10/774;G06V10/778
代理公司：	北京辰权知识产权代理有限公司 11619	代理人：	付婧
地址：	518048 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于任务优化设计主动学习方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及元学习、小样本学习及目标识别技术领域，更为具体来说，本申请涉及一种基于元任务池优化设计的主动元学习方法与装置。所述方法包括：获取第一数据集和第二数据集；在第一数据集上进行元学习，得到粗元学习模型；利用第二数据集精调初级元学习模型得到细元学习模型；基于元任务池优化设计对细元学习模型进行主动元学习，得到主动元学习模型；对主动元学习模型基于二重梯度进行迭代循环训练，得到训练好的主动元学习模型；采用训练好的主动元学习模型对目标数据进行识别。本申请指导了元学习框架中元训练任务的选择，使模型优先聚焦到更重要的元任务上，从而提升了元模型在测试任务上的表现，进而对目标数据的识别更为精准。

技术领域

本申请涉及元学习、小样本学习及目标识别技术领域，更为具体来说，本申请涉及一种基于元任务池优化设计的主动元学习方法与装置。

背景技术

近年来，借助强大的拟合能力，深度学习在图像识别、语言理解和AI辅助诊疗等领域取得了飞速的发展。但是，深度神经网络的问题在于，需要拥有大量的训练集来训练模型，而当我们针对每个任务，只有少量的数据点时，它通常会失败，尤其是在预测效果较差的小样本场景。所以目前的模型受限于训练数据，普适性和泛化性有限。

假设我们训练了一个深度学习模型，来执行葡萄牙语的句子情感分类任务，现在，当我们有另一个新任务即进行西班牙语的句子情感分类时，即使第二个任务与第一个任务密切相关，我们也不能使用相同的模型，而需要从头开始，为所谓新任务收集大量的语料数据作为训练样本，去训练有效的预测模型。这消耗了大量的时间，使效率降低。

发明内容

基于上述技术问题，本发明旨在利用优化的元任务池进行训练主动元学习模型，再采用训练好的主动元学习模型去识别目标数据，其实质是指导元学习框架中元训练任务的选择，使模型优先聚焦到更重要的元任务上，以便于有效提升元模型在测试任务上的表现。

本发明第一方面提供了一种基于元任务池优化设计的主动元学习方法，所述方法包括：

获取第一数据集和第二数据集；

在所述第一数据集上进行元学习，得到粗元学习模型；

利用所述第二数据集精调所述初级元学习模型得到细元学习模型；

基于元任务池优化设计对所述细元学习模型进行主动元学习，得到主动元学习模型；

对所述主动元学习模型基于二重梯度进行迭代循环训练，得到训练好的主动元学习模型；

采用所述训练好的主动元学习模型对目标数据进行识别。

在本发明的一些实施例中，所述元任务池优化设计，包括：

获取元任务池，其中，所述元任务池包括类别标签和数据样本；

筛选所述元任务池中的高价值数据样本；