[发明专利]一种积分梯度模型预测方法、系统、电子设备及存储介质在审

专利信息
申请号: 202110937966.8 申请日: 2021-08-16
公开(公告)号: CN113743584A 公开(公告)日: 2021-12-03
发明(设计)人: 白强伟;黄艳香 申请(专利权)人: 上海明略人工智能(集团)有限公司
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08
代理公司: 青岛清泰联信知识产权代理有限公司 37256 代理人: 栾瑜
地址: 200030 上海市徐汇区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 积分 梯度 模型 预测 方法 系统 电子设备 存储 介质
【说明书】:

发明提出一种积分梯度模型预测方法、系统、电子设备及存储介质,其方法技术方案包括原始模型训练步骤,定义一训练集,构造一神经网络模型,并将所述神经网络模型在所述训练集上进行训练;多任务训练集构造步骤,初始化一空的多任务数据集,从所述训练集中不放回的挑选一样本,根据所述样本对所述多任务数据集进行构造;多任务模型构造步骤,在完成训练的所述神经网络模型中添加归因结构得到一多任务模型,将所述多任务模型在所述多任务数据集上进行训练;多任务模型预测步骤,使用完成训练的所述多任务模型在一应用场景中进行预测。本申请解决了现有方法归因速度低、且无法在模型进行预测的同时给出预测结果的归因的问题。

技术领域

本发明属于机器学习技术领域,尤其涉及一种积分梯度模型预测方法、系统、电子设备及存储介质。

背景技术

近些年,深度学习在计算机视觉、自然语言处理、个性化推荐等领域都发挥了重要的作用。但是,随着模型在各类任务上效果的提升,模型的结构也变的越来越复杂,从而导致无法很好的解释模型的行为。因此,深度学习模型也常常被称为“黑盒”模型。最近,研究人员开始将注意力转向为模型可解释性,期望能够在一定程度上揭开“黑盒”模型。

此外,为模型的预测行为提供解释,不但能够增强人们对于模型的信任,提升模型的部署率,而且还有助于发现模型中的错误,并进一步改进模型。举例来说,一个准确率达到95%以上的文本情感分类模型,通常人们会选择相信这个模型并部署该模型。但是,如果在训练和测试样本中,所有负面样本均包含某些特殊字符,但正面样本中并没有。那么,模型可能并没有学习到正确的判断正、负面样本的规律,而单纯通过特殊符号进行分类。显然,这样的模型是有问题的,而解释性能够辅助人们快速定位到这种错误。

积分梯度法是由Sundararajan等人提出的基于梯度的模型解释方法,并在理论上证明了该方法的优越性。但是,该方法对每个要解释的样本都需要执行数十次的梯度计算,这将消耗掉大量的时间,阻碍该方法在实际中的应用。目前,积分梯度法主要有两个缺点:对单个样本进行归因需要计算20次以上的梯度,极大的拖慢了归因的速度;无法在模型进行预测的同时,给出预测结果的归因。

发明内容

本申请实施例提供了一种积分梯度模型预测方法、系统、电子设备及存储介质,以至少解决现有方法归因速度低、且无法在模型进行预测的同时给出预测结果的归因的问题。

第一方面,本申请实施例提供了一种积分梯度模型预测方法,包括:原始模型训练步骤,定义一训练集,构造一神经网络模型,并将所述神经网络模型在所述训练集上进行训练;多任务训练集构造步骤,初始化一空的多任务数据集,从所述训练集中不放回的挑选一样本,根据所述样本对所述多任务数据集进行构造;多任务模型构造步骤,在完成训练的所述神经网络模型中添加归因结构得到一多任务模型,将所述多任务模型在所述多任务数据集上进行训练;多任务模型预测步骤,使用完成训练的所述多任务模型在一应用场景中进行预测。

优选的,所述多任务训练集构造步骤进一步包括:使用所述神经网络模型预测所述样本的标签,并基于所述样本生成一归因基线样本,计算归因,并将所述降本、所述标签和所述归因作为新样本添加至所述多任务数据集中。

优选的,使用积分梯度法计算所述归因。

优选的,所述多任务模型预测步骤进一步包括:在进行模型预测时,同时输出预测结果和归因结果。

第二方面,本申请实施例提供了一种积分梯度模型预测系统,适用于上述一种积分梯度模型预测方法,包括:原始模型训练模块,定义一训练集,构造一神经网络模型,并将所述神经网络模型在所述训练集上进行训练;多任务训练集构造模块,初始化一空的多任务数据集,从所述训练集中不放回的挑选一样本,根据所述样本对所述多任务数据集进行构造;多任务模型构造模块,在完成训练的所述神经网络模型中添加归因结构得到一多任务模型,将所述多任务模型在所述多任务数据集上进行训练;多任务模型预测模块,使用完成训练的所述多任务模型在一应用场景中进行预测。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110937966.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top