[发明专利]一种积分梯度模型预测方法、系统、电子设备及存储介质在审

申请号：	202110937966.8	申请日：	2021-08-16
公开（公告）号：	CN113743584A	公开（公告）日：	2021-12-03
发明（设计）人：	白强伟;黄艳香	申请（专利权）人：	上海明略人工智能（集团）有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08
代理公司：	青岛清泰联信知识产权代理有限公司 37256	代理人：	栾瑜
地址：	200030 上海市徐汇区***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种积分梯度模型预测方法系统电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出一种积分梯度模型预测方法、系统、电子设备及存储介质，其方法技术方案包括原始模型训练步骤，定义一训练集，构造一神经网络模型，并将所述神经网络模型在所述训练集上进行训练；多任务训练集构造步骤，初始化一空的多任务数据集，从所述训练集中不放回的挑选一样本，根据所述样本对所述多任务数据集进行构造；多任务模型构造步骤，在完成训练的所述神经网络模型中添加归因结构得到一多任务模型，将所述多任务模型在所述多任务数据集上进行训练；多任务模型预测步骤，使用完成训练的所述多任务模型在一应用场景中进行预测。本申请解决了现有方法归因速度低、且无法在模型进行预测的同时给出预测结果的归因的问题。

技术领域

本发明属于机器学习技术领域，尤其涉及一种积分梯度模型预测方法、系统、电子设备及存储介质。

背景技术

近些年，深度学习在计算机视觉、自然语言处理、个性化推荐等领域都发挥了重要的作用。但是，随着模型在各类任务上效果的提升，模型的结构也变的越来越复杂，从而导致无法很好的解释模型的行为。因此，深度学习模型也常常被称为“黑盒”模型。最近，研究人员开始将注意力转向为模型可解释性，期望能够在一定程度上揭开“黑盒”模型。

此外，为模型的预测行为提供解释，不但能够增强人们对于模型的信任，提升模型的部署率，而且还有助于发现模型中的错误，并进一步改进模型。举例来说，一个准确率达到95％以上的文本情感分类模型，通常人们会选择相信这个模型并部署该模型。但是，如果在训练和测试样本中，所有负面样本均包含某些特殊字符，但正面样本中并没有。那么，模型可能并没有学习到正确的判断正、负面样本的规律，而单纯通过特殊符号进行分类。显然，这样的模型是有问题的，而解释性能够辅助人们快速定位到这种错误。

积分梯度法是由Sundararajan等人提出的基于梯度的模型解释方法，并在理论上证明了该方法的优越性。但是，该方法对每个要解释的样本都需要执行数十次的梯度计算，这将消耗掉大量的时间，阻碍该方法在实际中的应用。目前，积分梯度法主要有两个缺点：对单个样本进行归因需要计算20次以上的梯度，极大的拖慢了归因的速度；无法在模型进行预测的同时，给出预测结果的归因。

发明内容

本申请实施例提供了一种积分梯度模型预测方法、系统、电子设备及存储介质，以至少解决现有方法归因速度低、且无法在模型进行预测的同时给出预测结果的归因的问题。

第一方面，本申请实施例提供了一种积分梯度模型预测方法，包括：原始模型训练步骤，定义一训练集，构造一神经网络模型，并将所述神经网络模型在所述训练集上进行训练；多任务训练集构造步骤，初始化一空的多任务数据集，从所述训练集中不放回的挑选一样本，根据所述样本对所述多任务数据集进行构造；多任务模型构造步骤，在完成训练的所述神经网络模型中添加归因结构得到一多任务模型，将所述多任务模型在所述多任务数据集上进行训练；多任务模型预测步骤，使用完成训练的所述多任务模型在一应用场景中进行预测。

优选的，所述多任务训练集构造步骤进一步包括：使用所述神经网络模型预测所述样本的标签，并基于所述样本生成一归因基线样本，计算归因，并将所述降本、所述标签和所述归因作为新样本添加至所述多任务数据集中。

优选的，使用积分梯度法计算所述归因。

优选的，所述多任务模型预测步骤进一步包括：在进行模型预测时，同时输出预测结果和归因结果。

第二方面，本申请实施例提供了一种积分梯度模型预测系统，适用于上述一种积分梯度模型预测方法，包括：原始模型训练模块，定义一训练集，构造一神经网络模型，并将所述神经网络模型在所述训练集上进行训练；多任务训练集构造模块，初始化一空的多任务数据集，从所述训练集中不放回的挑选一样本，根据所述样本对所述多任务数据集进行构造；多任务模型构造模块，在完成训练的所述神经网络模型中添加归因结构得到一多任务模型，将所述多任务模型在所述多任务数据集上进行训练；多任务模型预测模块，使用完成训练的所述多任务模型在一应用场景中进行预测。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海明略人工智能（集团）有限公司，未经上海明略人工智能（集团）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110937966.8/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种积分梯度模型预测方法、系统、电子设备及存储介质在审

专利文献下载