[发明专利]一种积分梯度模型预测方法、系统、电子设备及存储介质在审
申请号: | 202110937966.8 | 申请日: | 2021-08-16 |
公开(公告)号: | CN113743584A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 白强伟;黄艳香 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 栾瑜 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 积分 梯度 模型 预测 方法 系统 电子设备 存储 介质 | ||
本发明提出一种积分梯度模型预测方法、系统、电子设备及存储介质,其方法技术方案包括原始模型训练步骤,定义一训练集,构造一神经网络模型,并将所述神经网络模型在所述训练集上进行训练;多任务训练集构造步骤,初始化一空的多任务数据集,从所述训练集中不放回的挑选一样本,根据所述样本对所述多任务数据集进行构造;多任务模型构造步骤,在完成训练的所述神经网络模型中添加归因结构得到一多任务模型,将所述多任务模型在所述多任务数据集上进行训练;多任务模型预测步骤,使用完成训练的所述多任务模型在一应用场景中进行预测。本申请解决了现有方法归因速度低、且无法在模型进行预测的同时给出预测结果的归因的问题。
技术领域
本发明属于机器学习技术领域,尤其涉及一种积分梯度模型预测方法、系统、电子设备及存储介质。
背景技术
近些年,深度学习在计算机视觉、自然语言处理、个性化推荐等领域都发挥了重要的作用。但是,随着模型在各类任务上效果的提升,模型的结构也变的越来越复杂,从而导致无法很好的解释模型的行为。因此,深度学习模型也常常被称为“黑盒”模型。最近,研究人员开始将注意力转向为模型可解释性,期望能够在一定程度上揭开“黑盒”模型。
此外,为模型的预测行为提供解释,不但能够增强人们对于模型的信任,提升模型的部署率,而且还有助于发现模型中的错误,并进一步改进模型。举例来说,一个准确率达到95%以上的文本情感分类模型,通常人们会选择相信这个模型并部署该模型。但是,如果在训练和测试样本中,所有负面样本均包含某些特殊字符,但正面样本中并没有。那么,模型可能并没有学习到正确的判断正、负面样本的规律,而单纯通过特殊符号进行分类。显然,这样的模型是有问题的,而解释性能够辅助人们快速定位到这种错误。
积分梯度法是由Sundararajan等人提出的基于梯度的模型解释方法,并在理论上证明了该方法的优越性。但是,该方法对每个要解释的样本都需要执行数十次的梯度计算,这将消耗掉大量的时间,阻碍该方法在实际中的应用。目前,积分梯度法主要有两个缺点:对单个样本进行归因需要计算20次以上的梯度,极大的拖慢了归因的速度;无法在模型进行预测的同时,给出预测结果的归因。
发明内容
本申请实施例提供了一种积分梯度模型预测方法、系统、电子设备及存储介质,以至少解决现有方法归因速度低、且无法在模型进行预测的同时给出预测结果的归因的问题。
第一方面,本申请实施例提供了一种积分梯度模型预测方法,包括:原始模型训练步骤,定义一训练集,构造一神经网络模型,并将所述神经网络模型在所述训练集上进行训练;多任务训练集构造步骤,初始化一空的多任务数据集,从所述训练集中不放回的挑选一样本,根据所述样本对所述多任务数据集进行构造;多任务模型构造步骤,在完成训练的所述神经网络模型中添加归因结构得到一多任务模型,将所述多任务模型在所述多任务数据集上进行训练;多任务模型预测步骤,使用完成训练的所述多任务模型在一应用场景中进行预测。
优选的,所述多任务训练集构造步骤进一步包括:使用所述神经网络模型预测所述样本的标签,并基于所述样本生成一归因基线样本,计算归因,并将所述降本、所述标签和所述归因作为新样本添加至所述多任务数据集中。
优选的,使用积分梯度法计算所述归因。
优选的,所述多任务模型预测步骤进一步包括:在进行模型预测时,同时输出预测结果和归因结果。
第二方面,本申请实施例提供了一种积分梯度模型预测系统,适用于上述一种积分梯度模型预测方法,包括:原始模型训练模块,定义一训练集,构造一神经网络模型,并将所述神经网络模型在所述训练集上进行训练;多任务训练集构造模块,初始化一空的多任务数据集,从所述训练集中不放回的挑选一样本,根据所述样本对所述多任务数据集进行构造;多任务模型构造模块,在完成训练的所述神经网络模型中添加归因结构得到一多任务模型,将所述多任务模型在所述多任务数据集上进行训练;多任务模型预测模块,使用完成训练的所述多任务模型在一应用场景中进行预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110937966.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:管道抓取机器人及其抓取方法
- 下一篇:一种高纯度石英砂的制备方法