[发明专利]模型集成预测方法、系统、电子设备及存储介质在审

专利信息
申请号: 202111106722.1 申请日: 2021-09-22
公开(公告)号: CN113822445A 公开(公告)日: 2021-12-21
发明(设计)人: 刘伟硕 申请(专利权)人: 上海明略人工智能(集团)有限公司
主分类号: G06N20/20 分类号: G06N20/20
代理公司: 青岛清泰联信知识产权代理有限公司 37256 代理人: 魏炜
地址: 200030 上海市徐汇区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 模型 集成 预测 方法 系统 电子设备 存储 介质
【说明书】:

发明提出一种模型集成预测方法、系统、电子设备及存储介质,其方法技术方案包括训练数据保存步骤,将训练阶段所有待集成模型的正确预测数据保存为一数据库;注意力集合计算步骤,获取一预测阶段的预测数据,根据所述预测数据与所述数据库中数据的余弦相似度,基于注意力机制计算得到一注意力分数集合;模型集成预测步骤,通过所述待集成模型对所述预测数据进行预测,根据预测结果和所述注意力分数集合进行集成模型预测。本申请解决了现有集成方法对子模型的提高效果有限、而且可解释性较差的问题。

技术领域

本发明属于模型集成技术领域,尤其涉及一种模型集成预测方法、系统、电子设备及存储介质。

背景技术

在机器学习领域中,同一个问题通常可以利用不同参数、不同结构的多种模型来解决,需要一种方法将不同模型的集成为一个健壮的模型,同时还需要保证集成后的模型要优于基础的子模型。

现有技术中包括:Bagging(bootstrap aggregating),分类问题采用N个模型预测投票的方式,回归问题采用N个模型预测平均的方式;Boosting,刚开始训练时对每一个训练例赋相等的权重,然后用该算法对训练集训练t轮,每次训练后,对训练失败的训练例赋以较大的权重,也就是让学习算法在每次学习以后更注意学错的样本,从而得到多个预测函数;Stacking,首先训练多个不同的模型,然后把之前训练的各个模型的输出为输入来训练一个模型,以得到一个最终的输出。

现有的模型集成技术都是从模型的组合方式出发,没有考虑数据本身的分布问题,普通的投票集成方法会导致数据倾斜的问题。机器学习的最终任务是需要通过模型的训练学习到数据的特征,每一个完成训练的子模型都对应着它学习到的数据分布。已有的模型集成方法只是改变了采样方式、数据传播方式等,集成方法对子模型的提高效果有限,而且可解释性较差。

发明内容

本申请实施例提供了一种模型集成预测方法、系统、电子设备及存储介质,以至少解决现有集成方法对子模型的提高效果有限、而且可解释性较差的问题。

第一方面,本申请实施例提供了一种模型集成预测方法,包括:训练数据保存步骤,将训练阶段所有待集成模型的正确预测数据保存为一数据库;注意力集合计算步骤,获取一预测阶段的预测数据,根据所述预测数据与所述数据库中数据的余弦相似度,基于注意力机制计算得到一注意力分数集合;模型集成预测步骤,通过所述待集成模型对所述预测数据进行预测,根据预测结果和所述注意力分数集合进行集成模型预测。

在其中一些实施例中,所述注意力集合计算步骤进一步包括:分别计算所述预测数据与所述数据库中每个所述待集成模型的每个数据的余弦相似度,进一步计算每个所述待集成模型的平均相似度,并进一步将每个所述待集成模型的平均相似度归一化得到所述注意力分数集合。

在其中一些实施例中,所述注意力集合计算步骤进一步包括:在所述预测数据与每个所述待集成模型的数据的余弦相似度中,从大到小依次选取K个所述余弦相似度数值,计算每个所述待集成模型的平均相似度。

在其中一些实施例中,所述模型集成预测步骤进一步包括:通过所述待集成模型对所述预测数据进行预测,得到每个所述待集成模型的预测结果并形成预测集合,将所述预测集合和所述注意力分数集合做乘积得到结果向量,并根据所述结果向量进行集成模型预测。

第二方面,本申请实施例提供了一种模型集成预测系统,适用于上述一种模型集成预测方法,包括:训练数据保存模块,将训练阶段所有待集成模型的正确预测数据保存为一数据库;注意力集合计算模块,获取一预测阶段的预测数据,根据所述预测数据与所述数据库中数据的余弦相似度,基于注意力机制计算得到一注意力分数集合;模型集成预测模块,通过所述待集成模型对所述预测数据进行预测,根据预测结果和所述注意力分数集合进行集成模型预测。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111106722.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top