[发明专利]一种模型训练的样本增强方法、装置与系统在审

专利信息
申请号: 202010190167.4 申请日: 2020-03-17
公开(公告)号: CN113408562A 公开(公告)日: 2021-09-17
发明(设计)人: 周胜平;吴栋;林俊杰;吴敏;梁乔忠;仲景武 申请(专利权)人: 阿尔法云计算(深圳)有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 518000 广东省深圳市南*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 模型 训练 样本 增强 方法 装置 系统
【说明书】:

发明提出一种模型训练的数据增强方法,所述方法适用于AI模型训练过程,所述方法作用于一个样本主数据以及一个样本辅助数据集,所述方法通过将辅助数据集划分成多个子集,根据各子集对样本主数据的增强策略得到拟增强样本,并获得拟增强样本的回报值,再对各回报值与拟增强样本的组合作强化模型训练,从而得到终样本。该一种模型训练的数据增强方法可以使得AI算法具有更高灵活度与可定制化特性,进而使得AI应用更容易部署、加速AI应用的普及。

技术领域

本申请涉及数据处理方法,主要涉及在AI模型训练时对所需要的样本数据作协同与增强的处理方法。

背景技术

目前人们普遍认为人工智能(AI-Artificial Intelligence)会是二十一世纪及以后最具影响力的技术之一。而对于AI来说,核心的功能体现为AI模型,模型又是通过使用某种AI算法来训练样本得到的。因此,一个样本数据的质量往往对模型的效用与质量产生重大的影响。

从机器学习演进而来的增强学习,会使用数据增强的方式来提升样本的质量。一种典型的数据增强方式是输入更多的先验知识,另一种典型的数据增强方式是对数据作自循环式的广度组合或深度叠加。两种方式都希望最大可能地挖尽样本数据,提升样本数据的价值。

但对于任何一个特定样本数据来说,其包含的含义与模式也是有限的,因此上述数据增强方式的效果有限。

发明内容

因此,本申请提出解决上述问题、利用辅助数据(集)提升样本质量、并进一步提升训练所得模型质量的方法、系统和装置。这些方法,应用于不特定的工具、设备、系统甚至数据中心或云服务中心,从而构成一个模型训练的样本增强系统。为此,本发明:

一方面,提出模型训练的样本增强方法,包括:

接收第一数据,所述第一数据为使用目标算法作训练时的样本主数据;接收第二数据集,所述第二数据集包含一个或多个第二数据,所述第二数据作为所述第一数据的辅助数据,所述第二数据拟用于对所述第一数据的增强;加工确定第三数据集,所述第三数据集包含一个或多个第三数据,所述第三数据为所述第一数据经所述第一数据的拟增强数据后的回报值;加工确定第四数据,所述第四数据包含所述第一数据与第五数据集,所述第五数据集包含在所述第二数据集中。进一步,所述对所述第四数据的加工确定过程,还包括使用所述第三数据集以及所述第三数据集各元素对应的拟增强数据训练强化学习模型。进一步,所述第二数据对所述第一数据的拟增强,还包括确定所述第二数据对所述第一数据的增强策略,所述增强策略依赖于所述第二数据对所述第一数据的元数据的扩展情况。进一步,所述第二数据对所述第一数据的元数据扩展,还包括通过所述元数据的扩展情况,从而确定在两类拟增强的方式中作选择:对所述第一数据的特征空间作横向扩充;或者,对所述第一数据的值空间作纵向扩充;通过所述元数据的扩展方式,从而确定增强策略。进一步,所述第三数据的加工过程,还包括使用AI算法训练通过拟增强方式得到的所述第一数据的拟增强数据,得到第六数据与所述第三数据集中的一个第三数据,所述第六数据为经所述AI算法训练得到的算法模型。进一步,加工确定第四数据,还包括所述加工确定过程使用第六数据集与所述第三数据集,所述第六数据集包含一个或多个所述第六数据。进一步,还包括使用AI算法训练所述第一数据与所述第五数据集,输出对应的AI模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿尔法云计算(深圳)有限公司,未经阿尔法云计算(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010190167.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top