[发明专利]一种机器学习系统的训练方法和训练系统有效
申请号: | 201610125904.6 | 申请日: | 2016-03-04 |
公开(公告)号: | CN107153630B | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 周俊 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器 学习 系统 训练 方法 | ||
1.一种机器学习系统的训练方法,利用训练数据对所述机器学习系统进行训练,其特征在于,所述训练方法包括:
将所述训练数据分配给多个工作机;
将每一个工作机分配得到的训练数据划分为多个数据片;
获取每一个工作机基于每一个数据片计算出的本地权重和本地损失函数值;
汇总每一个工作机基于每一个数据片计算出的所述本地权重和本地损失函数值,获得当前权重和当前损失函数值;
利用当前权重和当前损失函数值执行模型异常检测;
当所述模型异常检测的结果为第一类异常,将上一次汇总后的权重和上一次汇总后的损失函数值输入所述机器学习系统进行训练;
当所述模型异常检测的结果为第二类异常,将当前权重和/或当前损失函数值修正为小于第一阈值的当前权重和/或当前损失函数值,并输入所述机器学习系统进行训练。
2.如权利要求1所述的训练方法,其特征在于,所述利用当前权重和当前损失函数值执行模型异常检测的步骤包括:
判断当前损失函数值是否大于上一次汇总后的损失函数值的k倍;
当判断出当前损失函数值大于上一次汇总后的损失函数值的k倍时,判定所述模型异常检测的结果为第一类异常。
3.如权利要求1所述的训练方法,其特征在于,所述利用当前权重和当前损失函数值执行模型异常检测的步骤包括:
判断当前权重中的元素的最大值和/或最小值的绝对值是否大于预设的第二阈值;
当判断出当前权重中的元素的最大值和/或最小值的绝对值大于预设的第二阈值时,判定所述模型异常检测的结果为第二类异常。
4.如权利要求3所述的训练方法,其特征在于,当所述模型异常检测的结果为第二类异常,将当前权重和/或当前损失函数值修正为第一阈值内的当前权重和/或当前损失函数值的步骤包括:
将所述最大值和/或最小值的绝对值大于预设的第二阈值的元素减去所述第一阈值,获得每一个元素均小于所述第一阈值的当前权重。
5.如权利要求1所述的训练方法,其特征在于,所述利用当前权重和当前损失函数值执行模型异常检测的步骤包括:
判断前n次汇总后的损失函数值的平均值是否大于第一次汇总后的损失函数值;
当判断出前n次汇总后的损失函数值的平均值大于第一次汇总后的损失函数值时,判定所述模型异常检测的结果为第一类异常。
6.如权利要求1所述的训练方法,其特征在于,所述利用当前权重和当前损失函数值执行模型异常检测的步骤之后,所述方法还包括:
当所述模型异常检测的结果为正常,将当前权重和/或当前损失函数值输入所述机器学习系统进行训练。
7.如权利要求6所述的训练方法,其特征在于,所述当所述模型异常检测的结果为正常,将当前权重和/或当前损失函数值输入所述机器学习系统进行训练的步骤之后,所述方法还包括:
判断训练是否结束;
当判定训练结束,产出所述模型;
当判定训练未结束,返回执行获取每一个工作机基于每一个数据片计算出的本地权重和本地损失函数值的步骤。
8.如权利要求6所述的训练方法,其特征在于,判断训练是否结束的步骤包括:
当检测到当前损失函数的值与上一次汇总后损失函数的值小于第三阈值,判定训练结束。
9.如权利要求1所述的训练方法,其特征在于,在将所述训练数据分配给多个工作机的步骤之前,所述方法还包括:
获取训练数据;
将所述训练数据分配给多个工作机的步骤还包括:
按照每一个工作机的标识,将所述训练数据分配给多个工作机。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610125904.6/1.html,转载请声明来源钻瓜专利网。