[发明专利]用于在线学习的方法及装置在审

专利信息
申请号: 202010468765.3 申请日: 2020-05-28
公开(公告)号: CN111626436A 公开(公告)日: 2020-09-04
发明(设计)人: 朱敏杰;张天翼;刘金星;王睿祺 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G06N20/00 分类号: G06N20/00
代理公司: 北京永新同创知识产权代理有限公司 11376 代理人: 林锦辉;刘景峰
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 在线 学习 方法 装置
【说明书】:

本说明书实施例提供了一种用于在线学习的方法及装置。在该方法中,响应于接收实时业务数据,为该实时业务数据标注第一标签值,再基于正负样本均衡策略,根据实时业务数据来确定用于在线学习的训练样本数据,在确定出训练样本数据时,使用该训练样本数据来针对业务模型进行在线学习。

技术领域

本说明书实施例涉及人工智能技术领域,具体地,涉及用于在线学习的方法及装置。

背景技术

在人工智能技术领域中,经过训练的机器模型可以被应用于各个场景中来进行分类、预测等相应地操作,这些机器模型的训练方式可以是离线学习或在线学习,还可以是离线学习和在线学习结合起来训练。在离线学习的方式中,每次使用批量的训练样本来进行训练,并且机器模型在被训练好之前不会被使用,只有训练好之后才会应用。在线学习使用的训练样本是信息流数据,各个信息流数据是有时间差的输入机器模型。机器模型每接收到一个信息流数据就将该信息流数据作为训练样本进行在线学习训练。在线学习的机器模型是在使用的过程中进行在线学习,从而实时地学习和更新。

发明内容

鉴于上述,本说明书实施例提供了一种用于在线学习的方法及装置。在该方法中,针对接收到的未打标的实时业务数据,可以将其标注为用于指示负样本的第一标签值,由此,针对未打标的实时业务数据,经过标注后也可以将其作为负样本用于在线学习,从而提高了对实时业务数据的利用率。此外,基于正负样本均衡策略来确定训练样本数据,并使用该训练样本数据针对业务模型进行在线学习。通过正负样本均衡策略来均衡训练样本数据中正负样本的比例,避免将所有作为负样本的实时业务数据都确定为训练样本数据,从而保持在线学习过程中的样本平衡。

根据本说明书实施例的一个方面,提供了一种用于在线学习的方法,包括:接收实时业务数据,所述实时业务数据是未打标数据;为所述实时业务数据标注用于指示负样本的第一标签值;基于正负样本均衡策略,根据所述实时业务数据来确定用于在线学习的训练样本数据;以及在确定出用于在线学习的训练样本数据时,使用所述训练样本数据来针对业务模型进行在线学习。

可选地,在上述方面的一个示例中,所述正负样本均衡策略包括以下策略中的至少一种:如果当前召回率小于第一指定阈值,则将所述实时业务数据确定为用于在线学习的训练样本数据;如果在所使用的训练样本数据中,具有第一标签值的训练样本数据与具有其他标注标签值的训练样本数据的数量比例小于第一阈值,则将所述实时业务数据确定为用于在线学习的训练样本数据,所述其他标注标签值用于指示正样本;如果所述实时业务数据与被确定为训练样本数据的上一具有所述第一标签值的实时业务数据之间间隔第一指定数量的具有所述第一标签值的实时业务数据,则将所述实时业务数据确定为用于在线学习的训练样本数据;和如果所述实时业务数据的时间戳与被确定为训练样本数据的上一具有所述第一标签值的实时业务数据的时间戳之间间隔第一指定时段,则将所述实时业务数据确定为用于在线学习的训练样本数据。

可选地,在上述方面的一个示例中,所述正负样本均衡策略进一步包括:将所述实时业务数据确定为用于在线学习的训练样本数据,并且将所述实时业务数据的标签值调整为指定标签值,所述指定标签值不同于业务数据的所有标注标签值。

可选地,在上述方面的一个示例中,还包括:在所述具有第一标签值的实时业务数据被确定为是用于在线学习的训练样本数据时,将所述实时业务数据的标签值调整为指定标签值,所述指定标签值不同于业务数据的所有标注标签值。

可选地,在上述方面的一个示例中,还包括:在满足重采样条件时,从历史正样本业务数据中采样正样本业务数据,作为所述训练样本数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010468765.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top