[发明专利]用于在线学习的方法及装置在审
申请号: | 202010468765.3 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111626436A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 朱敏杰;张天翼;刘金星;王睿祺 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 林锦辉;刘景峰 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 在线 学习 方法 装置 | ||
1.一种用于在线学习的方法,包括:
接收实时业务数据,所述实时业务数据是未打标数据;
为所述实时业务数据标注用于指示负样本的第一标签值;
基于正负样本均衡策略,根据所述实时业务数据来确定用于在线学习的训练样本数据;以及
在确定出用于在线学习的训练样本数据时,使用所述训练样本数据来针对业务模型进行在线学习。
2.如权利要求1所述的方法,其中,所述正负样本均衡策略包括以下策略中的至少一种:
如果当前召回率小于第一指定阈值,则将所述实时业务数据确定为用于在线学习的训练样本数据;
如果在所使用的训练样本数据中,具有第一标签值的训练样本数据与具有其他标注标签值的训练样本数据的数量比例小于第一阈值,则将所述实时业务数据确定为用于在线学习的训练样本数据,所述其他标注标签值用于指示正样本;
如果所述实时业务数据与被确定为训练样本数据的上一具有所述第一标签值的实时业务数据之间间隔第一指定数量的具有所述第一标签值的实时业务数据,则将所述实时业务数据确定为用于在线学习的训练样本数据;和
如果所述实时业务数据的时间戳与被确定为训练样本数据的上一具有所述第一标签值的实时业务数据的时间戳之间间隔第一指定时段,则将所述实时业务数据确定为用于在线学习的训练样本数据。
3.如权利要求2所述的方法,其中,所述正负样本均衡策略进一步包括:
将所述实时业务数据确定为用于在线学习的训练样本数据,并且将所述实时业务数据的标签值调整为指定标签值,所述指定标签值不同于业务数据的所有标注标签值。
4.如权利要求1所述的方法,还包括:
在所述具有第一标签值的实时业务数据被确定为是用于在线学习的训练样本数据时,将所述实时业务数据的标签值调整为指定标签值,所述指定标签值不同于业务数据的所有标注标签值。
5.如权利要求1所述的方法,还包括:
在满足重采样条件时,从历史正样本业务数据中采样正样本业务数据,作为所述训练样本数据。
6.如权利要求5所述的方法,其中,所述重采样条件包括以下条件中的至少一种:
在指定时间段内,在所述训练样本数据中未出现具有所述其它标注标签值的实时业务数据;
当前准确率小于第二指定阈值;
在所使用的训练样本数据中,具有第一标签值的训练样本数据与具有所述其他标注标签值的训练样本数据的数量比例大于第二阈值;
所述实时业务数据与被确定为训练样本数据的上一具有所述其他标注标签值的实时业务数据之间间隔第一指定数量的训练样本数据;和
所述实时业务数据的时间戳与被确定为训练样本数据的上一具有所述其他标注标签值的实时业务数据的时间戳之间间隔第二指定时段。
7.如权利要求1所述的方法,其中,所确定的训练样本数据具有样本权重,以及所述在线学习的损失函数基于所述训练样本数据以及所具有的样本权重确定。
8.如权利要求7所述的方法,其中,所述样本权重基于所述样本数据的个体标签概率分布以及历史业务数据的总体标签概率分布确定。
9.如权利要求8所述的方法,其中,所述样本数据的总体标签概率分布是利用高斯模型、逻辑回归模型和当前业务模型中的任一种模型对所述历史业务数据进行处理得到的。
10.一种用于在线学习的装置,包括:
数据接收单元,接收实时业务数据,所述实时业务数据是未打标数据;
标签值标注单元,为所述实时业务数据标注用于指示负样本的第一标签值;
训练样本数据确定单元,基于正负样本均衡策略,根据所述实时业务数据来确定用于在线学习的训练样本数据;以及
在线学习单元,在确定出用于在线学习的训练样本数据时,使用所述训练样本数据来针对业务模型进行在线学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010468765.3/1.html,转载请声明来源钻瓜专利网。