首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]用于在线学习的方法及装置在审

申请号：	202010468765.3	申请日：	2020-05-28
公开（公告）号：	CN111626436A	公开（公告）日：	2020-09-04
发明（设计）人：	朱敏杰;张天翼;刘金星;王睿祺	申请（专利权）人：	支付宝（杭州）信息技术有限公司
主分类号：	G06N20/00	分类号：	G06N20/00
代理公司：	北京永新同创知识产权代理有限公司 11376	代理人：	林锦辉;刘景峰
地址：	310000 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于在线学习方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于在线学习的方法，包括：

接收实时业务数据，所述实时业务数据是未打标数据；

为所述实时业务数据标注用于指示负样本的第一标签值；

基于正负样本均衡策略，根据所述实时业务数据来确定用于在线学习的训练样本数据；以及

在确定出用于在线学习的训练样本数据时，使用所述训练样本数据来针对业务模型进行在线学习。

2.如权利要求1所述的方法，其中，所述正负样本均衡策略包括以下策略中的至少一种：

如果当前召回率小于第一指定阈值，则将所述实时业务数据确定为用于在线学习的训练样本数据；

如果在所使用的训练样本数据中，具有第一标签值的训练样本数据与具有其他标注标签值的训练样本数据的数量比例小于第一阈值，则将所述实时业务数据确定为用于在线学习的训练样本数据，所述其他标注标签值用于指示正样本；

如果所述实时业务数据与被确定为训练样本数据的上一具有所述第一标签值的实时业务数据之间间隔第一指定数量的具有所述第一标签值的实时业务数据，则将所述实时业务数据确定为用于在线学习的训练样本数据；和

如果所述实时业务数据的时间戳与被确定为训练样本数据的上一具有所述第一标签值的实时业务数据的时间戳之间间隔第一指定时段，则将所述实时业务数据确定为用于在线学习的训练样本数据。

3.如权利要求2所述的方法，其中，所述正负样本均衡策略进一步包括：

将所述实时业务数据确定为用于在线学习的训练样本数据，并且将所述实时业务数据的标签值调整为指定标签值，所述指定标签值不同于业务数据的所有标注标签值。

4.如权利要求1所述的方法，还包括：

在所述具有第一标签值的实时业务数据被确定为是用于在线学习的训练样本数据时，将所述实时业务数据的标签值调整为指定标签值，所述指定标签值不同于业务数据的所有标注标签值。

5.如权利要求1所述的方法，还包括：

在满足重采样条件时，从历史正样本业务数据中采样正样本业务数据，作为所述训练样本数据。

6.如权利要求5所述的方法，其中，所述重采样条件包括以下条件中的至少一种：

在指定时间段内，在所述训练样本数据中未出现具有所述其它标注标签值的实时业务数据；

当前准确率小于第二指定阈值；

在所使用的训练样本数据中，具有第一标签值的训练样本数据与具有所述其他标注标签值的训练样本数据的数量比例大于第二阈值；

所述实时业务数据与被确定为训练样本数据的上一具有所述其他标注标签值的实时业务数据之间间隔第一指定数量的训练样本数据；和

所述实时业务数据的时间戳与被确定为训练样本数据的上一具有所述其他标注标签值的实时业务数据的时间戳之间间隔第二指定时段。

7.如权利要求1所述的方法，其中，所确定的训练样本数据具有样本权重，以及所述在线学习的损失函数基于所述训练样本数据以及所具有的样本权重确定。

8.如权利要求7所述的方法，其中，所述样本权重基于所述样本数据的个体标签概率分布以及历史业务数据的总体标签概率分布确定。

9.如权利要求8所述的方法，其中，所述样本数据的总体标签概率分布是利用高斯模型、逻辑回归模型和当前业务模型中的任一种模型对所述历史业务数据进行处理得到的。

10.一种用于在线学习的装置，包括：

数据接收单元，接收实时业务数据，所述实时业务数据是未打标数据；

标签值标注单元，为所述实时业务数据标注用于指示负样本的第一标签值；

训练样本数据确定单元，基于正负样本均衡策略，根据所述实时业务数据来确定用于在线学习的训练样本数据；以及

在线学习单元，在确定出用于在线学习的训练样本数据时，使用所述训练样本数据来针对业务模型进行在线学习。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于支付宝（杭州）信息技术有限公司，未经支付宝（杭州）信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010468765.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种铰接式公交客车用ECAS调试系统及调试方法
下一篇：全型号适用吹吸可调式笔记本电脑散热底座

同类专利

专利分类

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top