[发明专利]一种生成训练样本的方法及装置在审

申请号：	201910944345.5	申请日：	2019-09-30
公开（公告）号：	CN110717536A	公开（公告）日：	2020-01-21
发明（设计）人：	张立文;程佳;张涛;柳明海	申请（专利权）人：	北京三快在线科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06F16/9535;G06Q30/02;G06Q30/06
代理公司：	11709 北京曼威知识产权代理有限公司	代理人：	方志炜
地址：	100080 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	推荐信息业务场景训练样本数据标识用户标识填充模型训练目标数据用户信息样本操作结果样本填充查询保存便利维护
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本说明书公开了一种生成训练样本的方法及装置，在该方法中针对每个业务场景，确定推荐给用户的至少一个推荐信息，针对每个推荐信息，根据该推荐信息对应的数据标识、该用户的用户标识以及该用户在该业务场景下针对该推荐信息的操作结果，确定该推荐信息在该业务场景下对应的待填充样本并保存，在对该业务场景下进行模型训练时，根据该待填充样本中的数据标识以及用户标识，查询所述数据标识对应的推荐信息以及该用户标识对应的用户信息，从查询出的推荐信息以及该用户信息中分别提取出目标数据，通过提取出的目标数据对该待填充样本填充，生成用于对该业务场景下进行模型训练的训练样本。这就给训练样本带来维护便利，提高训练样本生成效率。

技术领域

本说明书涉及计算机领域，尤其涉及一种生成训练样本的方法及装置。

背景技术

为了能够给用户提供更好的业务体验，各业务平台可以基于用户的历史业务记录、历史浏览记录等信息，分析出用户的业务喜好和习惯，以向用户进行信息推荐。

通常情况下，业务平台可以通过针对业务场景设置的预测模型，实现在该业务场景下的信息推荐。而为了能够使预测模型能够适应业务变化，业务平台需要基于业务日志，对预测模型进行训练，已实现对预测模型的更新。具体的，业务平台可以从业务日志中提取出特征数据，并将该特征数据输入到预测模型中，得到预测结果，并将通过该预测结果确定出的推荐信息推荐给用户，同时监测用户基于该推荐信息所执行的操作结果。业务平台后续可以基于该推荐信息以及该操作结果，对该预测模型进行训练，实现对该预测模型的更新。

然而在现有技术中，不同业务场景的训练样本往往都是按照各自业务场景的训练样本生成方式来得到的，这就极大的增加了训练样本的维护困难。所以，如何能够降低训练样本的维护困难，则是一个亟待解决的问题。

发明内容

本说明书提供一种生成训练样本的方法及装置，以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案：

本说明书提供了一种生成训练样本的方法，包括：

针对每个业务场景，确定在该业务场景下推荐给用户的至少一个推荐信息；

针对每个推荐信息，根据该推荐信息对应的数据标识、所述用户的用户标识以及所述用户在该业务场景下针对该推荐信息的操作结果，确定该推荐信息在该业务场景下对应的待填充样本并保存；

在该业务场景下进行模型训练时，根据所述待填充样本中的数据标识以及用户标识，查询所述数据标识对应的推荐信息以及所述用户标识对应的用户信息；

从查询出的推荐信息以及所述用户信息中分别提取出目标数据；

通过提取出的目标数据对所述待填充样本进行填充，生成用于对该业务场景下进行模型训练的训练样本。

可选地，根据该推荐信息对应的数据标识、所述用户的用户标识以及所述用户在该业务场景下针对该推荐信息的操作结果，确定该推荐信息在该业务场景下对应的待填充样本并保存，具体包括：

根据所述用户在该业务场景下针对该推荐信息的操作结果，确定该推荐信息在该业务场景下对应的样本标签；