[发明专利]一种生成训练样本的方法及装置在审
申请号: | 201910944345.5 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110717536A | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 张立文;程佳;张涛;柳明海 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/9535;G06Q30/02;G06Q30/06 |
代理公司: | 11709 北京曼威知识产权代理有限公司 | 代理人: | 方志炜 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推荐信息 业务场景 训练样本 数据标识 用户标识 填充 模型训练 目标数据 用户信息 样本 操作结果 样本填充 查询 保存 便利 维护 | ||
本说明书公开了一种生成训练样本的方法及装置,在该方法中针对每个业务场景,确定推荐给用户的至少一个推荐信息,针对每个推荐信息,根据该推荐信息对应的数据标识、该用户的用户标识以及该用户在该业务场景下针对该推荐信息的操作结果,确定该推荐信息在该业务场景下对应的待填充样本并保存,在对该业务场景下进行模型训练时,根据该待填充样本中的数据标识以及用户标识,查询所述数据标识对应的推荐信息以及该用户标识对应的用户信息,从查询出的推荐信息以及该用户信息中分别提取出目标数据,通过提取出的目标数据对该待填充样本填充,生成用于对该业务场景下进行模型训练的训练样本。这就给训练样本带来维护便利,提高训练样本生成效率。
技术领域
本说明书涉及计算机领域,尤其涉及一种生成训练样本的方法及装置。
背景技术
为了能够给用户提供更好的业务体验,各业务平台可以基于用户的历史业务记录、历史浏览记录等信息,分析出用户的业务喜好和习惯,以向用户进行信息推荐。
通常情况下,业务平台可以通过针对业务场景设置的预测模型,实现在该业务场景下的信息推荐。而为了能够使预测模型能够适应业务变化,业务平台需要基于业务日志,对预测模型进行训练,已实现对预测模型的更新。具体的,业务平台可以从业务日志中提取出特征数据,并将该特征数据输入到预测模型中,得到预测结果,并将通过该预测结果确定出的推荐信息推荐给用户,同时监测用户基于该推荐信息所执行的操作结果。业务平台后续可以基于该推荐信息以及该操作结果,对该预测模型进行训练,实现对该预测模型的更新。
然而在现有技术中,不同业务场景的训练样本往往都是按照各自业务场景的训练样本生成方式来得到的,这就极大的增加了训练样本的维护困难。所以,如何能够降低训练样本的维护困难,则是一个亟待解决的问题。
发明内容
本说明书提供一种生成训练样本的方法及装置,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种生成训练样本的方法,包括:
针对每个业务场景,确定在该业务场景下推荐给用户的至少一个推荐信息;
针对每个推荐信息,根据该推荐信息对应的数据标识、所述用户的用户标识以及所述用户在该业务场景下针对该推荐信息的操作结果,确定该推荐信息在该业务场景下对应的待填充样本并保存;
在该业务场景下进行模型训练时,根据所述待填充样本中的数据标识以及用户标识,查询所述数据标识对应的推荐信息以及所述用户标识对应的用户信息;
从查询出的推荐信息以及所述用户信息中分别提取出目标数据;
通过提取出的目标数据对所述待填充样本进行填充,生成用于对该业务场景下进行模型训练的训练样本。
可选地,根据该推荐信息对应的数据标识、所述用户的用户标识以及所述用户在该业务场景下针对该推荐信息的操作结果,确定该推荐信息在该业务场景下对应的待填充样本并保存,具体包括:
根据所述用户在该业务场景下针对该推荐信息的操作结果,确定该推荐信息在该业务场景下对应的样本标签;
确定所述用户的用户信息对应的数据类别作为第一数据类别,以及确定该推荐信息对应的数据类别作为第二数据类别;
根据所述样本标签、所述用户标识与所述第一数据类别的对应关系、所述数据标识与所述第二数据类别的对应关系,确定该推荐信息在该业务场景下对应的待填充样本并保存。
可选地,从查询出的推荐信息以及所述用户信息中分别提取出目标数据,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910944345.5/2.html,转载请声明来源钻瓜专利网。