[发明专利]一种基于迁移学习的模型训练方法、信息推荐方法及装置在审
申请号: | 202111574273.3 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114331602A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 张锦;王海涛;董健;王永康;王兴星;张亚鹏 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q30/02;G06N20/00 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 邓超 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 迁移 学习 模型 训练 方法 信息 推荐 装置 | ||
1.一种基于迁移学习的模型训练方法,其特征在于,包括:
获取若干用户在目标域中的各样本数据,以及所述各用户在源域中的各样本数据,所述样本数据中至少包括用户的历史行为数据以及商品信息;
针对所述每个用户,根据该用户在所述源域中的各样本数据,确定该用户在所述源域中的聚合样本数据;
针对该用户在所述目标域中的每个样本数据,根据该样本数据以及该用户在所述源域中的聚合样本数据,确定该用户的融合样本数据,作为第一训练样本,并根据该样本数据对应在所述目标域的业务执行结果,对所述第一训练样本进行标注;
分别将各第一训练样本输入待训练的点击预测模型中,确定各第一训练样本对应的预测点击率;
根据各第一训练样本对应的预测点击率与各第一训练样本的标注,确定损失函数,并以最小化所述损失函数为目标,调整所述点击预测模型中的模型参数;
其中,所述点击预测模型用于进行信息推荐。
2.如权利要求1所述的方法,其特征在于,根据该样本数据以及该用户在所述源域中的聚合样本数据,确定该用户的融合样本数据,具体包括:
确定该用户在所述源域中的若干关联用户;
根据各关联用户在所述源域中的各样本数据,确定各关联用户在所述源域中的聚合样本数据;
根据该样本数据、该用户在所述源域中的聚合样本数据,以及各关联用户在所述源域中的聚合样本数据,确定该用户的融合样本数据。
3.如权利要求2所述的方法,其特征在于,确定该用户在所述源域中的若干关联用户,具体包括:
根据该用户在所述源域中的用户标识,以及预先构建的用户索引,确定该用户在所述源域中的若干关联用户。
4.如权利要求3所述的方法,其特征在于,构建用户索引,具体包括:
确定所述源域中各用户的用户特征;
针对所述源域中的每个用户,根据该用户的用户特征以及所述源域中各其他用户的用户特征,确定该用户与各其他用户的相似度;
根据该用户与各其他用户的相似度,确定该用户的关联用户,并根据各用户及其关联用户,构建用户索引。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据该用户在所述源域中的聚合样本数据,确定第二训练样本,并根据该用户的各样本数据对应在所述源域的业务执行结果,对所述第二训练样本进行标注;
分别将各第二训练样本输入待训练的点击预测模型中,确定各第二训练样本对应的预测点击率;
确定损失函数,具体包括:
根据各第一训练样本对应的预测点击率与各第一训练样本的标注,各第二训练样本对应的预测点击率与各第二训练样本的标注,确定损失函数。
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
确定该用户在所述源域中的若干关联用户;
根据各关联用户在所述源域中的各样本数据,确定各关联用户在所述源域中的聚合样本数据,作为第三训练样本,并根据各关联用户的各样本数据对应在所述源域的业务执行结果,对所述第三训练样本进行标注;
分别将各第三训练样本输入待训练的点击预测模型中,确定各第三训练样本对应的预测点击率;
确定损失函数,具体包括:
根据各第一训练样本对应的预测点击率与各第一训练样本的标注,各第二训练样本对应的预测点击率与各第二训练样本的标注,以及各第三训练样本对应的预测点击率与各第三训练样本的标注,确定损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111574273.3/1.html,转载请声明来源钻瓜专利网。