[发明专利]一种基于迁移学习的模型训练方法、信息推荐方法及装置在审
申请号: | 202111574273.3 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114331602A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 张锦;王海涛;董健;王永康;王兴星;张亚鹏 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q30/02;G06N20/00 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 邓超 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 迁移 学习 模型 训练 方法 信息 推荐 装置 | ||
本说明书公开了一种基于迁移学习的模型训练方法、信息推荐方法及装置,在接收到用户终端发送的信息推荐请求时,可根据该信息推荐请求中的用户标识,确定用户在目标域中的历史行为数据,以及在源域中的聚合样本数据。之后,根据该用户在目标域中的历史行为数据、在源域的聚合样本数据以及候选商品的商品信息,确定该用户对应于候选商品的融合样本数据。最后,基于该融合样本数据,通过点击预测模型确定该用户对候选商品的预测点击率,以基于该用户对各候选商品的预测点击率,向该用户进行商品推荐。将用户在源域中的聚合样本数据,与在目标域的样本数据进行融合,扩充了样本数据的丰富度,使模型预测结果更准确,提升了信息推荐的命中率。
技术领域
本申请涉及机器学习技术领域,尤其涉及一种基于迁移学习的模型训练方法、信息推荐方法及装置。
背景技术
随着信息技术的发展,越来越多的电商平台通过推荐系统向用户推荐商品,以提升用户的决策体验。
目前,在向用户进行商品推荐时,可基于该用户在电商平台中的历史行为特征,以及各候选商品的商品特征,通过点击预测模型预测该用户对各候选商品的点击率,以根据预测的用户对各候选商品的点击率,向该用户推荐商品。
但是,对于电商平台中交互行为较少的用户,由于无法获取丰富的用户历史行为数据,导致模型学习不充分,预测结果不准确,信息推荐的命中率较低。
发明内容
本说明书实施例提供一种基于迁移学习的模型训练方法、信息推荐方法及装置,用于部分解决现有技术中的问题。
本说明书实施例采用下述技术方案:
本说明书提供的一种基于迁移学习的模型训练方法,包括:
获取若干用户在目标域中的各样本数据,以及所述各用户在源域中的各样本数据,所述样本数据中至少包括用户的历史行为数据以及商品信息;
针对所述每个用户,根据该用户在所述源域中的各样本数据,确定该用户在所述源域中的聚合样本数据;
针对该用户在所述目标域中的每个样本数据,根据该样本数据以及该用户在所述源域中的聚合样本数据,确定该用户的融合样本数据,作为第一训练样本,并根据该样本数据对应在所述目标域的业务执行结果,对所述第一训练样本进行标注;
分别将各第一训练样本输入待训练的点击预测模型中,确定各第一训练样本对应的预测点击率;
根据各第一训练样本对应的预测点击率与各第一训练样本的标注,确定损失函数,并以最小化所述损失函数为目标,调整所述点击预测模型中的模型参数;
其中,所述点击预测模型用于进行信息推荐。
可选地,根据该样本数据以及该用户在所述源域中的聚合样本数据,确定该用户的融合样本数据,具体包括:
确定该用户在所述源域中的若干关联用户;
根据各关联用户在所述源域中的各样本数据,确定各关联用户在所述源域中的聚合样本数据;
根据该样本数据、该用户在所述源域中的聚合样本数据,以及各关联用户在所述源域中的聚合样本数据,确定该用户的融合样本数据。
可选地,确定该用户在所述源域中的若干关联用户,具体包括:
根据该用户在所述源域中的用户标识,以及预先构建的用户索引,确定该用户在所述源域中的若干关联用户。
可选地,构建用户索引,具体包括:
确定所述源域中各用户的用户特征;
针对所述源域中的每个用户,根据该用户的用户特征以及所述源域中各其他用户的用户特征,确定该用户与各其他用户的相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111574273.3/2.html,转载请声明来源钻瓜专利网。