[发明专利]一种基于双层模型结合多维度信息的在线ctr校准方法在审
申请号: | 202111471942.4 | 申请日: | 2021-12-06 |
公开(公告)号: | CN114387008A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 韩弘炀;傅剑文;陈心童;章建森;周文彬 | 申请(专利权)人: | 天翼电子商务有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102200 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双层 模型 结合 多维 信息 在线 ctr 校准 方法 | ||
本发明公开了一种基于双层模型结合多维度信息的在线ctr校准方法,包括以下:通过预估模块获取基准pctr结果,在此基础上利用匹配模块对其进行pctr划分,对同一pctr区间的样本视为同一分布,避免了样本稀疏性造成的模型不稳定。利用不同区间生成相应多维度信息,加之实时模块获取的实时信息,能够有效利用多维度信息区分样本。最终通过校准模块得到双层模型下更为准确的ctr校准结果,进而实现流量收益最大化。
技术领域
本发明涉及推荐系统领域,特别涉及一种基于双层模型结合多维度信息的在线ctr校准方法。
背景技术
Ctr校准是推荐系统中必不可少的环节,好的校准方法可以在保障点击的基础上提高流量带来的收益;差的校准方法将错估流量的实际点击率,影响对预期收益的评估。
在实际推荐场景中,每个物料都会有相应的收益bid,推荐平台会根据ctr*bid来计算期望收益从而得到最优的展示排序。如何准确地评估每个物料的ctr是推荐系统中的重要环节。目前推荐系统进行ctr校准大多通过统计学得到的公式进行,对所有样本都进行同样的变换处理,无法实现样本精细化的区分以及根据不同时间段样本表现对校准结果进行调整。
本发明针对这一场景,提出了一种基于双层模型结合多维度信息的在线ctr校准方法,能够在单层模型的基础上,有机结合该模型结果与多维度信息,实时地进行二层模型预测对单层模型结果进行校准,使之更为贴近真实值。从而能够更加稳定、准确地对物料进行排序,提升流量带来的收益。
发明内容
本发明要解决的技术问题是克服现有技术的缺陷,提供一种基于双层模型结合多维度信息的在线ctr校准方法。
本发明提供了如下的技术方案:
本发明提供一种基于双层模型结合多维度信息的在线ctr校准方法,包括以下:
一、预估模块:
(1)pctr模型训练
提取hive中存储的近t0-t1日用户i广告j(样本sij)相应的用户、广告、行为、上下文等特征(以下用模型特征简述)使用深度模型进行pctr模型训练,本发明不限制深度模型结构;所得pctr结果可视为较为接近真实值的结果,其余模块在此基础上,提供更多信息使得模型获得更为准确的结果;
(2)训练集离线pctr预测:
对于上述用户i广告j进行pctr模型预测,得到结果train pctrij并传入匹配模块;
(3)验证集离线pctr预测:
提取hive中存储的近t2日用户i广告j相应的模型特征并进行pctr模型预测,得到结果valid pctrij并传入匹配模块;
(4)在线用户pctr预测:
获取实时登录的用户i及广告候选集中广告j相应的模型特征,使用pctr模型进行预测,得到结果test pctrij并传入匹配模块;
二、匹配模块:
(1)回溯训练集样本行为:
针对训练集中的样本进行t分钟内行为回溯,获取train pctrij对应的t分钟内用户i对广告j的曝光量expoij与点击量clkij;
(2)pctr区间划分:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼电子商务有限公司,未经天翼电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111471942.4/2.html,转载请声明来源钻瓜专利网。