[发明专利]一种基于双层模型结合多维度信息的在线ctr校准方法在审
申请号: | 202111471942.4 | 申请日: | 2021-12-06 |
公开(公告)号: | CN114387008A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 韩弘炀;傅剑文;陈心童;章建森;周文彬 | 申请(专利权)人: | 天翼电子商务有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102200 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双层 模型 结合 多维 信息 在线 ctr 校准 方法 | ||
1.一种基于双层模型结合多维度信息的在线ctr校准方法,其特征在于,包括以下:
一、预估模块:
(1)pctr模型训练
提取hive中存储的近t0-t1日用户i广告j(样本sij)相应的用户、广告、行为、上下文等特征(以下用模型特征简述)使用深度模型进行pctr模型训练,本发明不限制深度模型结构;所得pctr结果可视为较为接近真实值的结果,其余模块在此基础上,提供更多信息使得模型获得更为准确的结果;
(2)训练集离线pctr预测:
对于上述用户i广告j进行pctr模型预测,得到结果train pctrij并传入匹配模块;
(3)验证集离线pctr预测:
提取hive中存储的近t2日用户i广告j相应的模型特征并进行pctr模型预测,得到结果valid pctrij并传入匹配模块;
(4)在线用户pctr预测:
获取实时登录的用户i及广告候选集中广告j相应的模型特征,使用pctr模型进行预测,得到结果test pctrij并传入匹配模块;
二、匹配模块:
(1)回溯训练集样本行为:
针对训练集中的样本进行t分钟内行为回溯,获取train pctrij对应的t分钟内用户i对广告j的曝光量expoij与点击量clkij;
(2)pctr区间划分:
对于预估模块生成的train pctrij进行n分位数区间划分,得到区间pctr interval1,interval2,……,intervaln;
(3)多维度离线匹配结果生成:
针对pctr区间,创造性的认为其中的样本转化率p服从同一Beta分布,将稀疏样本进行合并计算;并在同一区间不同维度(如广告商、广告类型、广告等)下的样本集Unm进行样本矩估计生成对应的分布参数即多维度离线匹配结果并将其保存在hive表中,如intervaln-广告商m-αnm_βnm;
|Unm|为样本集所含样本数;本发明不对维度进行限制,可依据算力及效果自由对维度数进行缩放;
(4)验证集多维度信息生成:
针对验证集中的样本进行t分钟内行为回溯,获取valid pctrij对应的t分钟内用户i对广告j的曝光量expoij与点击量clkij,认为其为服从概率为p的二项分布;基于二项分布与Beta分布共轭,对样本匹配valid pctrij对应多维度匹配结果αmm和βnm计算多维度信息
并传入校准模块;针对验证集中的样本进行t分钟内如时间、该周期内不同维度下样本转化率等特征进行回溯并传入校准模块;
三、实时更新模块:
获取实时登录的用户i及广告候选集中广告j相应的t分钟内曝光量expoij与点击量clkij,匹配预估模块生成的test pctrij对应的多维度匹配结果αnm和βnm并实时计算多维度信息并传入校准模块;
该多维度信息可对实时转化率相同的样本在多维度下进行有效区分,尤其对于新上线广告进行稳定的信息评估;如广告A实时曝光10次点击1次,广告B实时曝光100次点击10次,通过所述方式可得到多维度下广告B优于广告A的信息,且在不同维度下B较A高的程度不同;
获取实时登录的用户i及广告候选集中广告j相应的t分钟内如时间、该周期内不同维度下样本转化率等特征并传入校准模块;
该多维度信息可对实时广告的优劣情况进行信息补充,能有效调整自然日内不同时间段不同广告的ctr校准结果;
四、校准模块:
(1)校准模型训练:
拼接预估模块验证集近t2日用户i广告j相应的模型特征、预估模块验证集pctr模型预测结果及匹配模块验证集多维度信息使用深度模型进行校准模型训练,本发明不限制深度模型结构;该模型在较为接近真实值的pctr预测结果基础上,补充了多维度的信息,且与pctr模型使用不同的数据,因此能得到更为准确且稳定的校准结果;
(2)pctr在线校准:
拼接预估模块实时登录的用户i及广告候选集中广告j相应的模型特征、预估模块实时pctr模型预测结果及实时更新模块实时的多维度信息,利用上述校准模型进行pctr校准,最终得到校准后的ctr排序,依据ctr*bid(广告收益)的大小对广告进行在线展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼电子商务有限公司,未经天翼电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111471942.4/1.html,转载请声明来源钻瓜专利网。