[发明专利]一种结合相邻位置及双历史序列的CTR位置消偏方法在审
申请号: | 202211038536.3 | 申请日: | 2022-08-29 |
公开(公告)号: | CN115564511A | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 韩弘炀;傅剑文;陈心童;章建森;周文彬 | 申请(专利权)人: | 天翼电子商务有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/9535;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100037 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 相邻 位置 历史 序列 ctr 偏方 | ||
1.一种结合相邻位置及双历史序列的CTR位置消偏方法,其特征在于,包括以下:
一、采集模块:
利用流技术对用户在推荐场景下的曝光和点击数据进行采集并存储至hive中记为table;利用SQL对数据中曝光但并未点击的样本打标为0,点击的样本打标为1,得到第i个样本标签yi并拼接物料展示位置posi和相邻物料位置集合物料及其边信息(如物料类别等)itemi和相邻物料及其边信息集合其他属性xi;该用户u历史t日内最多m条点击序列及曝光未点击序列应当指出的是,数据采集技术及存储形式包括但不限于以上所述方式;
二、相邻位置信息提取模块:
1)embedding转化
对于table中的样本,将物料展示位置posi、展示页面中相邻物料位置集合物料及其边信息itemi、展示页面中相邻物料及边信息集合正反馈序列和负反馈序列分别转化为对应的embedding形式pembi、iembi、和
2)正负反馈序列pooling计算
对于样本i的物料及其边信息,计算其与正负反馈序列pooling,得到根据该用户历史反馈信息对于该物料及其边信息相应的偏好与厌恶信息池化pospoolu,i和negpoolu,i,其中S(·)为输出维度为1的MLP网络;
同理,对于样本i的相邻物料及其边信息,可得到该用户历史反馈信息对于该相邻物料及其边信息相应的偏好与厌恶信息pospoolu,i和negpoolu,i;
3)相邻位置信息提取
计算每个样本物料的相邻位置对应的注意力分数相邻位置池化nppooli、相邻位置物料及其边信息池化nipooli、相邻位置正反馈序列池化npospooli和相邻位置负反馈序列池化nnegpooli;
concati=concat(pembi,iembi,pospoolu,i,negpoolu,i)
三、模型构建模块
1)位置网络学习
在位置网络中分别输入pembi和nppooli使用同一多层深度网络学习,输出结果分别为presi和npresi,W1,…,WH和B1,…,BH分别表示学习的权重和偏置参数,S(·)为输出维度为1的多层深度网络;
presi=S(pembi,W1,…,WH,B1,…,BH)
npresi=S(nppooli,W1,…,WH,B1,…,BH);
2)其他信息网络学习
将xi转化为对应的embedding形式xembi,在其他信息网络中分别输入iconcati和niconcati使用同一多层深度网络学习,输出结果为iresi和niresi,W’1,…,W’H和B’1,…,B’H分别表示学习的权重和偏置参数;
iconcati=concat(iembi,pospoolu,i,negpoolu,i,xembi)
niconcati=concat(nipooli,npospooli,nnegpooli,xembi)
iresi=S(iconcati,W′1,…,W′H,B′1,…,B′H)
niresi=S(niconcati,W′1,…,W′H,B′1,…,B′H);
四、模型预测模块
在训练时损失函数在推断时仅输入物料及其边信息、正负反馈序列和其他信息,并将推荐结果表result储存在hive中;由接口将推荐接口输出至前端展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼电子商务有限公司,未经天翼电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211038536.3/1.html,转载请声明来源钻瓜专利网。