[发明专利]一种结合相邻位置及双历史序列的CTR位置消偏方法在审
申请号: | 202211038536.3 | 申请日: | 2022-08-29 |
公开(公告)号: | CN115564511A | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 韩弘炀;傅剑文;陈心童;章建森;周文彬 | 申请(专利权)人: | 天翼电子商务有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/9535;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100037 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 相邻 位置 历史 序列 ctr 偏方 | ||
本发明公开了一种结合相邻位置及双历史序列的CTR位置消偏方法。本专利针对推荐系统中消除位置偏置,提出一种结合相邻位置及双历史序列的CTR位置消偏方法,在模型结构中引入样本物料相邻位置、相邻位置物料及其边信息和相邻位置物料结合历史序列的信息,用于消除位置偏置,使得模型效果更为准确。在此基础上利用用户历史正负反馈信息,能更充分地学习用户偏好及厌恶的信息,提高模型效果。并设计了独立网络学习,能够剥离位置因素对结果的影响,便于实际模型推断时使用以及线上更灵活地部署。
技术领域
本发明涉及推荐系统领域,特别涉及一种结合相邻位置及双历史序列的CTR位置消偏方法。
背景技术
千人千面的推荐形式已在电商、视频、新闻等许多生活中的场景发挥其作用,通过智能化的结果展示将众多的信息精挑细选发放给用户,让用户能看到自身更感兴趣的物品。推荐模型是基于学习用户在场景中的交互数据来判断用户对推荐物品的喜好,从而为用户推荐其满意的物品。然而,用户的交互数据受到整体展示环境的影响,例如,第3位的物料相比第6位更容易被关注,用户历史有交互的物料与第3位较为相关但与前2位相关性不大而更容易忽略前2位物料。因此,用户点击行为源于用户对该物料更感兴趣以及该物料的展示位置及环境能让用户关注到该物料。但当前大多数推荐系统仅针对用户的兴趣,因此导致存在因位置信息产生的预测偏差。即便少量场景考虑了位置因素,也仅仅考虑了物料对应的位置信息,并未考虑结合用户历史行为序列信息下物料相邻位置及其展示物料对该物料的影响。
本专利针对这一实际背景,提出了一种结合相邻位置及双历史序列的CTR位置消偏方法,能够有效利用用户历史反馈信息及相邻环境信息消除预测偏差,提高推荐准确性,并且能够在模型结构层面分离位置因素的计算,便于实际模型推断时使用以及线上更灵活地部署。
发明内容
本发明要解决的技术问题是克服现有技术的缺陷,提供一种结合相邻位置及双历史序列的CTR位置消偏方法。
本发明提供了如下的技术方案:
本发明提供一种结合相邻位置及双历史序列的CTR位置消偏方法,包括以下:
一、采集模块:
利用流技术对用户在推荐场景下的曝光和点击数据进行采集并存储至hive中记为table;利用SQL对数据中曝光但并未点击的样本打标为0,点击的样本打标为1,得到第i个样本标签yi并拼接物料展示位置posi和相邻物料位置集合物料及其边信息(如物料类别等)itemi和相邻物料及其边信息集合其他属性xi;该用户u历史t日内最多m条点击序列及曝光未点击序列应当指出的是,数据采集技术及存储形式包括但不限于以上所述方式;
二、相邻位置信息提取模块:
1)embedding转化
对于table中的样本,将物料展示位置posi、展示页面中相邻物料位置集合物料及其边信息itemi、展示页面中相邻物料及边信息集合正反馈序列和负反馈序列分别转化为对应的embedding形式pembi、iembi、和
2)正负反馈序列pooling计算
对于样本i的物料及其边信息,计算其与正负反馈序列pooling,得到根据该用户历史反馈信息对于该物料及其边信息相应的偏好与厌恶信息池化pospoolu,i和negpoolu,i,其中S(·)为输出维度为1的MLP网络;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼电子商务有限公司,未经天翼电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211038536.3/2.html,转载请声明来源钻瓜专利网。