[发明专利]一种基于多任务学习机制的点击率预估方法有效

专利信息
申请号: 202110184280.6 申请日: 2021-02-08
公开(公告)号: CN112860998B 公开(公告)日: 2022-05-10
发明(设计)人: 张引;胡荐苛 申请(专利权)人: 浙江大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/2458;G06F16/332;G06Q50/00;G06N3/04;G06N3/08
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 郑海峰
地址: 310058 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 任务 学习 机制 点击率 预估 方法
【权利要求书】:

1.一种基于多任务学习机制的点击率预估方法,其特征在于包括以下步骤:

1)构建具有用户属性和物品属性的数据集,并且定义神经网络模型学习的任务目标:点击率CTR和转换率CVR,其中点击率表示用户对展示物品的点击概率,转换率表示用户在点击展示物品后进一步的行为转换概率;

2)对用户属性和物品属性进行特征提取预处理,对所有特征进行离散化后通过独热编码进行特征向量化表示;另外对于用户浏览过的物品,使用Multi-Hot编码进行向量化;

3)经过步骤2)的特征处理后得到高维稀疏的特征向量表示,对于不同特征域首先使用嵌入池化层进行低维嵌入,得到稠密的向量表示,减少神经网络模型的空间复杂度和训练的时间复杂度;

4)经过步骤3)的嵌入表示后,再构造领域知识训练数据集,在该数据集中,训练样本为物品特征,对应输出为知识的多标签分布;基于该数据集对神经网络模型的专家网络进行预训练,使得其中的Meta-Expert模块具备知识输出的能力;

5)神经网络模型在步骤1)构造的数据集上进行整体训练;其中Meta-Expert模块通过预训练的参数进行初始化设置,并且在训练中进一步更新;而神经网络模型的MoE网络包括了多个Expert模块,在训练中通过门控网络来建模CTR任务和CVR任务的联系,门控信号由Meta-Expert模块进行计算控制;

6)门控网络输出的门控信号和MoE网络的知识输出结果进行加权池化,得到用户的最终兴趣向量表示;

7)神经网络模型最后通过逻辑回归将用户的兴趣向量映射为0-1范围内的数值,用于表示用户对候选物品的感兴趣程度;

8)在线服务时,使用已经训练收敛的神经网络模型,根据输入的用户和物品特征即可输出对应的感兴趣概率值。

2.根据权利要求1所述的一种多任务学习机制的点击率预估方法,其特征在于所述步骤2)中的特征提取预处理采用了Python的Scikit-learn和Numpy工具;所述用户属性包括用户ID、性别、年龄、职业特征域,物品属性包括物品ID、类别、上传时间特征域。

3.根据权利要求1所述的一种基于多任务学习机制的点击率预估方法,其特征在于所述的步骤1)中同时采用学习CTR和CVR两个任务目标。

4.根据权利要求1所述的一种基于多任务学习机制的点击率预估方法,其特征在于所述的步骤3)中,对不同特征域采用不同池化方式,其中对于用户特征域和物品特征域的特征向量进行拼接,而对于用户浏览的物品ID特征进行求和池化。

5.根据权利要求1所述的一种基于多任务学习机制的点击率预估方法,其特征在于,所述的步骤4)中,Meta-Expert模块的结构和MoE网络中的Expert一致,都是采用三层全连接层的深度模型;Meta-Expert的特殊之处在于知识的预训练,使得在步骤1)构建的数据集上整体训练能够指导MoE的知识挖掘过程。

6.根据权利要求1所述的一种基于多任务学习机制的点击率预估方法,其特征在于所述的步骤5)和6)中利用门控网络来学习任务导向的用户兴趣表示,所述步骤6)具体为:

步骤6-1:通过Sigmoid函数得到门控信号,计算公式如下所示:

gi=Sigmoid(W·[hmeta,hi]+b)

其中gi表示步骤5)中所提到的MoE网络中第i个Expert模块的门控信号,W为权重,hmeta为Meta-Expert模块的输出,hi为第i个Expert模块的输出,b为偏差;

步骤6-2:得到门控信号后对MoE网络的输出进行加权池化,计算公式如下所示:

其中z表示最后的兴趣向量输出,m为Expert模块的个数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110184280.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top