[发明专利]一种基于深度学习的平台相关的广告点击率预测方法在审
申请号: | 202110892442.1 | 申请日: | 2021-08-04 |
公开(公告)号: | CN113689234A | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 王慧琪;姚俊杰 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N3/04;G06N3/08 |
代理公司: | 上海德禾翰通律师事务所 31319 | 代理人: | 夏思秋 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 平台 相关 广告 点击率 预测 方法 | ||
1.一种基于深度学习的平台相关的广告点击率预测方法,其特征在于,包括如下步骤:
步骤一:获取多个平台的广告特征数据和用户行为数据,形成初步的数据集U;
步骤二:筛选和拆分数据集U的所有特征,删去数据收集缺损一半以上的特征,拆分按照能表达含义的最细拆分方式,并对特征数据进行清理及标准化;
步骤三:为每个平台构建点击率预测模型,根据结果准确率从高到低排序,将平台分为两类,训练平台集和测试平台集;
步骤四:通过深度学习模型和元学习模型结合的方式,对训练平台集构建新模型,对测试平台集进行验证;
步骤五:持续收集更多平台数据,进行步骤二所述清理及标准化后,输入现有模型进行训练预测。
2.如权利要求1所述的基于深度学习的平台相关的广告点击率预测方法,其特征在于,步骤一中,所述广告特征数据和用户行为数据包括广告产品、广告商、广告类型、时间戳、设备号、用户点击与否情况。
3.如权利要求1所述的基于深度学习的平台相关的广告点击率预测方法,其特征在于,步骤二中,所述数据集U的特征包括广告编号、用户编号、时间戳、设备号、小时、星期、广告商、广告名、广告大类、广告小类、广告细支、用户点击与否;
和/或,
步骤二中,所述对特征数据进行清洗,包括删除其中离群值的噪声数据,采用平均值填充法补全空值数据;
和/或,
步骤二中,所述数据标准化为将连续特征值标准化为0至1范围内的值,将离散特征值进行独热编码;令表示d维的样本空间,Y={0,1}表示标签空间;新的数据集U由X和Y结对组成,即(X,Y);Y=0;即(X,0)表示用户对该广告没有点击,反之,当Y=1,即(X,1)表示用户点击了。
4.如权利要求1所述的基于深度学习的平台相关的广告点击率预测方法,其特征在于,步骤三中,为每个平台构建点击率预测模型,具体是按平台划分数据集,将每一个子数据集输入神经网络中,学习速率为0.0001,损失代价函数值小于设定阈值时,停止训练模型。
5.如权利要求1所述的基于深度学习的平台相关的广告点击率预测方法,其特征在于,步骤三中,根据每个平台的模型对该平台数据进行验证,按结果准确率从高到低排序,将平台分为两类,训练平台集和测试平台集,平台数各自比例为2∶1。
6.如权利要求1所述的基于深度学习的平台相关的广告点击率预测方法,其特征在于,步骤三中采用DeepFM模型对所有平台分别进行训练,所述DeepFM是双网络组合结构,Deep模块和FM模块有着相同的输入向量和嵌入向量,FM模块得到使用低阶特征组合的点击率预测结果输出,Deep模块得到使用高阶特征组合的点击率预测结果输出,将两个模块的输出结果传入到sigmoid函数,得到最终的点击率预测结果:
评估指标采用AUC,即ROC曲线下方的面积大小,ROC曲线中,横轴为假正例率,纵轴为真正例率;所述假正例率为真实标签为负的样本中,预测为正的样本比例;所述真正例率就是召回率;如果AUC=1,说明模型完全将所有正例排在反例前面;AUC值越高,模型预测的排序质量越佳。
7.如权利要求1所述的基于深度学习的平台相关的广告点击率预测方法,其特征在于,步骤四中,通过深度学习模型和元学习模型结合的方式训练训练平台集数据模型,验证测试平台集数据;具体步骤包括:将每一个训练平台视作一个子任务,每次训练对任务集进行随机抽取,对抽取的子任务集的数据在进行随机选择,通过元学习的方式训练深度学习模型,最终对测试平台集数据进行验证;所述深度学习模型采用五种点击率预测模型,分别是WideDeep、DeepFM、DCN、AutoInt和FiBiNET。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110892442.1/1.html,转载请声明来源钻瓜专利网。