[发明专利]一种多模型融合的用户属性预测方法在审
申请号: | 202210380743.0 | 申请日: | 2022-04-12 |
公开(公告)号: | CN114820050A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 黎才茂;陈秋红;林昊;侯玉权;李浩 | 申请(专利权)人: | 海南大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N20/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 570228 海*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 融合 用户 属性 预测 方法 | ||
1.一种多模型融合的用户属性预测方法,包括以下步骤:
(1)数据采集:对广告用户的点击浏览历史进行记录,对浏览记录进行数值化处理得到训练样本,并将所述训练集划分为用于训练和测试的训练集和测试集;
(2)特征工程:使用热力图对和特征之间的相关性进行分析,并使用XGBoost算法对各特征进行重要性排名,剔除掉相关性高,并重要性排名较低的特征,实现对特征的筛选;
(3)模型训练:将逻辑回归、随机森林、极限树和XGBoost算法作为Stacking模型第一层的元分类器对数据,使用LightGBM作为Stacking模型第二层的元分类器进行训练,实现多层次、多算法的融合学习;
(4)交叉验证:采用五折交叉验证的方式对模型进行训练,最大程度的减少过拟合;
(5)精度评价:将测试集输入到预测模型中得到预测结果,并得到用户年龄和性别征准确率、召回率、F1值和精确度等性能指标;
(6)消融实验:对Stacking第一层的元分类器逻辑回归、随机森林、极限树和XGBoost算法进行随机组合得到14组对比模型,分别将数据集输入到14个模型中进行训练,结合本方法的模型对比15个模型的准确率、召回率、F1值和精确度等性能指标,验证模型预测的效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南大学,未经海南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210380743.0/1.html,转载请声明来源钻瓜专利网。