[发明专利]信息点击预测中的特征构建方法、信息投放方法和装置有效
申请号: | 201611152416.0 | 申请日: | 2016-12-14 |
公开(公告)号: | CN108229986B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 刘梦思;刘鹤;赵丽丽;吴宇;肖磐姿;李定 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;贾允 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 点击 预测 中的 特征 构建 方法 投放 装置 | ||
1.一种信息点击预测中的特征构建方法,其特征在于,所述方法包括:
从配置的数据源获取数据,并进行数据的解读;
对解读后数据进行数据清洗,获得用户行为数据;
根据所述用户行为数据,构建用户行为宽表得到统计层数据;
根据统计层数据,构建用户画像数据,并将所述用户画像数据作为信息点击行为用户数据;
加载所述信息点击行为用户数据进行模型训练得到两个及以上的树模型;所述两个及以上的树模型中相互树模型之间存在时间先后顺序;在所述两个及以上的树模型中,前面的树模型用于进行大多数信息点击行为用户数据的模型训练数据的特征区分,后面的树模型用于对经过前面的树模型且存在着较大残差的样本进行特征区分;
通过所述两个及以上的树模型得到所述用户行为数据分别对应于每一树模型的特征,所有树模型对应的特征形成用户特征向量;所述用户行为数据在每个所述树模型遍历所得的叶子节点位置是唯一的,所述用户特征向量是基于对遍历所有树模型所得的叶子节点位置进行哈希编码所确定,所述用户行为数据在每个树模型的叶子节点位置对应映射一个维度的特征,遍历N个数模型得到用户行为数据的N维用户特征向量,其中N为大于等于2的整数;
存储所述用户特征向量,所述用户特征向量被用于相应用户的信息点击预测。
2.根据权利要求1所述的方法,其特征在于,所述加载所述信息点击行为用户数据进行模型训练得到两个及以上的树模型,包括:
进行所述信息点击行为用户数据的数据格式处理得到模型训练数据;
对所述模型训练数据进行GBDT模型训练得到两个及以上的树模型。
3.根据权利要求2所述的方法,其特征在于,所述通过所述两个及以上的树模型得到用户行为数据分别对应于每一树模型的特征,所有树模型对应的特征形成用户特征向量,包括:
在通过所述模型训练数据进行模型训练得到的两个及以上的树模型中,逐一进行所述用户行为数据在所述树模型的遍历得到所述用户行为数据在每一树模型的叶子节点位置;
根据所述用户行为数据在所有树模型的叶子节点位置得到相应用户行为数据对应于每一树模型的特征,所有树模型对应的特征形成用户特征向量。
4.根据权利要求3所述的方法,其特征在于,所述根据所述模型训练数据在所述树模型的叶子节点位置得到相应用户行为数据对应于每一树模型的特征,所述树模型对应的特征形成用户特征向量,包括:
根据所述用户行为数据在所述树模型的叶子节点位置进行编码,得到相应用户行为数据在一个维度的特征,对应于所有树模型的特征形成多个维度的用户特征向量。
5.一种信息投放方法,其特征在于,所述方法包括:
接收用户的个性化信息投放请求;
根据所述个性化信息投放请求中指示的用户,从配置的数据源获取数据,并进行数据的解读;
对解读后数据进行数据清洗,获得用户行为数据;
根据所述用户行为数据,构建用户行为宽表得到统计层数据;
根据统计层数据,构建用户画像数据,并将所述用户画像数据作为信息点击行为用户数据;
根据所述信息点击行为用户数据得到相应用户行为数据的用户特征向量,所述用户特征向量是所述相应用户行为数据通过自身训练的两个及以上的树模型输出的;所述两个及以上的树模型中相互树模型之间存在时间先后顺序;在所述两个及以上的树模型中,前面的树模型用于进行大多数信息点击行为用户数据的模型训练数据的特征区分,后面的树模型用于对经过前面的树模型且存在着较大残差的样本进行特征区分;所述用户行为数据在每个所述树模型遍历所得的叶子节点位置是唯一的,所述用户特征向量是基于对遍历所有树模型所得的叶子节点位置进行哈希编码所确定,所述用户行为数据在每个树模型的叶子节点位置对应映射一个维度的特征,遍历N个数模型得到用户行为数据的N维用户特征向量,其中N为大于等于2的整数;
通过所述用户特征向量进行所述用户对个性化信息的信息点击预测得到待投放的个性化信息;
向所述用户请求的个性化信息投放页面投放所述个性化信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611152416.0/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置