[发明专利]一种移动广告平台寻找相似用户的方法有效
申请号: | 201610488630.7 | 申请日: | 2016-06-24 |
公开(公告)号: | CN106204103B | 公开(公告)日: | 2018-08-10 |
发明(设计)人: | 李百川;陈第;李展铿;蔡锐涛;甄勇 | 申请(专利权)人: | 有米科技股份有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 黄磊;陈宏升 |
地址: | 510006 广东省广州市番*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开的一种移动广告平台寻找相似用户的方法,包含以下步骤:首先根据训练用户过滤之后的安装列表以及标签训练出一个L2正则的逻辑回归模型。对于一个新的用户安装列表,利用训练出的逻辑回归模型得到一个[0,1]之间的预测值,表示其为相似用户的概率。接着计算该用户安装列表中付费应用数,基本应用占比,平均付费价格特征,将这些特征与上一步的逻辑回归模型结果组合在一起,再训练出一个GBDT模型,最终预测用户是否为相似用户。本发明的方法,在较小计算量下,根据客户提供的种子用户,准确的将相似用户扩展出来。 | ||
搜索关键词: | 一种 移动 广告 平台 寻找 相似 用户 方法 | ||
【主权项】:
1.一种移动广告平台寻找相似用户的方法,其特征在于,包含以下步骤:(1)目标App的开发者提交目标App现有的种子用户设备号列表;(2)获取目标App的非相似用户设备号列表;(3)利用系统级别的API获取到移动用户的App安装包列表;(4)安装包过滤:计算移动用户每个App的设备覆盖率,将设备覆盖率大于阈值M或者小于阈值N的App从App安装包列表里面剔除;其中阈值M、N根据实际需求设定,M大于N;(5)采用bag‑of‑words方法将移动用户安装包列表中剩下的app表达成1/0特征;(6)根据用户特征、种子用户设备号列表和非相似客户设备号列表,训练一个逻辑回归模型;所述逻辑回归模型是一种线性分类模型,逻辑回归模型在线性回归的基础上,套用一个逻辑函数来得到最后的概率描述,逻辑回归通过优化方法极小化以下损失函数:
其中m为样本总数,xi,yi分别为第i个样本的特征和标签,hθ(xi)为逻辑回归函数;带L2正则的逻辑回归极小化以下损失函数:
其中m为样本总数,Xi,yi分别为第i个样本的特征和标签,w和c分别为模型的特征权重和偏置项,C为正则化项和误差的权重系数;(7)计算移动用户的三种特征:安装的基本应用比例、付费应用数、平均付费价格;(8)将逻辑回归模型的输出以及所述移动用户的三种特征作为输入,再训练出GBDT分类模型;(9)对候选集的每个移动用户,通过获取该移动用户的App安装列表,并将App安装列表表达成一个bag‑of‑words向量,先输入到逻辑回归模型中进行一遍预测,再加入用户安装的基本应用比例、付费应用数、平均付费价格这三个特征输入到GBDT模型中进行预测,从而预测该用户是否为种子用户的相似用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于有米科技股份有限公司,未经有米科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610488630.7/,转载请声明来源钻瓜专利网。
- 上一篇:信息处理方法、终端及服务器
- 下一篇:一种移动终端支付装置