[发明专利]用于广告异常流量检测的方法和装置在审
| 申请号: | 202011536419.0 | 申请日: | 2020-12-23 | 
| 公开(公告)号: | CN114663121A | 公开(公告)日: | 2022-06-24 | 
| 发明(设计)人: | 苏同;郭田奇;李诚;刘崴;李响 | 申请(专利权)人: | 华扬联众数字技术股份有限公司 | 
| 主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/18;G06F16/2458 | 
| 代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 杨锡劢;赵磊 | 
| 地址: | 100085 北京市海*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 用于 广告 异常 流量 检测 方法 装置 | ||
1.一种用于广告异常流量检测的方法,包括:
获取在历史时间段内的历史广告日志数据,其中,所述历史广告日志数据包括在所述历史时间段内至少一个设备参与广告所得到的数据;
基于所述历史广告日志数据,生成特征数据,其中,所述特征数据用于表示广告特征以及参与广告的用户特征;
对所述特征数据进行编码处理,以生成目标训练样本;
基于所述目标训练样本进行机器学习模型训练,以用于广告异常流量检测。
2.根据权利要求1所述的方法,其中,生成所述特征数据包括:
按照所述至少一个设备的设备标识对所述历史广告日志数据进行组织,以确定有效日志数据;
基于所述有效日志数据,生成所述特征数据。
3.根据权利要求2所述的方法,其中,确定所述有效日志数据包括:
按照所述至少一个设备的设备标识对所述历史广告日志数据进行组织,生成基础日志数据;
从所述基础日志数据中去除无效日志数据,得到所述有效日志数据,其中,所述无效日志数据表示设备参与广告竞价但未产生曝光和点击操作。
4.根据权利要求2所述的方法,其中,所述有效日志数据包括与所述至少一个设备相关联的用户标识信息,所述特征数据包括用户特征信息,其中,所述用户特征信息包括与所述至少一个设备相关联的用户特征;
生成所述特征数据包括:
从数据管理平台获取用户标签数据;
将所述用户标签数据与所述用户标识信息进行关联,生成所述用户特征信息。
5.根据权利要求2所述的方法,其中,所述特征数据包括广告数据和上下文信息,其中,所述广告数据包括广告属性,所述上下文信息包括广告操作特征;
生成所述特征数据包括:
从所述有效日志数据中提取所述广告数据和所述上下文信息。
6.根据权利要求1所述的方法,其中,所述特征数据用于表示多个特征,所述多个特征包括适于统计分析的第一类特征以及除了所述第一类特征之外的第二类特征;
对所述特征数据进行编码处理,以生成目标训练样本,包括:
对所述第一类特征进行统计分析,生成一组统计特征;
对所述一组统计特征和所述第二类特征进行编码,得到原始训练样本;
从所述原始训练样本中抽取至少一部分样本作为所述目标训练样本。
7.根据权利要求6所述的方法,其中,所述原始训练样本包括正样本和负样本,其中,所述正样本和所述负样本是基于从分布式无效流量过滤器获得的无效流量过滤列表来区分的,所述无效流量过滤列表包括被所述分布式无效流量过滤器的成员标记为产生无效流量的设备信息;
从所述原始训练样本中抽取至少一部分样本作为所述目标训练样本,包括:
从所述正样本和所述负样本中抽取目标正样本和目标负样本,其中,所述目标训练样本包括所述目标正样本和所述目标负样本,所述目标正样本与所述目标负样本之间的比例是预定义的。
8.根据权利要求7所述的方法,其中,与所述负样本相关联的设备在所述无效流量过滤列表中被至少两个成员标记为产生无效流量。
9.根据权利要求1所述的方法,其中,基于所述目标训练样本进行机器学习模型训练,包括:
基于所述目标训练样本对至少一个初始机器学习模型进行训练,得到至少一个可用机器学习模型;
对所述至少一个可用机器学习模型进行评估;
从所述至少一个可用机器学习模型中选择评估结果最优的可用机器学习模型,作为用于广告异常流量检测的目标机器学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华扬联众数字技术股份有限公司,未经华扬联众数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011536419.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:曲面块材的残留应力量测方法
- 下一篇:一种近眼显示装置





