[发明专利]特征聚合的方法及装置在审
申请号: | 201910618663.2 | 申请日: | 2019-07-09 |
公开(公告)号: | CN110310161A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 张浩 | 申请(专利权)人: | 西安点告网络科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 徐丽 |
地址: | 710000 陕西省西安市高新区天谷八路1*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网格 广告特征 特征组 聚合 二维坐标系 特征信息 广告 广告技术领域 预估 特征样本 点击率 访问量 同列 输出 智能 同行 | ||
本发明实施例提供一种特征聚合的方法及装置,涉及智能广告技术领域,用以解决现有技术中存在的特征样本过少,从而导致预估的准确性较低的问题。本方案为:获取广告的特征信息,特征信息包括广告的访问量PV和点击率CTR;在二维坐标系中根据广告的PV和CTR确定广告特征点;对二维坐标系划分形成M*N个网格,以使得落入每列的PV的总和相同且落入同列的每个网格的PV的总和相同,或者以使得落入每行的PV的总和相同且落入同行的每个网格的PV的总和相同;根据M*N个网格输出聚合后的特征组,每个特征组的PV为落入每个网格的广告特征点的PV之和,每个特征组的CTR为落入每个网格的广告特征点的CTR之和;其中,M和N是大于或等于2的整数。
技术领域
本发明涉及智能广告技术领域,具体涉及一种特征聚合的方法及装置。
背景技术
需求方平台(英文全称:DemandSidePlatform,简称:DSP)是一个系统,也是一种在线广告平台,汇集了各种广告交易平台(Advertisement Exchange)的库存。
DSP服务于广告主,对接ADX的流量,集合了众多小媒体的流量,这样使得广告的点击率很低,数据比较稀疏,直接采用这些点击率进行预估时,会导致预估的准确率较低。因此,需要先解决特征样本过少的问题。
目前均是通过特征聚合的方式实现降维,从而增加样本数量。现有技术中采用的K-means算法进行特征聚合,聚合的特征组的特征数量无法控制,使得聚合的特征组的特征数量可大可小,这样有些特征组的特征数量仍然较少,从而导致预估的准确性依然很低。
发明内容
本发明的实施例提供一种特征聚合的方法及装置,解决现有技术中存在的特征样本过少,从而导致预估的准确性较低的问题。
为达到上述目的,本发明的实施例采用如下技术方案:
本发明实施例的第一方面,提供一种特征聚合的方法,所述方法包括:获取广告的特征信息,所述特征信息包括广告的访问量PV和点击率CTR;在二维坐标系中根据所述广告的PV和CTR确定广告特征点;对所述二维坐标系划分形成M*N个网格,以使得落入每列的PV的总和相同且落入同列的每个网格的PV的总和相同,或者以使得落入每行的PV的总和相同且落入同行的每个网格的PV的总和相同;根据所述M*N个网格输出聚合后的特征组,每个特征组的PV为落入每个网格的所述广告特征点的PV之和,每个特征组的CTR为落入每个网格的所述广告特征点的CTR之和;其中,所述M和N是大于或等于2的整数。
在一个实施例中,所述对所述二维坐标系划分形成M*N个网格,包括:按照从小到大的顺序对广告特征点中的PV排序;按照PV将所述二维坐标系中的X轴划分N列,每列的PV的总和相同;按照CTR分别将所述N列中的每列划分为M行,同列的每个格子的PV的总和相同。
在一个实施例中,所述对所述二维坐标系划分形成M*N个网格,包括:按照从小到大的顺序对广告特征点中的CTR排序,按照CTR值将所述二维坐标系中的Y轴划分为M行,每行的CTR的总和相同;按照PV分别将所述M行中的每行划分为N列,同行的每个格子的PV的总和相同。
在一个实施例中,所述方法还包括:根据CTR预估模型的权重验证聚合结果。
在一个实施例中,所述根据CTR预估模型的权重验证聚合结果,包括:当CTR预估模型的权重和所述聚合结果不一致时,调整M和N的大小,直到所述CTR预估模型的权重和所述聚合结果保持一致。
在一个实施例中,所述M为20,所述N为5。
本发明实施例的第二方面,提供一种广告点击率预估的方法,所述方法包括:通过第一方面所述的方法生成聚合后的特征组;根据所述聚合后的特征组训练点击率预估模型;根据训练后的点击率预估模型预估待投放广告的点击率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安点告网络科技有限公司,未经西安点告网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910618663.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用户服务评估方法、装置、服务器及存储介质
- 下一篇:样本生成的方法及装置