[发明专利]样本生成的方法及装置有效
申请号: | 201910619034.1 | 申请日: | 2019-07-09 |
公开(公告)号: | CN110310162B | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 张浩 | 申请(专利权)人: | 西安点告网络科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 宋朋飞 |
地址: | 710000 陕西省西安市高新区天谷八路1*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 生成 方法 装置 | ||
本发明实施例提供一种样本生成的方法及装置,涉及智能广告技术领域,解决现有技术中在进行广告转化率预估时,出现的正样本数量较少,难以获得良好的训练模型,从而导致预估出的转化率的准确性较低的问题。该方法包括:获取广告展示生成的至少三组历史日志数据,历史日志数据包括曝光数据、点击数据以及转化数据;根据曝光数据、点击数据以及转化数据分别确定每两组历史日志数据间的相对样本关系;根据每两组历史日志数据间的相对样本关系生成正负样本集。
技术领域
本发明涉及智能广告技术领域,具体涉及一种样本生成的方法及装置。
背景技术
随着互联网的不断发展,人们在浏览相同页面时可以看到不同的广告,实现了广告的个性化展示。
广告平台在投放广告之前,考虑到各方面(包括用户、广告主及广告平台)的受益情况,需要对待投放广告进行排序,对广告进行排序主要依据是广告的预估转化率与广告出价的乘积。因此,广告转化率预估的准确性直接影响到排序结果。
现有的广告平台目前是直接通过impression(展示)到conversion(转化)进行建模,由于广告转化的数量远远小于展示的数量,因此直接通过展示数据进行建模预估广告转化率,会丢失掉大量的信息,无法保证有足够多的正样本,难以获得良好的训练模型,从而导致预估出的转化率的准确性较低,影响广告排序结果。
发明内容
本发明的实施例提供一种样本生成的方法及装置,解决现有技术中在进行广告转化率预估时,出现的正样本数量较少,难以获得良好的训练模型,从而导致预估出的转化率的准确性较低的问题。
为达到上述目的,本发明的实施例采用如下技术方案:
本发明实施例的第一方面提供一种样本生成的方法,所述方法包括:
获取广告展示生成的至少三组历史日志数据,所述历史日志数据包括:曝光数据、点击数据以及转化数据;根据所述曝光数据、点击数据以及转化数据分别确定每两组历史日志数据间的相对样本关系;根据所述每两组历史日志数据间的相对样本关系生成正负样本集。
在一个实施例中,所述根据所述曝光数据、点击数据以及转化数据确定每两组历史日志数据间的相对样本关系,包括:依次按照转化数据、点击数据以及曝光数据的顺序分别确定每两组历史日志数据间的相对样本关系。
在一个实施例中,所述据所述曝光数据、点击数据以及转化数据确定每两组历史日志数据间的相对样本关系,包括:根据每组历史日志数据的特征值来确定每两组历史日志数据间的相对样本关系,所述特征值为每组历史数据中的曝光数据、点击数据以及转化数据之和。
在一个实施例中,所述根据所述曝光数据、点击数据以及转化数据分别确定每两组历史日志数据间的相对样本关系,包括:
依次按照转化数据、点击数据以及曝光数据的顺序分别确定每两组历史日志数据中各组历史日志数据的虚拟点击值;根据所述各组历史日志数据的虚拟点击值确定每两组历史日志数据间的相对样本关系。
在一个实施例中,根据所述每两组历史日志数据间的相对样本关系生成正负样本集,包括:对所述每两组历史日志数据间的相对样本关系进行聚合得到每组历史日志数据的聚合值,所述聚合值包括曝光数据之和以及虚拟点击值之和;根据所述每组历史日志数据的聚合值生成正负样本集。
本发明实施例的第二方面,提供一种广告转化率预估的方法,所述方法包括;通过第一方面所述的方法生成正负样本集;根据所述正负样本集训练转化率预估模型;根据训练后的转化率预估模型预估待投放广告的转化率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安点告网络科技有限公司,未经西安点告网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910619034.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:特征聚合的方法及装置
- 下一篇:一种精准制定营销策略的方法、设备及可读介质