[发明专利]一种广告点击率预估模型获取方法与系统在审
申请号: | 201610119769.4 | 申请日: | 2016-03-03 |
公开(公告)号: | CN105787767A | 公开(公告)日: | 2016-07-20 |
发明(设计)人: | 陈海林 | 申请(专利权)人: | 上海珍岛信息技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/30;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 200083 上海市虹*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 广告 点击率 预估 模型 获取 方法 系统 | ||
技术领域
本发明涉及信息预测领域,特别是涉及一种广告点击率预估模型获取方 法与系统。
背景技术
在线广告是互联网的商业模式之一,随着在线推广技术的发展,广告由 “粗放式”投放正在向“精准化”投放转变,这一领域的研究称之为“计算 广告学”。广告的点击率(CTR,Click-Through-Rate)是评价用户对广告的 偏好程度的重要指标,对于广告的精准投放意义重大,因此点击率预估是信 息检索和机器学习等领域研究的热点问题。
搜索广告呈现出数据量大、特征高维稀疏的特点,高维特征中有效信息 (非0值)的维度很低,数据中包含的噪声会对真实信息干扰很大。已有的 方法一般采用人工组合特征的方法来构造有用的特征,但是这种方法效率低 并且不容易扩展,使得大多数CTR预估方法无法高效的在稀疏、高维的广告 数据上获得准确的预估点击率。传统的解决方法是数据降维,如基于奇异值 分解的SVD,抽取特征主成分的PCA,线性判别分析LDA等。但是这些方 法在数据降维的同时,没有考虑广告点击数据呈现用户、查询和广告三维空 间的内在关联,破坏了三者之间的内在联系,信息损失较大,无法精确地进 行广告点击率预估。
发明内容
有鉴于此,本发明的主要目的在于提供一种广告点击率预估模型获取方 法与系统,可以准确地进行广告点击率的预估。
为实现上述目的,本发明提供了一种广告点击率预估模型获取方法,包 括:
获取根据用户、查询关键词、查询结果中被点击的广告以及给定目标用 户和目标查询关键词后,得到的目标查询结果中被点击的目标广告的广告展 示次数的数据生成的历史点击日志数据;
根据所述广告展示次数数据,分别对所述用户、所述查询关键词和所述 广告的数据进行聚类降维,分别得到聚类后的用户数据,聚类后的查询关键 词数据和聚类后的广告数据;
根据所述聚类后的用户数据、聚类后的查询关键词数据和聚类后的广告 数据建立张量;
使用塔克张量分解法对所述张量进行分解,得到所述张量降维后的近似 张量;
根据其他目标属性特征数据和所述近似张量,进行基于径向基函数的支 持向量机学习,得到广告点击率预估模型。
优选地,所述历史点击日志数据包括:
由用户、查询关键词、广告和对应的广告展示次数组成的四元组作为唯 一标识的各广告点击数据。
优选地,所述根据所述广告展示次数数据,分别对所述用户、所述查询 关键词和所述广告的数据进行聚类降维,分别得到聚类后的用户数据,聚类 后的查询关键词数据和聚类后的广告数据包括:
根据所述广告展示次数数据、所述广告数据以及所述查询关键词数据建 立广告与查询关键词关联的第一权重矩阵,根据所述广告展示次数数据、所 述用户数据以及所述查询关键词数据建立用户与查询关键词关联的第二权重 矩阵;
使用K-means方法对所述第一权重矩阵进行针对用户数据的聚类得到聚 类后的用户数据,使用K-means方法对所述第一权重矩阵进行针对查询关键 词数据的聚类得到聚类后的查询关键词数据,使用K-means方法对所述第二 权重矩阵进行针对用户数据的聚类得到聚类后的用户数据。
优选地,所述目标属性特征数据包括:
广告在返回页面的位置数据,广告数量数据、用户年龄数据和用户性别 数据。
优选地,得到广告点击率预估模型后还包括:
根据所述广告点击率预估模型对给定查询关键词后的目标广告的点击率 进行预测。
本发明还提供了一种广告点击率预估模型获取系统,包括:
历史数据获取模块,用于获取根据用户、查询关键词、查询结果中被点 击的广告以及给定目标用户和目标查询关键词后,得到的目标查询结果中被 点击的目标广告的广告展示次数的数据生成的历史点击日志数据;
聚类降维模块,用于根据所述广告展示次数数据,分别对所述用户、所 述查询关键词和所述广告的数据进行聚类降维,分别得到聚类后的用户数据, 聚类后的查询关键词数据和聚类后的广告数据;
张量建立模块,用于根据所述聚类后的用户数据、聚类后的查询关键词 数据和聚类后的广告数据建立张量;
张量降维模块,用于使用塔克张量分解法对所述张量进行分解,得到所 述张量降维后的近似张量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海珍岛信息技术有限公司,未经上海珍岛信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610119769.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:业务请求处理方法及装置
- 下一篇:移动自媒体服务电子商务平台