[发明专利]一种面向大规模媒体数据的在线广告推荐系统及方法有效
申请号: | 201410148218.1 | 申请日: | 2014-04-14 |
公开(公告)号: | CN103955842B | 公开(公告)日: | 2017-03-29 |
发明(设计)人: | 糜万军;金俏;李军;李馥岑;邱建刚;杨绪升 | 申请(专利权)人: | 武汉烽火普天信息技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/30 |
代理公司: | 北京捷诚信通专利事务所(普通合伙)11221 | 代理人: | 魏殿绅,庞炳良 |
地址: | 430074 湖北省武汉市东湖开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 大规模 媒体 数据 在线 广告 推荐 系统 方法 | ||
技术领域
本发明涉及计算广告学技术领域,具体来讲是一种面向大规模媒体数据的在线广告推荐系统及方法。
背景技术
利用网站上的广告横幅、文本链接、多媒体等在互联网刊登或发布广告,并通过网络传递到互联网用户的广告运作方式,与传统的四大传播媒体(报纸、杂志、电视、广播)广告相比,互联网广告具有得天独厚的优势,是实施现代营销媒体战略的重要手段。
目前,互联网广告的代表性广告形式为电子商务个性化推荐广告。该广告形式主要通过将用户的浏览历史构建精准匹配表来预测用户可能的点击倾向性。这种广告投放方法是基于文本精确匹配技术的扫描策略,尽管该方法处理速度快,但是其存在模糊识别能力不强、学习能力不足的缺点。近年来,随着媒体数据规模的爆炸式增长以及用户规模的急剧攀升,该缺点引发的问题越来越突出。例如,将随机抽取一天中100万电信运营商客户的浏览数据作为采样,发现浏览器的访问请求地址在2亿7千万条。在这种规模下,几乎无法用传统的精确匹配方式来在线推荐广告。因此,传统的精确匹配查询方式不适合大数据背景下的在线广告推荐。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种面向大规模媒体数据的在线广告推荐系统及方法,具有良好的自学习能力,能在不降低广告预测准确度的前提下,有效提升广告推荐的智能水平,适合大数据背景下的在线广告推荐。
为达到以上目的,本发明提供一种面向大规模媒体数据的在线广告推荐系统,包括广告管理模块、广告检索模块、用户行为挖掘模块、用户行为查询模块、网页管理模块、流量分析模块以及广告调度引擎模块。所述广告调度引擎模块分别与用户端、广告管理模块、流量分析模块连接,用于完成整个广告调度执行的环境引导。所述流量分析模块分别与广告检索模块、用户行为查询模块、网页管理模块之间进行参数交换,并完成广告排序。所述用户行为挖掘模块分别与广告管理模块、用户行为查询模块连接,用于对用户的行为进行分析及预测。所述广告检索模块与广告管理模块连接,用于完成广告数据索引的构建,并对广告数据索引进行检索。所述广告管理模块,用于存储最新的广告投放策略集合。所述用户行为查询模块,用于完成用户行为信息的查询。所述网页管理模块,用于完成网页数据的管理。
在上述技术方案的基础上,所述用户行为挖掘模块包括策略更新部分和行为流检测部分。所述策略更新部分通过在线构造双Buffer动态数据区来完成最新策略的实时更新和并发使用。所述行为流检测部分用于以web服务的形式接收在线日志,并通过建立基于倒排表的索引结构来完成用户行为倾向性的预测。
在上述技术方案的基础上,所述在线日志包含用户的最新点击行为或者搜索行为。
在上述技术方案的基础上,所述索引结构由两部分组成,一部分为分类器级别的信息列表,包含分类器ID、分类器权重、分类器内部的核心参数以及分类器包含的支持向量数量;另一部分为由哈希表构成的倒排索引,所述倒排索引的每一个key代表一个词,value表示包含这个词的支持向量集合。
在上述技术方案的基础上,所述倒排索引的每一个支持向量通过ID进行唯一标识,其中支持向量ID是一个无符号64bit的整数,高32bit用于存储支持向量所在的分类器ID,低32bit用于存储该支持向量在对应的分类器中的相对ID。
本发明还提供一种面向大规模媒体数据的在线广告推荐方法,具有如下步骤:
S1:当用户访问网页时,广告调度引擎模块从用户端获取用户ip、ua、url、region信息,并将所述信息传递给流量分析模块的请求端。
S2:网页管理模块和用户行为查询模块分别从流量分析模块处获取所需的用户参数,并按专家知识权重归并计算,完成用户兴趣的查询和近期行为的理解。
S3:广告检索模块根据广告基础分类体系,联合用户行为挖掘模块在线预测的结果,对广告数据索引进行检索,得到满足投放条件的广告列表。
S4:流量分析模块获取到满足投放条件的广告列表后,完成广告预测排序,并返回给广告调度引擎模块。
S5:广告调度引擎模块将最终的广告排序返回给用户端并进行展示。
在上述技术方案的基础上,步骤S3中,所述用户行为挖掘模块在线预测结果的步骤为:
S31:用户行为挖掘模块对所接收的用户在线日志按照词典进行快速的分词。
S32:依次获取到每一个词,按照其在词典中的词典序,在所建立的索引结构中进行检索,得到包含该词的所有支持向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉烽火普天信息技术有限公司,未经武汉烽火普天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410148218.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种示波器探头螺帽连接机构
- 下一篇:一种用于电力线路的风速测量仪
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置