[发明专利]基于跨平台异构数据及行为上下文的CTR预估方法及系统在审
| 申请号: | 202011545280.6 | 申请日: | 2020-12-24 |
| 公开(公告)号: | CN112559877A | 公开(公告)日: | 2021-03-26 |
| 发明(设计)人: | 高茜;李继鹏 | 申请(专利权)人: | 齐鲁工业大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/46;G06K9/62;G06N3/04;G06N3/08;G06T3/40 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
| 地址: | 250353 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 平台 数据 行为 上下文 ctr 预估 方法 系统 | ||
本发明公开了一种基于跨平台异构数据及行为上下文的CTR预估方法及系统,属于大数据及自然语言处理领域,本发明要解决的技术问题为如何对用户兴趣进行深度挖掘,提高点击率预估精度,技术方案为:数据采集及预处理:采集不同平台的异构数据,对用户跨平台异构数据进行数据预处理;预估用户实时兴趣:通过注意力机制将跨平台异构数据进行融入,即将用户行为通过注意力机制与当下行为联系起来,更好的预估用户的实时兴趣;提取图片特征:通过残差网络对待推荐物品进行图片特征提取,再将所有特征向量进行拼接;获取CTR精准预估结果:将拼接后的图片特征向量作为MLP网络的输入,通过MLP网络进行高阶特征提取和最终结果的预估,得到物品CTR的精确预估。
技术领域
本发明涉及大数据及自然语言处理领域,具体地说是一种基于跨平台异构数据及行为上下文的CTR预估方法及系统。
背景技术
点击率(Click-through Rate,CTR)是指某一内容被点击次数与被展示次数的比例,一般用于描述内容被用户点击的概率。CTR预估,是指通过一系列相关数据与技术去预测特定场景下物品或内容被用户点击的概率。
在内容推荐和在线广告领域,由于预估的CTR可以很好地反映特定场景下用户对内容的偏好程度,进而根据预估CTR的大小对推荐内容进行合理的排序、截断,形成更符合用户偏好和行为习惯的推荐列表,最终达到提高用户对应用的喜爱程度、使用时长或者提高应用内广告的变现效率等目的。因此,如何提高CTR预估的准确性已经成为各大企业在内容推荐、在线广告等领域最为核心及关键的研究课题。
鉴于CTR预估在内容推荐、在线广告等互联网应用领域的独特地位,越来越多的企业投入大量的人力物力在CTR预估模型的研究上。目前在计算机视觉、自然语言处理领域不断发展的深度学习技术,凭借其在大数据集下良好的并行处理能力和对高阶复杂特征的高效挖掘、抽象能力,也逐步成为CTR预估模型领域的热门研究内容。故如何对用户兴趣进行深度挖掘,提高点击率预估精度是目前现有技术中亟待解决的问题。
发明内容
本发明的技术任务是提供一种基于跨平台异构数据及行为上下文的CTR预估方法及系统,来解决如何对用户兴趣进行深度挖掘,提高点击率预估精度的问题。
本发明的技术任务是按以下方式实现的,一种基于跨平台异构数据及行为上下文的CTR预估方法,该方法具体如下:
数据采集及预处理:采集不同平台的异构数据,对用户跨平台异构数据进行数据预处理;
预估用户实时兴趣:通过注意力机制将跨平台异构数据进行融入,即将用户行为通过注意力机制与当下行为联系起来,更好的预估用户的实时兴趣,从而提高CTR预估的准确性;
提取图片特征:通过残差网络(ResNet)对待推荐物品进行图片特征提取,再将所有特征向量进行拼接;
获取CTR精准预估结果:将拼接后的图片特征向量作为MLP网络(多层全连接网络)的输入,通过MLP网络进行高阶特征提取和最终结果的预估,优势互补,得到物品CTR的精确预估。
作为优选,数据采集及预处理具体如下:
构建基本特征:根据硬件设备或手机APP获取到的基本上下文信息及用户信息构建离散特征和连续性数据特征;
特征转化:通过Embedding层将采集到的用户离散特征转变为低维实数向量,缓解稀疏性;具体如下:
对于任意一个特征featurei,Embedding层通过不断训练更新为featurei的所有可能取值建立一个稠密向量映射表ei,具体如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011545280.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





