[发明专利]资源推荐方法及装置有效
| 申请号: | 201911398834.1 | 申请日: | 2019-12-30 |
| 公开(公告)号: | CN111143686B | 公开(公告)日: | 2023-07-07 |
| 发明(设计)人: | 文豪 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/242;G06F16/248;G06N3/045;G06N3/08 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 资源 推荐 方法 装置 | ||
本申请公开了一种资源推荐方法及装置,涉及互联网技术领域。具体实现方案为:服务器接收到终端设备发送的推荐请求后,对于召回队列中的每一条资源,分别确定对应资源的交叉特征向量,并利用资源对应资源向量和交叉特征向量和用户向量,分别确定各资源的粗排分,利用粗排分对各资源进行排序从而确定出待推荐资源并推荐给目标用户。采用该种方案,服务器利用加入用户和资源的交叉特征的粗排模型对召回队列召回的资源排序,取得高准确率的同时节约机器,从而达到资源推荐过程中提升准确度的同时节约机器的目的。
技术领域
本申请实施例涉及互联网技术领域,尤其涉及一种资源推荐方法及装置。
背景技术
随着互联网技术的飞速发展,互联网可以为用户提供越来越多的功能,例如,用户可通过应用程序(application,APP)来浏览互联网上的资源,如新闻、资讯、视频、图片等。同时,资源增长呈爆发式的指数型增长,服务器向用户推荐资源时,不得不从海量资源中找到待推荐的资源并推荐给用户。
图1是FEED推荐系统的架构实体图。请参照图1,资源推荐过程中,当用户进行刷新时,触发低层的队列召回资源,每个队列按照一定的规则进行召回,例如:视频队列只召回视频资源,新热队列只召回最新最热资源等。队列召回资源后,会访问粗排服务。粗排服务的作用是将队列召回的资源按照一定目标进行排序。之后,每个队列中TOP N的资源被汇聚到一起,汇聚后的资源再请求精排,进行更加细致的排序,最终将精排后的TOP M的资源推荐给用户。其中,TOP N的资源和TOP M的资源是预估用户最可能点击的资源。
粗排过程中,通常使用的粗排模型包括梯度下降树(Gradient BoostingDecision Tree,GBDT)模型和深度神经网络(Deep Neural Networks,DNN)模型。然而,GBDT模型虽然能够节约机器但准确性较低,而DNN模型的准确性较高但是对机器的消耗多大。因此,粗排过程中,如何兼顾准确性以及节约机器,实为急待解决的问题。
发明内容
本申请实施例提供一种资源推荐方法及装置,利用加入用户和资源的交叉特征的粗排模型对召回队列召回的资源排序,达到资源推荐过程中提升准确度的同时节约机器的目的。
第一方面,本申请实施例提供一种资源推荐方法,包括:接收到终端设备发送的推荐请求后,根据召回方式确定召回队列,所述召回队列包含至少一个资源,所述推荐请求是所述终端设备响应目标用户的刷新指令生成的,对于召回队列中的资源,利用所述资源的资源特征和所述目标用户的用户特征,确定所述资源的交叉特征向量,所述交叉特征向量用于指示所述目标用户与所述资源的匹配程度,将所述资源的交叉特征向量和所述用户的用户向量输入至粗排模型,以得到所述召回队列的资源的粗排分,所述粗排分指示所述目标用户点击所述资源的概率,所述用户向量用于指示所述用户的特征,根据所述召回队列中的资源的粗排分,确定在所述推荐页面待显示的待推荐资源。采用该种方案,服务器利用加入用户和资源的交叉特征的粗排模型对召回队列召回的资源排序,取得高准确率的同时节约机器,从而达到资源推荐过程中提升准确度的同时节约机器的目的。
一种可行的设计中,所述粗排模型包括交叉特征子模型,所述对于召回队列中的资源,利用所述资源的资源特征和所述目标用户的用户特征,确定所述资源的交叉特征向量,包括:对于召回队列中的资源,将所述资源的资源特征和所述目标用户的用户特征,输入至所述交叉特征子模型,运行所述交叉特征子模型,以输出所述资源的交叉特征向量,所述召回队列中资源的资源特征是预先获取到的。采用该种方案,离线算好资源特征,在线时利用资源特征和目标用户的用户特征,即可快速得到交叉特征向量。
一种可行的设计中,所述接收到终端设备发送的推荐请求后,根据召回方式确定召回队列之前,还包括:离线获取资源池中资源的资源特征集合,从所述资源池中确定出所述召回队列中的资源,从所述资源特征集合中确定出所述召回队列中资源的资源特征。采用该种方案,由于资源池中的资源数量庞大,离线算好资源特征,避免在线时计算量大,导致消耗机器过多的弊端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911398834.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:针对甲型肝炎病毒的单域抗体及其衍生蛋白
- 下一篇:一种新闻热度的计算方法





