[发明专利]信息处理、信息推荐的方法和装置、电子设备和存储介质有效
申请号: | 202110246985.6 | 申请日: | 2021-03-05 |
公开(公告)号: | CN112765477B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 程默;于佃海;马琳;吴志华;董大祥;汤伟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 赵林琳;张曦 |
地址: | 100094 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 信息 推荐 方法 装置 电子设备 存储 介质 | ||
1.一种信息处理方法,包括:
获得树结构的树结构参数,所述树结构用于索引可用于推荐的对象集合;
获得分类器的分类器参数,所述分类器用于从所述树结构的顶层向下逐层预测每层中被用户偏好的概率排序靠前的偏好节点集合,其中一层的偏好节点集合基于其上层的偏好节点集合来确定;以及
基于所述树结构参数和所述分类器参数来构建召回模型,以用于在所述对象集合中确定针对所述用户的候选对象集合,其中所述召回模型是包括所述树结构和所述分类器的整体模型,并且所述树结构参数和所述分类器参数基于输入所述召回模型的训练数据同时被调整;
根据确定所述对象集合中的对象在第二预定时长内被偏好的次数小于阈值次数,从所述对象集合中去除所述对象以获得新对象集合;
基于所述新对象集合来获得新树结构的新树结构参数;以及
基于所述新树结构参数来构建新召回模型;
其中所述用户是第一用户,所述方法还包括:
基于第二用户的历史用户数据,在所述树结构中确定所述第二用户偏好的叶子节点;
确定所述叶子节点在所述树结构中的先辈节点,作为第一节点集合;以及
基于所述第一节点集合,确定用于训练所述召回模型的正样本。
2.根据权利要求1所述的方法,其中获得所述树结构参数包括:
将所述对象集合向量化以生成原始对象向量集合;
基于预训练模型和所述原始对象向量集合,生成在聚类性质上被优化的优化对象向量集合;以及
对所述优化对象向量集合执行聚类来构建所述树结构,以确定所述树结构参数。
3.根据权利要求1所述的方法,其中确定所述正样本包括:
基于所述历史用户数据和所述分类器,确定与所述树结构的顶层以下的多个层相对应的多个层节点子集,每个层节点子集包括在对应层中概率排序靠前的多个节点;
基于所述多个层节点子集的并集,确定第二节点集合;以及
基于所述第一节点集合和所述第二节点集合的交集,获得所述正样本。
4.根据权利要求1所述的方法,还包括:
根据确定用于训练所述召回模型的训练数据中包括不属于所述对象集合的新对象,创建与所述新对象相对应的新叶子节点;以及
将所述新叶子节点插入到所述树结构中。
5.根据权利要求4所述的方法,其中将所述新叶子节点插入到所述树结构中包括:
在所述训练数据中,获得与所述新对象相关联的用户数据;
基于所述用户数据和所述分类器,确定所述树结构中被偏好的概率最大的目标叶子节点;以及
将所述新叶子节点作为所述目标叶子节点的兄弟节点添加到所述树结构中。
6.根据权利要求5所述的方法,其中获得与所述新对象相关联的所述用户数据包括:
根据确定所述新对象与多个用户的多个候选用户数据相关联,基于以下至少一项来确定所述用户数据:
在所述多个候选用户数据中随机选择的一个候选用户数据,
基于所述多个候选用户数据确定的平均候选用户数据,以及
所述多个候选用户数据中与权重最大的用户相对应的候选用户数据。
7.根据权利要求4所述的方法,其中将所述新叶子节点插入到所述树结构中包括:
在所述树结构的次底层中的非叶子节点中随机地确定目标非叶子节点;以及
将所述新叶子节点作为所述目标非叶子节点的子节点添加到所述树结构中。
8.根据权利要求4所述的方法,还包括:
根据确定在第一预定时长内偏好所述新对象的用户数目大于阈值数目,确定所述训练数据中包括所述新对象。
9.根据权利要求1所述的方法,其中所述分类器包括与所述树结构的顶层以下的多个层相对应的多个分类器单元,所述多个分类器单元中的每个分类器单元用于预测对应层中的节点被用户偏好的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110246985.6/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置