[发明专利]一种模型处理方法及相关产品在审
申请号: | 202111535874.3 | 申请日: | 2021-12-15 |
公开(公告)号: | CN114328993A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 韩瑞东;王建东;刘军宁;齐逸岩;郑昆仑;黄帆 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/435 | 分类号: | G06F16/435;G06F16/9538;G06F16/9535;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈梅君 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 处理 方法 相关 产品 | ||
1.一种模型处理方法,其特征在于,所述方法包括:
获取样本对象的第一对象信息和推荐项候选集;所述推荐项候选集包括L个候选推荐项,以及每个候选推荐项对应的N种反馈行为的预测概率,L、N均为正整数,所述第一对象信息是根据所述样本对象的第一线上请求数据获取的;
调用融合权重模型对所述第一对象信息进行处理,确定所述N种反馈行为的融合权重集合;
根据所述融合权重集合和所述预测概率,从所述L个候选推荐项中选取M个目标推荐项,M≤L;
分别确定每个目标推荐项的预测反馈行为,根据M个预测反馈行为确定反馈奖励;
获取所述样本对象的第二对象信息,所述第二对象信息是根据所述样本对象的第二线上请求数据获取的,所述第一线上请求数据和所述第二线上请求数据分别对应的时间信息不同;
其中,由所述第一对象信息、所述融合权重集合、所述反馈奖励和所述第二对象信息组成的训练样本,用于训练所述融合权重模型,训练后的融合权重模型用于多媒体数据推荐。
2.根据权利要求1所述的方法,其特征在于,所述根据所述融合权重集合和所述预测概率,从所述L个候选推荐项中选取M个目标推荐项,包括:
将待处理候选推荐项的N种反馈行为的预测概率与所述融合权重集合进行加权求和运算,得到所述待处理候选推荐项的推荐分数,所述待处理候选推荐项是所述L个候选推荐项中的一个候选推荐项;
将所述L个候选推荐项的推荐分数按照从大到小的顺序排序,将前M个推荐分数对应的M个候选推荐项作为M个目标推荐项。
3.根据权利要求1所述的方法,其特征在于,待处理目标推荐项是所述M个目标推荐项中的一个目标推荐项,确定所述待处理目标推荐项的预测反馈行为的过程,包括:
获取第一预测策略以及所述第一预测策略的第一被选取概率,获取第二预测策略以及所述第二预测策略的第二被选取概率;所述第一预测策略和所述第二预测策略各不相同;
根据所述第一被选取概率和所述第二被选取概率,为所述待处理目标推荐项从所述第一预测策略和所述第二预测策略中选取目标预测策略;
根据所述目标预测策略,确定所述待处理目标推荐项的预测反馈行为。
4.根据权利要求3所述的方法,其特征在于,所述根据所述目标预测策略,确定所述待处理目标推荐项的预测反馈行为,包括:
按照所述目标预测策略,确定所述待处理目标推荐项的每种反馈行为的模拟概率;
获取多个对象对所述待处理目标推荐项的N种反馈行为的线上反馈概率,以及获取所述多个对象对所述待处理目标推荐项的N种反馈行为的预测反馈概率;
根据每个对象的N个线上反馈概率以及每个对象的N个预测反馈概率,对N个模拟概率进行修正,得到所述待处理目标推荐项的N种反馈行为的目标概率;
将N个目标概率组合为所述待处理目标推荐项的预测反馈行为。
5.根据权利要求4所述的方法,其特征在于,所述确定所述待处理目标推荐项的每种反馈行为的模拟概率,包括:
当所述目标预测策略是第一预测策略时,将所述待处理目标推荐项的每种反馈行为的预测概率,作为所述待处理目标推荐项的每种反馈行为的模拟概率;或者,
当所述目标预测策略是第二预测策略时,分别确定所述待处理目标推荐项的每种反馈行为的反馈概率阈值,根据所述反馈概率阈值分别确定所述待处理目标推荐项的N种反馈行为的反馈概率区间,在N个反馈概率区间分别随机采样,确定所述待处理目标推荐项的每种反馈行为的模拟概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111535874.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种快速驯化富集产电细菌的方法
- 下一篇:连线题目生成方法及系统