[发明专利]数据处理方法及装置、电子设备及存储介质在审
申请号: | 202210402486.6 | 申请日: | 2022-04-18 |
公开(公告)号: | CN114861045A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 程天翔 | 申请(专利权)人: | 北京快乐茄信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/04;G06N3/08 |
代理公司: | 北京善任知识产权代理有限公司 11650 | 代理人: | 李梅香;孟桂超 |
地址: | 100193 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 存储 介质 | ||
本公开实施例是关于一种数据处理方法及装置、电子设备及存储介质,其中,所述数据处理方法包括:将用户的第一特征和/或待推荐的目标项目的的第二特征输入预测模型;获取所述预测模型中n个子模型基于所述第一特征和/或第二特征输出的n个第一输出值,其中,n为等于或大于2的正整数;对所述n个第一输出值进行归一化处理,得到n个第二输出值;对所述n个第二输出值相加后进行归一化处理,得到预测值,其中,所述预测值为预测的所述用户操作所述目标项目的概率值。
技术领域
本公开涉及计算机技术领域,尤其涉及一种数据处理方法及装置、电子设备及存储介质。
背景技术
目前,在向用户推荐内容的相关方案中,用于预测用户点击率(click-throughrate,CTR)所采用的预测模型往往需要对多种低阶特征及高阶特征进行交互。例如,通常采用的基于神经网络的因子分解机模型(Factorization-Machine based Neural Network,DeepFM)中,包含因子分解机模型(Factorization-Machine,FM)和深度神经网络(DeepNeural Network,DNN)。然而在实际使用中,FM模型和DNN模型对于点击率的预估概率往往具有不同的量纲,导致预测模型中始终有其中一个模型处于主导地位,输出的点击率无法准确符合两个模型交互的多种低阶和高阶特征。
发明内容
本公开实施例提供一种数据处理方法及装置、电子设备及存储介质。
本公开实施例第一方面提供一种数据处理方法,包括:
将用户的第一特征和/或待推荐的目标项目的的第二特征输入预测模型;
获取所述预测模型中n个子模型基于所述第一特征和/或第二特征输出的n个第一输出值,其中,n为等于或大于2的正整数;
对所述n个第一输出值进行归一化处理,得到n个第二输出值;
对所述n个第二输出值相加后进行归一化处理,得到预测值,其中,所述预测值为预测的所述用户操作所述目标项目的概率值。
基于上述方案,所述对所述n个第一输出值进行归一化处理,包括:
获取所述n个子模型的输出值范围;
基于所述输出值范围对所述n个第一输出值进行归一化处理。
基于上述方案,所述基于所述输出值范围对所述n个第一输出值进行归一化处理,包括:
基于待生成的预测值的数值范围确定预设范围;
将每一所述子模型的输出值范围与预设范围进行比对;
基于所述输出值范围与预设范围的比对结果,确定每一所述子模型对应的归一化参数;
基于所述归一化参数对所述n个第一输出值进行归一化处理。
基于上述方案,所述对所述n个第二输出值相加后进行归一化处理,得到预测值包括:
将所述n个第二输出值相加的和除以n,得到预测值。
基于上述方案,所述对所述n个第二输出值相加后进行归一化处理,得到预测值包括:
根据所述n个子模型的预测能力确定所述子模型对应的权重系数;
对基于所述权重系数对所述n个第二输出值加权后相加的值进行归一化处理,得到预测值。
基于上述方案,所述对所述n个第一输出值进行归一化处理,包括:
通过sigmoid函数对所述n个第一输出值进行归一化处理。
基于上述方案,所述对所述n个第一输出值进行归一化处理,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京快乐茄信息技术有限公司,未经北京快乐茄信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210402486.6/2.html,转载请声明来源钻瓜专利网。