[发明专利]数据处理方法及装置、电子设备及存储介质在审
申请号: | 202210402486.6 | 申请日: | 2022-04-18 |
公开(公告)号: | CN114861045A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 程天翔 | 申请(专利权)人: | 北京快乐茄信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/04;G06N3/08 |
代理公司: | 北京善任知识产权代理有限公司 11650 | 代理人: | 李梅香;孟桂超 |
地址: | 100193 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 存储 介质 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
将用户的第一特征和/或待推荐的目标项目的的第二特征输入预测模型;
获取所述预测模型中n个子模型基于所述第一特征和/或第二特征输出的n个第一输出值,其中,n为等于或大于2的正整数;
对所述n个第一输出值进行归一化处理,得到n个第二输出值;
对所述n个第二输出值相加后进行归一化处理,得到预测值,其中,所述预测值为预测的所述用户操作所述目标项目的概率值。
2.根据权利要求1所述的方法,其特征在于,所述对所述n个第一输出值进行归一化处理,包括:
获取所述n个子模型的输出值范围;
基于所述输出值范围对所述n个第一输出值进行归一化处理。
3.根据权利要求2所述的方法,其特征在于,所述基于所述输出值范围对所述n个第一输出值进行归一化处理,包括:
基于待生成的预测值的数值范围确定预设范围;
将每一所述子模型的输出值范围与预设范围进行比对;
基于所述输出值范围与预设范围的比对结果,确定每一所述子模型对应的归一化参数;
基于所述归一化参数对所述n个第一输出值进行归一化处理。
4.根据权利要求1所述的方法,其特征在于,所述对所述n个第二输出值相加后进行归一化处理,得到预测值包括:
将所述n个第二输出值相加的和除以n,得到预测值。
5.根据权利要求1所述的方法,其特征在于,所述对所述n个第二输出值相加后进行归一化处理,得到预测值包括:
根据所述n个子模型的预测能力确定所述子模型对应的权重系数;
对基于所述权重系数对所述n个第二输出值加权后相加的值进行归一化处理,得到预测值。
6.根据权利要求1所述的方法,其特征在于,所述对所述n个第一输出值进行归一化处理,包括:
通过sigmoid函数对所述n个第一输出值进行归一化处理。
7.根据权利要求1所述的方法,其特征在于,所述对所述n个第一输出值进行归一化处理,包括:
若检测到所述n个子模型完成对所述第一特征和/或第二特征的处理,则对所述n个第一输出值进行归一化处理。
8.根据权利要求1所述的方法,其特征在于,所述n个子模型包括以下至少之一:因子分解机FM模型、加权域分解机FwFM模型、逻辑回归LR模型、深度神经网络DNN模型、深度兴趣网络DIN模型、循环神经网络RNN模型以及深度交叉网络DCN模型。
9.一种数据处理装置,其特征在于,所述装置包括:
输入单元,用于将用户的第一特征和/或待推荐的目标项目的的第二特征输入预测模型;
获取单元,用于获取所述预测模型中n个子模型基于所述第一特征和/或第二特征输出的n个第一输出值,其中,n为等于或大于2的正整数;
处理单元,用于对所述n个第一输出值进行归一化处理,得到n个第二输出值;对所述n个第二输出值相加后进行归一化处理,得到预测值,其中,所述预测值为预测的所述用户操作所述目标项目的概率值。
10.根据权利要求9所述的装置,其特征在于,所述处理单元,具体用于:
获取所述n个子模型的输出值范围;
基于所述输出值范围对所述n个第一输出值进行归一化处理。
11.根据权利要求10所述的装置,其特征在于,所述处理单元,具体用于:
基于待生成的预测值的数值范围确定预设范围;
将每一所述子模型的输出值范围与预设范围进行比对;
基于所述输出值范围与预设范围的比对结果,确定每一所述子模型对应的归一化参数;
基于所述归一化参数对所述n个第一输出值进行归一化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京快乐茄信息技术有限公司,未经北京快乐茄信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210402486.6/1.html,转载请声明来源钻瓜专利网。