[发明专利]数据处理方法及装置、计算机可读存储介质、电子设备有效
申请号: | 201811117037.7 | 申请日: | 2018-09-25 |
公开(公告)号: | CN109408583B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 郭继昌 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06N99/00 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开属于大数据技术领域,涉及一种数据处理方法及装置、计算机可读存储介质、电子设备,该数据处理方法包括:获取多个样本数据,各所述样本数据包括一个或多个维度的子样本数据;分别将各所述维度的所述子样本数据划分为多组分箱,并根据所述分箱形成多个单变量分箱决策树;根据多个所述单变量分箱决策树获得与各所述维度对应的目标分箱;将所述目标分箱输入至预测模型,以对所述预测模型进行机器训练。该方法一方面能够消除数据噪音,提高模型的稳定性;另一方面,分箱方法简单,不需要数据挖掘人员具有丰富的业务背景知识;并且通过对数据分箱,减少了大量重复的值,提高了算法的速度。 | ||
搜索关键词: | 数据处理 方法 装置 计算机 可读 存储 介质 电子设备 | ||
【主权项】:
1.一种数据处理方法,其特征在于,包括:获取多个样本数据,各所述样本数据包括一个或多个维度的子样本数据;分别将所述维度的所述子样本数据划分为多组分箱,并根据所述分箱形成多个单变量分箱决策树;根据多个所述单变量分箱决策树获得与所述维度对应的目标分箱;将所述目标分箱输入至预测模型,以对所述预测模型进行机器训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811117037.7/,转载请声明来源钻瓜专利网。