[发明专利]一种数据分桶方法、装置、电子设备和存储介质在审
申请号: | 201911100853.1 | 申请日: | 2019-11-12 |
公开(公告)号: | CN110955802A | 公开(公告)日: | 2020-04-03 |
发明(设计)人: | 张付伟;洪庚伟;李羽 | 申请(专利权)人: | 微民保险代理有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 孟丽平 |
地址: | 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 方法 装置 电子设备 存储 介质 | ||
本发明实施例涉及一种数据分桶方法、装置和电子设备,所述方法包括:获取数据及其分数;将数据写入当前时间段对应的数据结构,以获得数据的数据有序排列;将数据预先写入下一时间段对应的数据结构,当前时间段和下一时间段以第一时间点为时间分界点;如果当前时间超过第一时间点,则将下一时间段对应的数据结构切换为当前时间段对应的数据结构,以及,获得新的下一时间段对应的数据结构;根据数据有序排列对数据进行数据分桶。本发明实施例分别将数据及其分数写入当前时间段对应的数据结构和下一时间段对应的数据结构。这样当前时间段对应的数据结构中将同时包括前一时间段的数据和当前时间段的数据,基于足够的样本数据能获得准确的分桶结果。
技术领域
本发明实施例涉及数据处理技术领域,特别涉及一种数据分桶方法、装置、电子设备和存储介质。
背景技术
数据分桶是根据数据对应的分数对数据进行分桶处理,把原先一个分数分布不均匀的数据,均匀的分散在设定的桶里面。对数据分桶之前,需先将原始数据按分数排序,获得数据有序排列,然后基于数据有序排列进行数据分桶。
实现本发明过程中,发明人发现:目前的数据分桶方法,不能保证获得足够的样本数据,从而无法获得有效的数据有序排列,进而导致分桶结果不准确。
发明内容
本发明实施例的目的是提供一种数据分桶方法、装置、电子设备和存储介质,能基于足够的样本数据进行数据分桶,从而获得准确的分桶结果。
本发明实施例提供了一种数据分桶方法,所述方法包括:
获取数据及其分数;
将所述数据及其分数写入当前时间段对应的数据结构,以获得所述数据结构中数据的、基于分数的数据有序排列,所述当前时间段对应的数据结构还包括前一时间段的数据;
将所述数据及其分数预先写入下一时间段对应的数据结构,所述当前时间段和所述下一时间段以第一时间点为时间分界点;
如果当前时间超过所述第一时间点,则将所述下一时间段对应的数据结构切换为当前时间段对应的数据结构,以及,获得新的下一时间段对应的数据结构;
根据所述数据有序排列对所述数据进行数据分桶。
在一些实施例中,所述获取数据及其分数,包括:
在应用层获取数据及其分数;
其中,所述数据结构为数据库的数据有序集合,将数据及其分数写入所述数据结构,包括:
通过应用层与数据库接口将所述数据及其分数写入数据库的数据有序集合,以获得数据有序排列。
在一些实施例中,所述通过应用层与数据库接口将所述数据及其分数写入数据库的数据有序集合,包括:
根据所述数据的分数,基于二分值法依次将数据写入所述有序数据集合。
在一些实施例中,在所述获取数据及其分数之后,所述方法还包括:
根据数据类别对所述数据进行分组,以获得所述数据的至少两个分组数据;
所述将所述数据及其分数写入当前时间段对应的数据结构,以获得所述数据结构中数据的、基于分数的数据有序排列,包括:
将所述数据的至少两个分组数据及其对应分数分别写入当前时间段对应的至少两个数据结构,以分别获得基于分数的至少两个数据有序排列;
所述将所述数据及其分数预先写入下一时间段对应的数据结构,包括:
将所述数据的至少两个分组数据及其对应分数分别预先写入下一时间段对应的至少两个数据结构;
所述根据所述数据有序排列对所述数据进行数据分桶,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微民保险代理有限公司,未经微民保险代理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911100853.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种缸体表面无线温度测量检测系统
- 下一篇:一种电动汽车用电池寿命控制方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置