[发明专利]一种时序特征数据表的存储方法及装置在审
| 申请号: | 202011547306.0 | 申请日: | 2020-12-24 |
| 公开(公告)号: | CN112632073A | 公开(公告)日: | 2021-04-09 |
| 发明(设计)人: | 包新启;王太泽;陈迪豪;陈靓;王子贤;邓龙;王豹;孔全;穆妮 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458 |
| 代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 任媛;刘铁生 |
| 地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 时序 特征 数据表 存储 方法 装置 | ||
1.一种时序特征数据表的存储方法,其特征在于,包括:
将时序特征数据表所包括的行数据拆分为多个行数据段,其中,各所述行数据段包括的行数据不重合;
针对每一个所述行数据段分别执行:将所述行数据段涉及的列划分为至少两个列分组,以行存储的形式存储每一个所述列分组所涉及的数据,其中,每一个所述列分组包括至少一列,且各所述列分组中包括的列不重合。
2.根据权利要求1所述的方法,其特征在于,将时序特征数据表所包括的行数据拆分为多个行数据段,包括:
基于所述时序特征数据表包括的时间列的值和主键列的值,将所述时序特征数据表拆分为多个行数据段,其中,同一所述行数据段的各行数据的主键列的值相同,且各行数据的时间列的值包括在特定时间区间内;不同行数据段的各行数据的主键列的值不同或所涉及的特定时间区间不同。
3.根据权利要求1所述的方法,其特征在于,将所述行数据段涉及的列划分为至少两个列分组,包括:
选取至少两种特定时序特征计算,并确定每种所述特定时序特征计算在所述时序特征数据表中所依赖的列集合;
定义至少两个列分组集合,其中,各所述列分组集合中分别包括至少两个列分组;
基于所述至少两个列分组集合以及每种所述特定时序特征计算的列集合,确定每种所述特定时序特征计算在不同列分组集合下的列覆盖度;
基于每种所述特定时序特征计算在不同列分组集合下的列覆盖度,从至少两个列分组集合中选取目标列分组集合;
将所述行数据段涉及的列划分为所述目标列分组集合包括的至少两个列分组。
4.根据权利要求3所述的方法,其特征在于,基于所述至少两个列分组集合以及每种所述特定时序特征计算的列集合,确定每种所述特定时序特征计算在不同列分组集合下的列覆盖度,包括:
在同一列分组集合下,针对每一种所述特定时序特征计算分别执行:确定所述列分组集合中目标列分组的总量,其中,所述目标列分组中包含有所述特定时序特征计算的列集合中的列;将所述总量确定为所述特定时序特征计算在所述列分组集合下的列覆盖度。
5.根据权利要求3所述的方法,其特征在于,基于每种所述特定时序特征计算在不同列分组集合下的列覆盖度,从至少两个列分组集合中选取目标列分组集合,包括:
确定每种所述特定时序特征计算在同一列分组集合下的列覆盖度的总和;
基于不同列分组集合下的列覆盖度的总和,将最小的总和对应的列分组集合选取为所述目标列分组集合。
6.根据权利要求5所述的方法,其特征在于,确定每种所述特定时序特征计算在同一列分组集合下的列覆盖度的总和,包括:
将每种所述特定时序特征计算在同一列分组集合下的列覆盖度分别与每种所述特定时序特征计算的预设权重进行乘积;
将各乘积的加和确定为所述总和。
7.根据权利要求1所述的方法,其特征在于,将所述行数据段涉及的列划分为至少两个列分组,包括:
通过预设接口读取列分组策略,其中,所述列分组策略用于限定如何进行列分组;
基于所述列分组策略,将所述行数据段涉及的列划分为至少两个列分组。
8.一种时序特征数据表的存储装置,其特征在于,包括:
拆分单元,用于将时序特征数据表所包括的行数据拆分为多个行数据段,其中,各所述行数据段包括的行数据不重合;
存储单元,用于针对每一个所述行数据段分别执行:将所述行数据段涉及的列划分为至少两个列分组,以行存储的形式存储每一个所述列分组所涉及的数据,其中,每一个所述列分组包括至少一列,且各所述列分组中包括的列不重合。
9.一种计算机可读存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求7中任意一项所述的时序特征数据表的存储方法。
10.一种存储管理设备,其特征在于,所述存储管理设备包括:
存储器,用于存储程序;
处理器,耦合至所述存储器,用于运行所述程序以执行权利要求1至权利要求7中任意一项所述的时序特征数据表的存储方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011547306.0/1.html,转载请声明来源钻瓜专利网。





