[发明专利]实现时序特征抽取的方法及装置在审
申请号: | 202010534425.6 | 申请日: | 2020-06-12 |
公开(公告)号: | CN113806353A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 包新启;陈迪豪;陈靓;王太泽 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458;G06F16/27;G06N20/00 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 王明远 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了一种实现时序特征抽取的方法及装置。获取输入的数据表;若时间窗口长度与数据表中全量数据的时间字段对应的总时间范围的时间长度的比值低于阈值,则将总时间范围拆分为多个时间片,时间窗口用于表征对单条数据进行时序特征抽取时需要依赖的数据的时间范围,时间片的时间宽度大于或等于2倍时间窗口长度;按照主键和时间片将数据表中的数据划分到多个区块中,每个区块对应一个时间片,并且同一区块中数据的主键相同;将多个区块分配给多个计算节点进行时序特征抽取处理。由此,通过按照主键和时间片对数据进行分区,使得原本倾斜的大数据量分区数据能够被拆分到多个均衡数据量的分区,并且可以解决因主键数量较少而导致的数据倾斜问题。 | ||
搜索关键词: | 实现 时序 特征 抽取 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010534425.6/,转载请声明来源钻瓜专利网。