[发明专利]一种基于数据特征片段的时间序列数据分类方法有效

专利信息
申请号: 201810843340.9 申请日: 2018-07-27
公开(公告)号: CN110019421B 公开(公告)日: 2023-09-01
发明(设计)人: 胡宇鹏;罗伟;李学庆;徐鹏涛;丁一明 申请(专利权)人: 山东大学
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/28
代理公司: 济南金迪知识产权代理有限公司 37219 代理人: 杨树云
地址: 250101 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于数据特征片段的时间序列数据分类方法,本发明先对具体时间序列训练集中的不同类别中的全体序列进行子类划分,同时选取相应的中心序列,并对每一个子类的中心序列再次利用数据趋势点,按照数据特征的权重排序,优先选择权重较大的数据特征片段,组成数据特征片段集合Shaplets,最后以Shaplets集合为核心,利用相应的Shapelets转换算法完成最终的时间序列分类。本发明极大地提高了Shapelets生成的效率,同时也提升了基于Shapelets进行时间序列分类的算法的整体处理效率。效率提升幅度在3个数量级以上。
搜索关键词: 一种 基于 数据 特征 片段 时间 序列 分类 方法
【主权项】:
1.一种基于数据特征片段的时间序列数据分类方法,其特征在于,包括步骤如下:S1,预设数据趋势点选取率ρ、数据特征片段Shapelets的选取数量阈值Num、数据特征片段Shapelets质量评估标准即信息增益、子类划分标准率μ;数据特征片段Shapelets的选取数量阈值Num是指最终产生的数据特征片段Shapelets的数量;信息增益是指某个数据特征片段sub对整个时间序列数据集不确定性减少的程度,对于某个数据特征片段sub,其信息增益gain(sub)计算方式如公式(I)所示:式(I)中,D为原始数据集,DL和DR为原始数据集被划分后的两个数据集,n、nL、nR分别为D、DL、DR这三个数据集中包含时间序列的数目;e(D)、e(DL)、e(DR)分别表示D、DL、DR这三个数据集的熵,即数据集中不同类对该数据集造成的影响,假定数据集D中含有c个不同的类,类i中时间序列在数据集中占得比例为pi,则数据集D的熵计算方式如公式(II)所示:S2,针对原始数据集D,选取出表示原始数据集D中所有数据分类特性的时间序列数据集RTS;S3,针对步骤S2得到时间序列数据集RTS,利用数据趋势点从时间序列数据集RTS中选取相应的数据特征片段Shapelets;S4,根据上述步骤S3获取到的数据特征片段Shapelets,采用标准化的数据特征片段转换操作,形成数据特征矩阵;S5,利用步骤S4形成的数据特征矩阵后,采用ST算法完成最后的时间序列分类操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810843340.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top