[发明专利]适用于文化科技融合领域时间序列数据的特征提取方法在审

专利信息
申请号: 202010453118.5 申请日: 2020-05-26
公开(公告)号: CN111625578A 公开(公告)日: 2020-09-04
发明(设计)人: 王妍;田玲玲;刘迪;刘德伟;谭爱平 申请(专利权)人: 辽宁大学
主分类号: G06F16/2458 分类号: G06F16/2458;G06F40/216
代理公司: 沈阳杰克知识产权代理有限公司 21207 代理人: 罗莹
地址: 110000 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 适用于 文化 科技 融合 领域 时间 序列 数据 特征 提取 方法
【说明书】:

适用于文化科技融合领域时间序列数据的特征提取方法,步骤为:1)从目标数据库获得时间序列数据,将序列以数据类型分类,得文本数据和数值数据;2)数值数据以时间粒度分类,得宏观时间序列数据和微观时间序列数据;宏观数据标准化后,计算样本与行业标准数据的相似度,将归一化后的相似度作为D‑S证据理论的输入进行证据融合,得类特征;3)设已有标准时间序列的最佳shapelet集合,计算微观数据与各shapelet的距离,得趋势特征;4)文本数据,先用词袋模型获得高频词集,再用改进的TF‑IDF对该词集进行二次过滤,得热点词集;5)新数据用滑动窗口重新执行步骤1‑4;无新数据则停止;本发明能快速的处理分析时间序列数据,有助于制定企业的战略决策。

技术领域

本发明创造针对文化科技融合领域时间序列数据本身的数据特性,以及其所隐藏的特征对于行业预测的作用,提出基于时间粒度划分的时间序列数据挖掘方法。

背景技术

随着我国的科技的进步以及经济发展战略的调整,发展以文化为核心、以科技为手段的新兴行业和企业正式成为现在各地极力倡导的大形势。一方面,一般的企业在预测自己发展热点的时候主要利用的是财务数据或者对用户进行行为建模,而没有特别关注对于时间序列数据的多角度挖掘;另一方面,一般的时间序列数据挖掘由于不具备文化科技融合数据的特点,也没有从将时间序列数据从时间粒度的分类上进行数据挖掘。对于一个行业或者企业而言,时间序列数据所携带的信息量巨大且对于企业制定发展战略尤为重要,充分挖掘时间序列数据所携带的信息是许多人都在极力探索的目标。

一方面,文化科技融合领域内的时间序列数据有独特的特征:不同时间粒度的时间序列数据带有不同的重要信息、样本数据少;另一方面,常见的时间序列特征挖掘算法只从单一角度挖掘时间序列的信息,不能完全的获得数据的价值。这些限制对于想要充分挖掘时间数据进而获得决策支撑的企业十分不利。

发明内容

为了解决现有技术存在的问题,本发明提供一种适用于文化科技融合领域时间序列数据的特征提取方法。本方法首先从目标数据库获得时间序列数据,将序列以数据类型分类,得文本数据和数值数据;数值数据以时间粒度分类,得宏观时间序列数据和微观时间序列数据。将宏观数据标准化后,计算样本数据与行业标准数据的相似度,将归一化后的相似度作为D-S证据理论的输入进行证据融合,得类特征;设已获得标准时间序列的最佳shapelet集合,计算微观数据样本与各shapelet的距离,得趋势特征;文本数据,先用词袋模型获得高频词汇集,再使用改进的TF-IDF对该词汇集进行二次过滤,获得热点词汇;若有新数据则用滑动窗口重新执行步骤1-4;无新数据则停止。

为了实现上述目的,本发明创造采用的技术方案为:

适用于文化科技融合领域时间序列数据的特征提取方法,其特征在于:其步骤为:

步骤1)、从目标数据库获得时间序列数据,将序列以数据类型分类,得文本数据和数值数据;

步骤2)、数值数据以时间粒度分类,得宏观时间序列数据和微观时间序列数据;将宏观数据标准化后,计算样本与行业标准数据的相似度,将归一化后的相似度作为D-S证据理论的输入进行证据融合,得类特征;

步骤3)、设已获得标准时间序列的最佳shapelet集合,计算微观数据样本与各shapelet的距离,得趋势特征;

步骤4)、文本数据,先用词袋模型获得高频词汇集,再使用改进的TF-IDF对该词汇集进行二次过滤,获得热点词汇;

步骤5)、若有新数据则用滑动窗口重新执行步骤1-4;无新数据则停止。

所述的步骤1)中,具体方法如下:

1.1)获取源数据:从企业数据库或者相应政府的公共数据库获取时间序列数据;

1.2)将数据根据数据类型进行分类,分为数值型时间序列数据和文本型时间序列数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁大学,未经辽宁大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010453118.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top