[发明专利]一种时间序列双层符号化方法及装置有效
申请号: | 201910261214.7 | 申请日: | 2019-04-02 |
公开(公告)号: | CN110032585B | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 王玲;李俊飞 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时间 序列 双层 符号化 方法 装置 | ||
本发明提供一种空气质量数据的时间序列双层符号化方法及装置,能够保留每个子序列所能持续的具体时间区间。所述方法包括:按照时间序列中观测值的大小,对时间序列进行分组;对分组后的时间序列,通过香农熵自适应聚类确定符号集大小及符号集中符号对应的值域范围;通过最小描述长度准则及梯度斜率方法获取时间序列的特征点序列;根据时间序列相邻特征点在值域范围的跳变关系,确定时间序列在时间轴的分割点;根据时间序列的分割点,确定时间序列中每个子序列的起止时刻值及其所处值域范围对应的符号,将时间序列转换为包含时态关系的符号化序列。本发明涉及数据处理领域。
技术领域
本发明涉及数据处理领域,特别是指一种空气质量数据的时间序列双层符号化方法及装置。
背景技术
时间序列是由一组在特定时间下记录的观测值组成,往往具有固定的时间间隔。但连续型数值的时间序列在实际应用中并不利于分析,时间序列的符号化就是为了有效的获取时间序列的内部结构而进行的一种合适的离散化手段,时间序列符号化在工程、科学、社会学和经济学等诸多领域都得到了广泛的应用。但现有技术中,大多是简单的进行聚类或者直接规定符号集的大小来进行符号化,这样容易导致数据信息的丢失,更不能反馈数据不同状态所持续时间的长短,例如:
现有技术一,利用符号化聚合近似(Symbolic Aggregate Approximation, SAX)通过人为规定时间序列符号集大小,并对时间序列值域按照符号个数进行均等划分,最后利用划分区间所能分割下的时间序列子序列的均值作为该段的代表符号,从而将时间序列转变为符号化序列。
现有技术二,结合聚类算法进行符号化转换,例如,通过K-Means(K- 均值)聚类算法,设定K个初始聚类中心,通过不断迭代更新聚类中心以获取K个类簇,其中,每个类簇对应一个不同的符号,进而将时间序列转变为对应的符号化序列。
现有技术一和现有技术二,虽然也能够将时间序列离散化为所需要的符号化序列,但该离散化过程需要不断的调整参数来实现最优的结果,时间序列的符号化是一项重要的数据预处理步骤,在该过程中除去最初的数据清洗还应该尽可能的保存数据所包含的信息,同时该方法应该更具有普遍适用性,这样才能彰显时间序列符号化方法的重要性。现有技术更多的是基于参数的不断调整来达到所需求的目的,而面对不同的时间序列就需要重新的调整之前的参数,更为重要的是其获取到的最终符号化序列并不能更好的反应各个状态所持续时间的长短,仅仅能够表示出不同状态的一种次序性,综上,现有的时间序列符号化方法整体过程过于依赖人为设定参数,并且容易丢失数据信息。
发明内容
本发明要解决的技术问题是提供一种空气质量数据的时间序列双层符号化方法及装置,以解决现有技术所存在的时间序列符号化过程中需要人为设定参数且无法保留各个状态持续时间长短的问题。
为解决上述技术问题,本发明实施例提供一种空气质量数据的时间序列双层符号化方法,包括:
按照时间序列中观测值的大小,对时间序列进行分组;
所述时间序列为PM2.5、PM10、NO2、O3、SO2中任一种空气质量数据的时间序列;
对分组后的时间序列,通过香农熵自适应聚类确定符号集大小及符号集中符号对应的值域范围;
通过最小描述长度准则及梯度斜率方法获取时间序列的特征点序列;
根据时间序列相邻特征点在值域范围的跳变关系,确定时间序列在时间轴的分割点;
根据时间序列的分割点,确定时间序列中每个子序列的起止时刻值及其所处值域范围对应的符号,将时间序列转换为包含时态关系的符号化序列。
进一步地,所述按照时间序列中观测值的大小,对时间序列进行分组包括:
按照时间序列中观测值递增的原则,对时间序列进行排序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910261214.7/2.html,转载请声明来源钻瓜专利网。