[发明专利]一种基于拓扑分析的时空大数据潜在结构分析方法在审
申请号: | 202110994340.0 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113704641A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 李海峰;肖俊;张云生;施庆章;叶帮玲 | 申请(专利权)人: | 中南大学;湖南航天远望科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06N3/04;G06N3/08 |
代理公司: | 长沙大珂知识产权代理事务所(普通合伙) 43236 | 代理人: | 伍志祥 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 拓扑 分析 时空 数据 潜在 结构 方法 | ||
1.一种基于拓扑分析的时空大数据潜在结构分析方法,其特征在于,包括以下步骤:
获取时空大数据,通过连续且离散化采样将时空大数据提取为空间上有相关关系的时间序列集合;
计算所述时间序列集合的汉克尔矩阵X;
将所述汉克尔矩阵X输入自动编码器的编码器g,并分别作用于每一行以产生相空间的估计值
自动编码器的解码器g′将作为输入,用来重构编码器和解码器通过组合并最小化X和之差进行训练;
自动编码器训练完毕之后,使用编码器从训练数据或新的测试数据中生成嵌入数据,将数据嵌入到所述相空间中;
对嵌入后的相空间使用多参数持续同调过程,得到向量或者持续性内核,对所述向量使用XGBoost分类器进行分类,对所述持续性内核使用内核支持向量机分类;
基于向量分类结果和持续性内核分类结果完成所述时空大数据的聚类和分类。
2.根据权利要求1所述的基于拓扑分析的时空大数据潜在结构分析方法,其特征在于,使用单层长短期记忆网络和三层多层感知机作为自动编码器对时态数据潜在相空间中的结构进行分析。
3.根据权利要求1所述的基于拓扑分析的时空大数据潜在结构分析方法,其特征在于,为了限制g′和g,除了重建损失函数外,还加入稀疏性损失函数所述稀疏性损失函数输入维度为L大小为B,与隐藏的激活单元相对应;每次训练过程中,从一批潜在变量激活中估计假邻居分数并对无法显着降低虚假邻居分数的潜在变量进行加权:
其中表示虚假邻居向量,而是该批次训练的平均激活值,m∈{2,...L};
最后得到所述自动编码器的损失函数:
其中||·||2表示欧几里得范数,λ是控制正则化的超参数。
4.根据权利要求1所述的基于拓扑分析的时空大数据潜在结构分析方法,其特征在于,使用多参数持续性景观和多参数持续性图像方法得到所述向量;定义多参数持续性景观为表示将持续条形码转化为欧几里得向量,作为对应的第k个持续性景观的分段线性函数的采样,多参数表示为被定义为与纤维条形码{bcd(fl)}l∈L相关联的所有持续性景观的线性组合,其中L的直线斜率为1;所述多参数持续性图像学习多重组合方式进行持续同调得到纤维条形码,利用持续性图像将得到的一系列纤维条形码进行向量化。
5.根据权利要求1所述的基于拓扑分析的时空大数据潜在结构分析方法,其特征在于,使用多参数持续性内核方法得到所述持续性内核;定义持续核为利用双向过滤和加权线性组合,计算对应的多参数持续内核其中w(l)为加权系数,bcd(fl)代表密度纤维条形码,bcd(gl)代表距离纤维条形码。
6.根据权利要求1所述的基于拓扑分析的时空大数据潜在结构分析方法,其特征在于,采用度量拓扑特征的方法来描述原始吸引子Y及其重建之间的相似度。
7.根据权利要求6所述的基于拓扑分析的时空大数据潜在结构分析方法,其特征在于,所述度量拓扑特征的方法步骤如下:
计算了和Y的持续图之间的Wasserstein距离,以量化跨尺度的不同拓扑特征的存在;
用Y和没有显着特征的空吸引子之间的持续图的距离进行归一化,表达式如下:
其中PDY,表示与Y和的持续图,dw(PDY,0)表示PDY的持续图与没有显着拓扑特征的零图的距离。
8.根据权利要求1所述的基于拓扑分析的时空大数据潜在结构分析方法,其特征在于,通过自动重构嵌入和单延迟嵌入方法对调频模型获得的时间序列进行动态空间重构,并使用UMAP对重构结果的拓扑度量空间进行降维。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学;湖南航天远望科技有限公司,未经中南大学;湖南航天远望科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110994340.0/1.html,转载请声明来源钻瓜专利网。