[发明专利]一种基于拓扑分析的时空大数据潜在结构分析方法在审

专利信息
申请号: 202110994340.0 申请日: 2021-08-27
公开(公告)号: CN113704641A 公开(公告)日: 2021-11-26
发明(设计)人: 李海峰;肖俊;张云生;施庆章;叶帮玲 申请(专利权)人: 中南大学;湖南航天远望科技有限公司
主分类号: G06F16/9537 分类号: G06F16/9537;G06N3/04;G06N3/08
代理公司: 长沙大珂知识产权代理事务所(普通合伙) 43236 代理人: 伍志祥
地址: 410083 湖南*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 拓扑 分析 时空 数据 潜在 结构 方法
【说明书】:

发明公开了一种基于拓扑分析的时空大数据潜在结构分析方法,步骤包括:获取时间序列并计算其汉克尔矩阵,并输入自动编码器的编码器,分别作用于每一行以产生相空间的估计值;解码器将作为输入,用来重构编码器和解码器通过组合并最小化X和之差进行训练;自动编码器训练完毕之后,仅使用编码器从训练数据或新的测试数据中生成嵌入,将数据嵌入到所述相空间中;对嵌入后的相空间使用多参数持续同调过程,得到向量或者持续性内核,对向量使用XGBoost分类器进行分类,对持续性内核使用内核支持向量机分类。本发明能自动重构时态数据动力学的潜在结构并保留原始相空间中的拓扑结构,同时捕获不同动态的时间序列的模式。

技术领域

本发明属于测绘技术领域,尤其涉及一种基于拓扑分析的时空大数据潜在结构分析方法。

背景技术

近年来,随着信息通讯技术的发展以及各种传感器和定位技术的普及,产生了大量具有时空标记、能够描述个体行为的空间大数据,包括手机定位数据、出租车数据、共享自行车数据、公交智能卡数据、社交网络数据、视频大数据等,为分析和理解城市结构的动态、人类活动时空规律以及定量理解社会经济环境提供了巨大的机会。这些具有地理属性的大数据兴起,也对时空大数据的空间挖掘能力提出了新的诉求。丰富时空数据分析方法,将有助于理解、应对进而解决空间与时间上更为复杂的自然地理格局和过程耦合问题,满足国家可持续发展需求,服务于社会决策和智慧城市的建设。

近年来,来自不同领域的学者对不同类型的时空数据进行了大量研究,其中包括计算机科学、地理学、和复杂性科学等交叉领域。他们试图挖掘海量群体的时空行为模式,并建立合适的解释性模型,得到地理学研究中的新见解。然而,大数据具有高维、高噪声、动态性、多模态等特征,数据量不断增长且具有复杂性,使用传统数据分析方法分析大数据会存在一定的局限性。

其一是数据分析的方法上,方法本身的和方法使用上的具有局限性。这些方法以统计分析为基础,需要对数据做出一些基本假设如数据满足正态分布。或者主要从数据“表面”的统计量出发,通过参数设计,获得关于对于人类行为规律与模式的认知,而没有从数据隐藏的基本结构出发,这种方法原理上可能存在先天的缺陷[12]。在方法使用上,满足如果数据不满足这种分布和假设或者其分布不明确的情况下,这些方法得不到很好的效果。然而在现实应用中,领域专家有时候忽视了这点,导致其结果或者结论存在系统性的偏差。其二,现有数据分析方法对时空大数据的研究,增加了对地理现象和时空行为模式的认知。但是,目前的研究聚焦于问题的差异性,而缺乏深入研究问题的普适性。对不同类型的数据的共性和内在结构进行分析与表征的研究较少。

不论是地理现象或者群体的时空行为,这些复杂的模式背后存在一些隐藏的基本结构,而非仅仅是表面上的统计性质。从数学的角度来看,这个过程本质就是寻找高维数据背后的低维结构。时空大数据不仅有其“地理坐标”,还具有“特征坐标”,当描述时空大数据的特征坐标越来越多,高维数据的处理变得不可避免,而高维信息处理的关键在于找到嵌入在其中的低维流形结构。因此需要将三维坐标的概念更加泛化到一般的非欧空间或者流形空间。洞察数据潜在流形的结构与背后“形状”有助于更好地理解数据。如何从数据的隐藏结构和内在特性出发,理解地理现象、人类活动行为及其运行规律,从大数据背后挖掘可学习的潜空间特征,是目前时空大数据研究领域的重要问题之一。

在数学中,拓扑是研究几何图形或空间在连续改变形状后还能保持不变的一些性质的一个学科。而拓扑数据分析是一个新兴的数据分析领域,它将计算科学与拓扑的数学理论联系在一起,探索数据的几何形状和拓扑属性。与传统方法相比,拓扑数据分析能够描述复杂高维数据中的定性结构,并具有从系统和整体的角度捕获数据之间联系的固有模式和特征的优势。同时它可以量化数据的形状,探索数据的形状通常能发现数据中的拓扑特征或潜在不变的性质。这些拓扑特性已被证明能够提供关于数据的新见解,而通常这些关键信息被传统数据分析方法所忽略。拓扑数据分析已经成功应用于不同领域的研究和数据分析,并发现了一些数据潜在的共性,如时间序列分析、金融数据分析、网络科学、脑科学、神经科学、物理学、生物学和分析化学、地理学等领域。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学;湖南航天远望科技有限公司,未经中南大学;湖南航天远望科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110994340.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top