[发明专利]一种基于手机信令数据的高精度时空轨迹复原方法在审
申请号: | 202310091610.6 | 申请日: | 2023-02-09 |
公开(公告)号: | CN116132923A | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 张登银;康忆宁;丁飞;张海涛 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | H04W4/029 | 分类号: | H04W4/029;H04W4/02;H04W4/20;G06F18/2321 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 卢霞 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 手机 数据 高精度 时空 轨迹 复原 方法 | ||
本发明属于智能交通技术领域,具体地说,是一种基于手机信令数据的高精度时空轨迹复原方法,利用密度聚类算法对原始手机信令数据进行预处理,利用融合时空特征的网格聚类算法,引入百度地图的POI(PointofInterest)兴趣点数据,从时空两个维度进行聚类分析,提取出信令用户的多个停驻点,然后基于停驻点对信令用户的出行轨迹进行重新构建,本发明提供的方法使用户重构后的轨迹精确度较高,与用户真实轨迹更加拟合。
技术领域
本发明属于智能交通技术领域,具体地说,是一种基于手机信令数据的高精度时空轨迹复原方法。
背景技术
信令数据由运营商提供,是一种匿名脱敏的数据,数据量大,获取成本低,手机信令数据在很多方面都有非常突出的应用,尤其是对于停驻点的识别,停驻点的识别是用户行为分析的关键环节,对后续出行行为、出行目的、行为预测等工作的分析产生重要影响。因此,停驻点的识别是信令研究领域中的经典问题,一直是研究者们研究的热点。
目前常用的基于手机信令数据的停驻点识别方法主要有三种:第一种是基于时间序列的停驻点识别方法;第二种是基于速度和加速度的停驻点识别方法;第三种是基于密度聚类算法的停驻点识别方法。对于信令数据用户的轨迹重构问题,当前大多数研究是借助于时间连续的特性对用户轨迹进行重新构建。
以上所提方法中,最常用的就是基于密度聚类算法的停驻点识别。在以密度聚类算法为主的信令数据识别用户停驻点的研究中,当前主要分为三种:第一种是针对DBSCAN(Density-Based Spatial Clustering ofApplications with Noise)密度聚类算法进行改进,在空间特征的基础上通过引入时间序列来对信令用户的停驻点进行识别,如ST_DBSCAN(Spatial Temporal-DBSCAN)密度聚类算法,AT_DBSCAN(Adjacent Temporal-DBSCAN)密度聚类算法,以固定长度的滑窗搜索核心点,以时空临近条件定义簇间距离,以簇密度大小规定合并次序,此类算法可以发现任意形状的停驻点。这种算法引入了时间序列特征,也对传统的DBSCAN算法密度聚类算法作出了改进,但因信令数据的采样时间间隔不均匀,故在进行空间密度聚类时会受到很大的影响;第二种方法是针对信令数据的采样时间间隔不均匀,采用插值法对信令数据进行填补,使信令数据的采样时间间隔呈均匀分布,然后使用DBSCAN密度聚类算法对信令用户的停驻点进行识别。但采用插值法对信令数据进行填补时,不可避免会面临两个问题:第一,插值法填补信令数据时误差很大,只是为了满足采样时间间隔均匀而粗略地对用户某一时刻的位置进行估算与填补,这种方法填补后的数据可信度较低。第二,在经过插值法对用户信令数据进行填补后,造成数据量异常庞大,容易引起数据冗余,对后续轨迹复原或用户出行行为的研究造成数据计算量大、性能低等问题;第三种方法是基于网格移动能力的停驻点识别方法,这种方法是对信令用户进行网格聚类后,通过数据域理论计算网格簇之间的移动速度来判别网格簇的移动能力,通过定义移动能力阈值来对用户停驻点进行识别。这种方法在空间聚类时无需考虑数据采样间隔是否均匀,但网格簇内可能会存在预处理阶段去除不完全的乒乓数据,这些数据表现为在一定范围内频繁来回移动的现象,在计算网格簇的平均速度时会存在较大的误差。
现有的基于时间连续性的轨迹重构方法中,当处理因经常性信号丢失而造成的经纬度数据为0的数据时,会面临用户轨迹在时间上基本不连续的问题,但用户在信号丢失的这段时间内可能并未发生移动,若仅考虑时间连续性对轨迹进行重构会出行很多重构失真的情况,所以可对信令数据用户的轨迹重构方法进行改进,不能仅限于时间连续性层面。
发明内容
本发明的目的在于克服现有技术的不足,提出一种基于手机信令数据的高精度时空轨迹复原方法。
本发明采用的具体技术方案如下:
一种基于手机信令数据的高精度时空轨迹复原方法,采用DBSCAN密度聚类算法去除离散点数据,利用基于规则的方法去除乒乓数据,利用融合时空特征的网格聚类算法识别用户停驻点,具体包括以下三个步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310091610.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置