[发明专利]基于带离群点去除的车辆轨迹聚类方法在审
申请号: | 202110252754.6 | 申请日: | 2021-03-09 |
公开(公告)号: | CN112906812A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 李晓辉;李宜霖;张鹏 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 离群 去除 车辆 轨迹 方法 | ||
本发明公开一种基于带离群点去除的车辆轨迹聚类方法,主要解决现有技术聚类时间复杂度高和聚类质量差的问题。其实现方案为:通过GPS采集车辆轨迹数据;整理轨迹数据格式并对数据清洗形成轨迹数据集;使用A‑MDL算法对轨迹数据进行轨迹段划分;采用带有离群因子LOF的DBSCAN算法对轨迹段数据集聚簇;使用引入了中心轨迹子轨迹段最大置信长度Z的扫描线方法确定轨迹簇的中心轨迹;通过坐标系旋转得到中心轨迹的实际坐标,各个轨迹簇的中心轨迹即为最终的车辆轨迹聚类的结果。本发明降低了轨迹聚类的时间复杂度,消除了离群轨迹的影响,提高了轨迹聚类的质量和聚类结果的平滑度,可用于城市交通管理和道路养护。
技术领域
本发明属于大数据分析技术领域,进一步涉及一种车辆轨迹聚类方法,可用于城市交通中普通车辆行驶的行为分析和工程车辆相关的施工行为分析,为改善城市交通管理和道路养护提供依据。
背景技术
随着移动定位技术与移动通信系统的蓬勃发展,以及各类移动终端设备的广泛应用衍生了海量的移动对象的位置信息。位置信息中主要包括对象所处位置的经纬度和时间戳等信息,这些海量的数据被终端设备实时采集,并在持续累积的条件下形成了规模庞大高速集中的对象轨迹流信息。实时的对轨迹流数据进行处理分析可以感知移动对象在移动过程中发生的变化,并通过深度的分析揭示隐藏在对象行为模式背后的规律。
聚类是轨迹数据分析中经典的数据挖掘技术。聚类的主要目标是将海量的轨迹数据集划分成若干个相似度满足要求的簇用以表征不同的轨迹所代表的相似的移动趋势。然而,聚类算法的有效性受到限制的原因有三个:首先,聚类算法所需的输入参数值通常很难确定;第二,聚类算法对这些参数值是敏感的,即使参数设置稍有不同,也常常会产生非常不同的数据聚类结果;第三,现实世界中的高维数据集往往具有很大的分布偏差。
目前,对轨迹聚类算法的改进已经有很多研究。Xinzheng Niu等人在发表的论文“Label-Based Trajectory Clustering in Complex Road Networks”中提出了一种复杂道路网络中基于标号的轨迹聚类方法,该方法研究了复杂网络理论,探讨了复杂网络理论在道路网络轨迹聚类中的应用。具体来说,是将道路网络建模为对偶图,以助于有效地将聚类问题从道路网络中的子轨迹转化为复杂网络中的节点,并在此模型的基础上,设计了一种基于标签的轨迹聚类算法LBTC,用来捕捉和刻画节点间相似度的本质。该方法将网格理论应用于轨迹聚类中虽说可通过网状网络的特性增加轨迹段的可描述性,但该种方法在面对大规模的轨迹数据时,庞大的网状网络构建会成为性能的瓶颈。在Amir Salarpour等人发表的论文“Direction-based similarity measure to trajectory clustering”中提出基于方向的轨迹聚类相似性度量,其根据不同分辨率下的方向变化计算轨迹相似性,并通过轨迹段的角度描述对轨迹的相似性进行分析,以实现旋转和位置不变性,但该方法由于判断的条件单一,因而无法相对准确的描述相似性的概念。He Ailin等人发表的论文“Movement Pattern Extraction Based on a Non-parameter Sub-trajectoryClustering Algorithm”为了使轨迹聚类方法摆脱相关领域先验知识的限制,该方法改进了对轨迹段划分的方式,率先采用了通信领域中的MDL最小描述性原则,并基于该种相对准确的轨迹段描述使用DBSCAN算法进行后续的轨迹聚类分析。但直接使用MDL原则进行轨迹段划分的时间复杂度较高,难以适应海量轨迹数据的处理,并且仅使用基于密度的聚类算法聚类的准确度较低。
发明内容
本发明的目的在于克服上述已有技术的不足,提出一种基于带离群点去除的车辆轨迹聚类方法,以减小时间复杂度,提高聚类的运行效率和准确度。
本发明的技术思路是:在轨迹划分时通过使用带角度描述的轨迹划分策略A-MDL算法减小轨迹段划分过程的时间复杂度并提高轨迹段划分的准确度,通过在聚类的过程中采用了带离群因子LOF的DBSCAN算法提高聚类的准确度,通过在轨迹簇分析时设计最大置信长度的扫描策略,使得轨迹聚类结果更加平滑。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110252754.6/2.html,转载请声明来源钻瓜专利网。