[发明专利]一种轨迹数据清洗方法有效
申请号: | 201711268085.1 | 申请日: | 2017-12-05 |
公开(公告)号: | CN107895103B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 皇甫伟;张弘;胡晓彦 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 轨迹 数据 清洗 方法 | ||
本发明提供一种轨迹数据清洗方法,能够提高轨迹数据的数据质量。所述方法包括:S1,计算轨迹数据中相邻两个轨迹点之间的M阶差分,并降低M阶差分值小于第一预设阈值的相应轨迹点的可信度值;S2,每个轨迹点向其邻居点投票的同时接受来自邻居点的投票值,根据邻居点的投票值重新计算每个轨迹点的可信度值;S3,判断S2执行前后每个轨迹点的可信度值的变化值是否小于预设的可接受的最大变化值,若是,则删除所有可信度值小于第二预设阈值的轨迹点;否则,返回S2执行下一次迭代。本发明涉及大数据处理领域。
技术领域
本发明涉及大数据处理领域,特别是指一种轨迹数据清洗方法。
背景技术
随着大数据时代的到来以及定位技术和定位服务的发展,轨迹数据现在已经受到了越来越多的关注,轨迹数据在轨迹预测、路径推断、模式挖掘以及其他相关领域发挥着重要作用。
轨迹数据是由携带GPS或者其他定位设备的移动目标所产生的一系列轨迹记录,通常用一组坐标点来表示。假设,用p(x,y)来表示一个已经记录的坐标点,那么一条轨迹可以表示为p1(x1,y1)→p2(x2,y2)→…pn(xn,yn)。
但是由于数据丢失或者是硬件配置过低等等原因,轨迹数据中通常含有许多的伪造数据点。这些数据点虽然在一些研究领域是有益的,但是可能会影响另外一些领域中的相关研究。
现有技术中,轨迹数据的清洗方法主要有均值过滤(mean filter)、卡尔曼粒子过滤(Kalman and particle filters)以及异常值检测(heuristics-based outliersdetection)。但是,均值过滤、卡尔曼粒子过滤以及异常值检测方法都着重于清除轨迹数据中的异常值(即离群点),而无法有效的清除掉轨迹数据中的插值数据点;其中,异常值指明显偏离轨迹运动趋势的数据点,插值数据点指两个真实轨迹点之间通过线性插值得到的数据点。
发明内容
本发明要解决的技术问题是提供一种轨迹数据清洗方法,以解决现有技术所存在的无法有效的清除掉轨迹数据中的插值数据点的问题。
为解决上述技术问题,本发明实施例提供一种轨迹数据清洗方法,包括:
S1,计算轨迹数据中相邻两个轨迹点之间的M阶差分,并降低M阶差分值小于第一预设阈值的相应轨迹点的可信度值,其中,所述可信度值用于描述一个轨迹点是非插值数据点的可能性;
S2,每个轨迹点向其邻居点投票的同时接受来自邻居点的投票值,根据邻居点的投票值重新计算每个轨迹点的可信度值;
S3,判断S2执行前后每个轨迹点的可信度值的变化值是否小于预设的可接受的最大变化值,若是,则删除所有可信度值小于第二预设阈值的轨迹点;否则,返回S2执行下一次迭代。
进一步地,所述计算轨迹数据中相邻两个轨迹点之间的M阶差分包括:
基于x坐标和/或y坐标计算轨迹数据中相邻两个轨迹点之间的M阶差分。
进一步地,M为大于等于2的正整数。
进一步地,轨迹点p的邻居点是位于以轨迹点p为圆心,投票半径r为半径的圆形区域中的所有来自其他轨迹的轨迹点。
进一步地,设轨迹点p是轨迹点q的一个邻居点,则轨迹点p对轨迹点q的投票值表示为:
vote(p→q)=credit(p)×fac(p→q)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711268085.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置