[发明专利]基于加权实数代价编辑距离的轨迹相似性度量方法有效
申请号: | 201911272820.5 | 申请日: | 2019-12-12 |
公开(公告)号: | CN111125189B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 陈兴蜀;蒋术语;王海舟;王文贤;殷明勇;唐瑞;蒋梦婷;李春辉 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/29 |
代理公司: | 成都禾创知家知识产权代理有限公司 51284 | 代理人: | 裴娟 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 加权 实数 代价 编辑 距离 轨迹 相似性 度量 方法 | ||
本发明公开了一种基于加权实数代价编辑距离的轨迹相似性度量方法,包括以下步骤:步骤1:将轨迹数据表示成有序的多维实数序列;步骤2:获取两两轨迹点之间的加权欧式距离;步骤3:获取两两轨迹序列之间的加权实数代价编辑距离;步骤4:采用指数函数方法,以0.99为底,以步骤3中的加权实数代价编辑距离为幂数,获取两轨迹序列之间的轨迹相似度,进而得到其他两两轨迹序列之间的轨迹相似度。本发明不要求轨迹序列等长、能适用于多维度的轨迹数据,且能动态的根据实际需求的改变每个维度对轨迹相似性的影响因子。
技术领域
本发明涉及轨迹数据分析挖掘技术领域,具体为一种基于加权实数代价编辑距离(Weighted Edit distance with Real Penalty,WRERP)的轨迹相似性度量方法。
背景技术
随着各种无线通信技术、定位技术以及传感器技术的快速发展,大量时空轨迹数据被产生和采集,例如动物、飓风、飞机、船舶移动用户和车辆的轨迹数据。对这些数据的分析可以帮助研究者获得很多有价值的信息,例如:子热点、行为模式、位置预测、社会事件检测和识别等。如通过对台风的移动数据进行分析可以预测出台风的运动趋势;通过分析动物迁徙的数据可以总结出它们的迁徙方式,分析出它们迁徙的原因;通过分析出租车的导航数据可以得出交通流量的模式和交通拥堵的原因,为对交通流进行合理调度提供理论基础。在此背景下,时空轨迹数据的挖掘和分析已经成为数据挖掘领域中一个新的研究热点。
然而,时空轨迹的基本分析任务就是相似性度量。相似性度量是轨迹模式挖掘、轨迹分类、轨迹异常检测、路线计算等研究热点的关键性问题之一。如轨迹聚类指的是把相似的轨迹聚集到一起成为一类;轨迹分类指的是根据轨迹之间的相似性度量训练轨迹数据建立一个模型,通过这个模型可以判断一条轨迹的类别。轨迹异常检测指的是把与群体都不相似的轨迹检测出来。此外,它本身也是一个分析任务,例如在飓风分析中。众所周知,飓风的路径是相似的,尤其是当它们在空间和时间上彼此非常接近时。因此,当一场新的飓风发生时,气象学家使用过去具有类似初始轨迹的飓风来预测飓风的发展轨迹,特别是未来再交点和登陆点的位置。欧式距离作为最经典的相似度度量方式,要求两轨迹等长,这并不适用于飞机、船舶、飓风等轨迹。LCSS距离不要求轨迹等长,但其只关注轨迹间的相似部分,而不考虑相似子序列之间的不相似部分,这不利于异常轨迹的检测。
发明内容
本发明所要解决的技术问题是提供一种基于加权实数代价编辑距离的轨迹相似性度量方法,用欧式距离替代传统编辑距离里删除、插入和替换操作的代价,其不要求轨迹序列等长、能适用于多维度的轨迹数据,且能动态的根据实际需求的改变每个维度对轨迹相似性的影响因子。
为解决上述技术问题,本发明采用的技术方案是:
一种基于加权实数代价编辑距离的轨迹相似性度量方法,包括以下步骤:
步骤1:将轨迹数据表示成有序的多维实数序列,即:
Tr={p1(lat1,lon1,alt1,t1),p2(lati,loni,alti,ti),...,pn(latn,lonn,altn,tn)}
其中,p1(lat1,lon1,alt1,t1)为第1个轨迹点,……,pn(latn,lonn,altn,tn)为第n个轨迹点,n表示的是轨迹序列中采样点的数量,lat表示纬度,lon表示经度,alt表示高度,t表示时间点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911272820.5/2.html,转载请声明来源钻瓜专利网。