[发明专利]一种基于轨迹字典的时空轨迹压缩方法有效

专利信息
申请号: 201810587519.2 申请日: 2018-06-08
公开(公告)号: CN109033141B 公开(公告)日: 2022-07-29
发明(设计)人: 郑凯;郭建楠;崔越;赵艳 申请(专利权)人: 苏州大学
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/248;G06F16/29
代理公司: 苏州广正知识产权代理有限公司 32234 代理人: 刘盼盼
地址: 215000 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于轨迹字典的时空轨迹压缩方法,包括轨迹字典集的建立和基于轨迹字典集的轨迹压缩两部分。通过上述方式,本发明提供的基于轨迹字典的时空轨迹压缩方法,分别针对空间轨迹数据和时候轨迹数据,提出了3种轨迹建立方法和2种轨迹压缩算法,既保证了压缩率又能保证较高的轨迹压缩质量,具有可靠性高、准确性强等优点,同时咋数据库、数据分析、数据挖掘、轨迹数据查询与分析、轨迹数据挖掘的应用及普及上有着广泛的市场前景。
搜索关键词: 一种 基于 轨迹 字典 时空 压缩 方法
【主权项】:
1.一种基于轨迹字典的时空轨迹压缩方法,其特征在于,包括轨迹字典集的建立和基于轨迹字典集的轨迹压缩两部分,具体包括以下具体步骤:1)轨迹字典集的建立1.1)基于频繁轨迹模式的轨迹字典集建立,利用序列模式挖掘方法提取轨迹的频繁模式,由于轨迹数据是时空连续数据,利用计算点和计算轨迹将轨迹数据进行离散化;1.1.1)找到所有的计算点和计算轨迹;1.1.2)扫描所有的计算点,得到频繁计算点,即计算点发生的次数大于给定的支持阈值;1.1.3)使用频繁计算点对每条计算轨迹进行分割,即去掉轨迹中的非频繁计算点,获得频繁计算轨迹;1.1.4)若得到的频繁轨迹是另一段频繁轨迹的子集,则删掉该频繁轨迹;1.1.5)得到频繁轨迹字典集;1.2)降低冗余的轨迹字典集建立,分为降低轨迹段冗余的挖掘算法和降低轨迹冗余的挖掘算法;1.2.1)降低轨迹段冗余的挖掘算法,首先对冗余轨迹段进行定义,给定最短轨迹长度阈值γ和距离阈值∈,对于两条相同长度的轨迹段Ta(i,i+m)和Tb(j,j+m),若其相互对应的点之间的最大距离不超过空间偏差阈值∈,即dmax=max0≤k≤md(Ta.pi+k,Tb.pj+k)≤∈且m≥γ,则称Ta(i,i+m)和Tb(j,j+m)相互重叠,若一条子轨迹段s与现有的轨迹字典集中的任意子轨迹段重叠,则称s为冗余轨迹段,消除所有的冗余轨迹段,将其他非冗余轨迹段作为轨迹字典;1.2.2)降低轨迹冗余的挖掘算法,若最短轨迹长度阈值γ太小的话,SRR算法生成的轨迹字典集可能会产生许多短轨迹段;反之若太长,则会产生许多整条的轨迹,与SRR算法不同的是,TRR是将整条轨迹作为处理对象,消除所有的冗余轨迹,将剩余的非冗余轨迹作为轨迹字典;1.3)基于压缩算法的轨迹字典集建立采用空间轨迹压缩算法对训练轨迹集进行压缩,并将压缩率低于某一给定阈值的轨迹添加到轨迹字典集中。2)基于轨迹字典集的轨迹压缩2.1)基于轨迹字典集的空间压缩算法2.1.1)可匹配参考轨迹定义,给定一个空间距离阈值,每段轨迹被它邻域范围内的轨迹字典集表示,这些轨迹字典集称为该段轨迹的可匹配参考轨迹;2.1.2)基于贪婪算法的轨迹空间压缩,按照采样点的时间顺序压缩待压缩轨迹T,每次贪婪地选取当前点所对应的最长MRT来代替原始待压缩轨迹段,直至T的最后一个采样点被压缩;2.1.3)基于动态规划的最佳轨迹空间压缩给定待压缩轨迹T和它的MRT集M(T),定义FT[i]为轨迹段T(1,i)对应的压缩轨迹T′(1,i)的最小存储容量,其计算公式为:其中,单个采样点的MRT集手动设为非空,如即i=0时,显然FT[i]=0,当i>0时,FT[i]是如下a和b两个选择的最小值:a.当1≤j<i时,FT[i]是T′(1,j‑1)的最小存储容量FT[j‑1]与T(j,i)对应的MRT的存储8字节之和;b.当j=i时,FT[i]是T′(1,i‑1)的最小存储容量FT[i‑1]与待压缩轨迹原采样点T(i,i)的存储空间8字节之和;2.2)基于轨迹字典集的时空压缩算法2.2.1)时间纠正成本的定义给定空间阈值∈和时间阈值ε,若两条轨迹Ta和Tb,若两者的MaxDTW距离不超过空间偏差阈值∈,仍需要修改Ta或Tb的某些时间戳,使得两条轨迹对应采样点的最大时间差距不超过时间偏差阈值ε,每个时间戳修正都会产生额外的空间存储c,用以记录时间戳修正的位置和新的时间戳,基于Ta的时间戳来修正Tb的时间戳,所产生的额外的时间纠正成本,记为2.2.2)基于贪婪算法的时空压缩算法跟GSC算法相似,GSTC算法同样利用最长MRT轨迹代替当前轨迹段,然而GSC是用M(T(i,j))的任意一条MRT来表示T(i,j),而GSTC是用M(T(i,j))中时间纠正成本最小的MRT即Mopt(T(i,j)),计算如下来表示T(i,j),由于计算Mopt(T(i,j))仅需线性扫描每条选定的最长MRT,其于|T|存在线性关系,因此最坏情况下,GSTC的时间复杂度与GSC相同;2.2.3)基于动态规划的时空压缩算法GSTC在选择MRT来代替待压缩轨迹段的时候,先考虑最长MRT,再考虑最长MRT中的纠正时间成本,最终选择最小纠正时间成本的最长MRT,但是,有时使用更少时间纠正成本的较短MRT可能会节省更多的存储空间,为实现最小存储成本,必须同时考虑MRTs的数量和时间纠正成本,因此,将OSC扩展为OSTC,计算公式为:上述公式,FT[i]记录压缩T(1,i)所需的最小空间存储,FT[0]=0代表公式的终止条件,当i≥1,GSTC算法同样有两种选择:a.保留带压缩轨迹的原始采样点pi∈T,占用12字节;b.用Mopt(T(j,i))压缩T(j,i)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810587519.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top