[发明专利]一种基于轨迹字典的时空轨迹压缩方法有效
申请号: | 201810587519.2 | 申请日: | 2018-06-08 |
公开(公告)号: | CN109033141B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 郑凯;郭建楠;崔越;赵艳 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/248;G06F16/29 |
代理公司: | 苏州广正知识产权代理有限公司 32234 | 代理人: | 刘盼盼 |
地址: | 215000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 轨迹 字典 时空 压缩 方法 | ||
1.一种基于轨迹字典的时空轨迹压缩方法,其特征在于,包括轨迹字典集的建立和基于轨迹字典集的轨迹压缩两部分,具体包括以下具体步骤:
1)轨迹字典集的建立
1.1)基于频繁轨迹模式的轨迹字典集建立,利用序列模式挖掘方法提取轨迹的频繁模式,由于轨迹数据是时空连续数据,利用计算点和计算轨迹将轨迹数据进行离散化;
1.1.1)找到所有的计算点和计算轨迹;
1.1.2)扫描所有的计算点,得到频繁计算点,即计算点发生的次数大于给定的支持阈值;
1.1.3)使用频繁计算点对每条计算轨迹进行分割,即去掉计算轨迹中的非频繁计算点,获得频繁计算轨迹;
1.1.4)若得到的频繁计算轨迹是另一段频繁计算轨迹的子集,则删掉该频繁计算轨迹;
1.1.5)得到频繁轨迹字典集;
1.2)降低冗余的轨迹字典集建立,分为降低轨迹段冗余的挖掘算法和降低轨迹冗余的挖掘算法;
1.2.1)降低轨迹段冗余的挖掘算法,首先对冗余轨迹段进行定义,给定最短轨迹长度阈值γ和空间偏差阈值∈,对于两条相同长度的轨迹段Ta(i,i+m)和Tb(j,j+m),若其相互对应的点之间的最大距离不超过空间偏差阈值∈,即dmax=max0≤k≤md(Ta·Pi+k,Tb·Pj+k)≤∈且m≥γ,则称Ta(i,i+m)和Tb(j,j+m)相互重叠,若一条子轨迹段s与现有的轨迹字典集中的任意子轨迹段重叠,则称s为冗余轨迹段,消除所有的冗余轨迹段,将其他非冗余轨迹段作为轨迹字典;
1.2.2)降低轨迹冗余的挖掘算法,若最短轨迹长度阈值γ太小,SRR算法生成的轨迹字典集会产生许多短轨迹段;反之若最短轨迹长度阈值γ太大,则会产生许多整条的轨迹,与SRR算法不同的是,TRR算法是将整条轨迹作为处理对象,消除所有的冗余轨迹,将剩余的非冗余轨迹作为轨迹字典;
1.3)基于压缩算法的轨迹字典集建立
采用空间轨迹压缩算法对训练轨迹集进行压缩,并将压缩率低于某一给定阈值的轨迹添加到轨迹字典集中;
2)基于轨迹字典集的轨迹压缩
2.1)基于轨迹字典集的空间压缩算法
2.1.1)可匹配参考轨迹定义,给定一个空间距离阈值,每段轨迹被它邻域范围内的轨迹字典集表示,这些轨迹字典集称为该段轨迹的可匹配参考轨迹MRT;
2.1.2)基于贪婪算法的轨迹空间压缩,按照采样点的时间顺序压缩待压缩轨迹T,每次贪婪地选取当前点所对应的最长MRT来代替原始待压缩轨迹段,直至T的最后一个采样点被压缩;
2.1.3)基于动态规划的最佳轨迹空间压缩
给定待压缩轨迹T和它的MRT集M(T),定义FT[i]为待压缩轨迹段T(1,i)对应的压缩轨迹段T'(1,i)的最小存储容量,其计算公式为:
,
其中,单个采样点的MRT集手动设为非空,即
当即i=0时,显然FT[i]=0,当i>0时,FT[i]是如下a和b两个选择的最小值:a.当1≤j<i时,FT[i]是压缩轨迹段T'(1,j-1)的最小存储容量FT[j-1]与待压缩轨迹段T(j,i)对应的MRT的存储空间之和,该MRT的存储空间为8字节;b.当j=i时,FT[i]是压缩轨迹段T'(1,i-1)的最小存储容量FT[i-1]与待压缩轨迹原采样点T(i,i)的存储空间之和,该待压缩轨迹原采样点T(i,i)的存储空间为8字节;
2.2)基于轨迹字典集的时空压缩算法
2.2.1)时间纠正成本的定义
给定空间偏差阈值∈和时间偏差阈值ε,若两条轨迹Ta和Tb,若两者的最大动态时间规整MaxDTW距离不超过空间偏差阈值∈,仍需要修改Ta或Tb的某些时间戳,使得两条轨迹对应采样点的最大时间差距不超过时间偏差阈值ε,每个时间戳修正都会产生额外的空间存储c,用以记录时间戳修正的位置和新的时间戳,基于Ta的时间戳来修正Tb的时间戳,所产生的额外的时间纠正成本,记为
2.2.2)基于贪婪算法的时空压缩算法
跟GSC算法相似,GSTC算法同样利用最长MRT轨迹代替待压缩轨迹段,然而GSC是用M(T(i,j))的任意一条MRT来表示待压缩轨迹段T(i,j),而GSTC是用M(T(i,j))中时间纠正成本最小的MRT即Mopt(T(i,j))来表示待压缩轨迹段T(1,i),Mopt(T(i,j))计算公式如下,
由于计算Mopt(T(i,j))仅需线性扫描每条选定的最长MRT,其于|T|存在线性关系,因此最坏情况下,GSTC的时间复杂度与GSC相同;
2.2.3)基于动态规划的时空压缩算法
GSTC在选择MRT来代替待压缩轨迹段的时候,先考虑最长MRT,再考虑最长MRT中的时间纠正成本,最终选择时间纠正成本最小的最长MRT,但是,有时使用更少时间纠正成本的较短MRT会节省更多的存储空间,为实现最小存储成本,必须同时考虑MRT的数量和时间纠正成本,因此,将OSC扩展为OSTC,计算公式为:
上述公式,FT[i]记录压缩T(1,i)所需的最小存储容量,FT[0]=0代表公式的终止条件,当i≥1,GSTC算法同样有两种选择:a.保留待压缩轨迹的原始采样点pi∈T,占用12字节;b.用Mopt(T(j,i))压缩T(j,i)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810587519.2/1.html,转载请声明来源钻瓜专利网。