[发明专利]一种时空轨迹相似度计算方法及系统有效
申请号: | 201210162995.2 | 申请日: | 2012-05-23 |
公开(公告)号: | CN102722541A | 公开(公告)日: | 2012-10-10 |
发明(设计)人: | 叶剑;朱珍民;张筱旋;王冠男;姚昱旻;杜静 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时空 轨迹 相似 计算方法 系统 | ||
技术领域
本发明涉及数据挖掘领域,特别涉及一种时空轨迹相似度计算方法及系统。
背景技术
近年来,诸如平板电脑、智能手机等支持GPS的移动设备发展迅速,越来越多的人开始使用基于位置的服务(LBS),例如定位、位置共享等等,大量时空信息被上传和共享。记录用户移动历史的同时,这些位置信息也能够在一定程度上反应用户的兴趣、偏好以及生活规律。为此,时空轨迹作为计算机应用的一大研究热点,在普适计算、数据挖掘和社会网络等领域受到了广泛关注。
人类活动具有不同程度的共性,这种共性差异映射到活动轨迹上,导致轨迹之间呈现不同程度的相似性。相应地,轨迹的相似程度反应了活动的共性,进而关系到相近似的人类习惯和偏好。正因如此,如何科学地刻画轨迹之间的相似度是当前轨迹模式挖掘等研究工作所面临的最重要问题之一。
当前,轨迹相似度计算方法考虑因素包括:子列重叠程度、相近的位置数目、地点的数目等。然而,轨迹不是单纯的序列,用序列包含关系去刻画轨迹之间的关系是远远不够的。此外,计算的粒度也是这类工作所面临的困难,轨迹的离散化程度越高,和原始轨迹的偏差就越大,而细粒度的计算又难免降低效率。
发明内容
为解决上述问题,本发明提供了有效利用欧式空间的度量属性和笛卡尔坐标系中的向量关系,刻画轨迹模式之间的相似度。该方法可应用于分析人的活动模式,可作为个性化推荐的依据,以及可以用于构建和分析基于位置的社会网络。
本发明的目的在于提供一种全新的路线相似度计算方法,该方法基于几何特征,充分考虑到路线在地理空间上的特点,同时具有高准确性和较高计算效率。
本发明公开一种时空轨迹相似度计算方法,包括:
步骤1,定义距离转角率,刻画用户兴趣点的特征;
步骤2,根据经验阈值,识别用户兴趣点;根据轨迹的用户兴趣点计算其公共兴趣点;
步骤3,计算分段之间的相似度以及不相似度,其中所述分段为两个公共兴趣点之间的分段;通过定义分段时间、相似分段、相似路线,计算轨迹之间的相似度以及不相似度,从而得到轨迹相似度。
所述的时空轨迹相似度计算方法,所述步骤1还包括:
步骤21,定义pi-1、pi到pi+1的距离转角率LATatio(p(i-1),p(i),p(i+1)),其中pi-1、pi、pi+1分别为用户兴趣点。
所述的时空轨迹相似度计算方法,包括:距离转角率公式如下
其中,ε是满足下述条件的任意一个常量:
且
其中,是向量的模,是的第二小值。如果ε满足一下不等式:
且
其中,sec和th分别表示第二和第三,因此是的第三小值。
所述的时空轨迹相似度计算方法,所述步骤2还包括:
步骤41,如果ratio>ρ(这里ρ是一个经验阈值),则认为兴趣点p(i)和p(i+1)是同一个兴趣点,IS(j)表示轨迹中的j个兴趣点;为了计算轨迹的相异程度,用IP(j)表示IS(j),IP(j)=(long(j),Lat(j),T(j))是IS(j)中兴趣点的加权平均,其中j是兴趣点的编号,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210162995.2/2.html,转载请声明来源钻瓜专利网。