[发明专利]一种基于密度聚类的热点路径分析方法有效
申请号: | 201910231648.2 | 申请日: | 2019-03-26 |
公开(公告)号: | CN110135450B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 徐欣;刁联旺;易侃;李青山 | 申请(专利权)人: | 中电莱斯信息系统有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华;于瀚文 |
地址: | 210007 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 密度 热点 路径 分析 方法 | ||
1.一种用于城市道路交通管理的基于密度聚类的热点路径分析方法,其特征在于,包括如下步骤:
步骤1,针对将目标路径表征为由若干路径点构成的路径点集合,构建相似度距离矩阵;
步骤2,比较两两路径点集合之间的相似度,基于相似度距离矩阵、距离门限ε与密度门限MinPts从路径点集合中挖掘出核心路径集,再根据针对核心路径集的直接密度可达关系,采用密度聚类迭代式地生成由核心路径集聚合成的簇;
步骤3,将各簇的路径点集合众数作为目标热点路径输出;
步骤1包括:
步骤1-1,设定基于出租车轨迹信息采集了n条目标路径相对应的n个路径点集合,每个路径点集合对应一条目标路径,而路径点集合中的每个元素为对应目标路径中的一个路径点,则定义第i个路径点集合Pi和第j个路径点集合Pj之间的Jaccard距离JaccardDist(Pi,Pj)为:
步骤1-2,对路径点集合排序:将n个路径点集合首先按集合大小由大到小、其次按索引值由小到大排序,记为P1、P2、…、Pn,满足|P1|≥|P2|≥…≥|Pn|;
步骤1-3,初始化相似度距离矩阵:设定距离门限ε,初始化相似度距离矩阵DistArray为空,其矩阵大小n×n,即矩阵的行数和列数均为n;
步骤1-3中,距离门限ε取值为所有路径点集合最近邻距离的均值,即:
步骤2包括:
步骤2-1,设置当前集合索引:设置当前路径点集合索引s=1;
步骤2-2,设置待比较集合索引:设置待比较路径点集合索引t=s+1;
步骤2-3,判断待比较集合索引:判断待比较路径点集合索引,如果不满足t≤n且|Pt|/|Ps|≥1-ε,继续步骤2-4,如果满足则执行步骤2-6;
步骤2-4,更新当前集合索引:更新当前集合索引值s=s+1;
步骤2-5,判断当前集合索引:判断当前集合索引,如果满足s≥n,继续步骤2-8,否则,返回步骤2-2;
步骤2-6,计算相似度距离:计算当前集合索引与待比较集合索引对应的两个路径点集合之间的Jaccard距离JaccardDist(Ps,Pt),如果满足JaccardDist(Ps,Pt)≤ε,更新相似度矩阵中对应矩阵单元值:
DistArray[s,t]=JaccardDist(Ps,Pt) (3),
DistArray[s,t]表示相似度距离矩阵DistArray第s行第t列的值;
步骤2-7,更新待比较集合索引:t=t+1,返回步骤2-3;
步骤2-8,计算路径点邻域大小:给定任意路径点集合P,将与路径点集合P的相似度距离在距离门限ε以内的其他所有路径点集合定义为该路径点集合P的ε邻域,记为Nε(P):
Nε(P)={Q|JaccardDist(P,Q)≤εQ≠P} (4),
其中Q表示任意路径点集合Q,根据公式(4)计算各路径点集合Pi的ε邻域大小,记为|Nε(Pi)|;
步骤2-9,构建核心路径集:设定密度门限MinPts,将ε邻域大小不小于MinPts的路径点集合定义为核心路径集,即任一核心路径集CoreP满足:
|Nε(CoreP)|≥MinPts (5);
步骤2-10,基于密度的迭代聚合:分别以各核心路径集作为初始簇,给定距离门限ε与密度门限MinPts,如果两核心路径集CoreP与CoreQ满足:
CoreQ∈Nε(CoreP) (6),
则称核心路径集CoreQ从核心路径集CoreP直接密度可达的,表示为:
CoreP<CoreQ;
如果存在一个长度非零的核心路径集链,使得核心路径集CoreQ与核心路径集CoreP满足如下条件(a)和(b):
(a)CoreP<CoreP1<CoreP2<……<CorePn<CoreQ,且
(b)n≥1 (7),
则称核心路径集CoreQ是从核心路径集CoreP间接密度可达的,表示为:
CoreP<ICoreQ;
如果存在一核心路径集CoreO,使得核心路径集CoreP与CoreQ分别从核心路径集CoreO直接或间接密度可达,即满足如下条件(c)和(d):
(c)CoreO<ICoreP或者CoreO<CoreP,且
(d)CoreO<ICoreQ或者CoreO<CoreQ (8)
则称核心路径集CoreP与CoreQ是密度相连的;
继而,根据距离门限ε与密度门限MinPts,基于密度聚类进行迭代式聚合,聚合直接密度可达、间接密度可达与密度相连的核心路径集后生成的簇数目记为u;
步骤2-11,计算路径集众数:分别针对u个簇C1,C2,……,Cu中的各个簇Ck,Ck包含k’个核心路径集:Ck={CoreP1,CoreP2,……,CorePk’},CorePk’表示第k’个核心路径集,计算簇Ck的路径集众数Modek,其中1≤k≤u,Ck表示第k个簇;
步骤2-10包括:
给定距离门限ε与密度门限MinPts,从任一核心路径集CoreP开始,首先把所有与核心路径集CoreP直接密度可达的核心路径集聚合在一起,直至所有核心路径集都已经被处理,具体过程包括:
步骤2-10-1,判断是否有未处理的核心路径集,如果有继续步骤2-10-2,如果没有继续步骤2-10-3;
步骤2-10-2,针对未处理的任一核心路径集CoreP,把所有满足与核心路径集CoreP直接密度可达的核心路径集聚合在一起,回到步骤2-10-1;
步骤2-10-3,将所有聚合在一起的核心路径集作为同一个簇,输出形成的簇,簇数目记为u;
步骤2-11中,根据如下公式计算簇Ck的路径集众数Modek,
Modek=argminP∑1≤q≤k’JaccardDist(P,CorePq) (9),
其中,P表示路径点集合,CorePq表示簇Ck中的第q个核心路径集,而路径集众数Modek表示当与簇Ck中所有核心路径集Jaccard距离之和最小时对应的路径点集合;
步骤2-11包括:
步骤2-11-1,计算交集系数和并集系数:给定簇Ck,包含k’个核心路径集:Ck={CoreP1,CoreP2,……,CorePk’},先计算簇Ck中包含的路径点字典Ωk:
Ωk=∪1≤q≤k’CorePq’
即路径点字典是簇Ck中所有核心路径集的并集,然后针对路径点字典中的各路径点pr’计算路径点pr在簇Ck各核心路径集CorePq中的交集系数αrq与并集系数βrq’如下式所示:
步骤2-11-2,基于交集系数和并集系数计算路径点与核心路径集的Jaccard距离:路径点集合P={pr}与各核心路径集CorePq的Jaccard距离简化为:
步骤2-11-3,基于交集系数和并集系数计算路径点集合众数:
在城市道路交通管理中,针对挖掘出的热点路径,加强对应道路、红绿灯,以保障道路畅通、控制车流量。
2.根据权利要求1所述的方法,其特征在于:步骤3包括:将Modek作为第k个簇Ck的路径热点输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电莱斯信息系统有限公司,未经中电莱斯信息系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910231648.2/1.html,转载请声明来源钻瓜专利网。