[发明专利]一种基于数据挖掘技术的城市道路停车点统筹分析方法有效
| 申请号: | 202010011087.8 | 申请日: | 2020-01-06 |
| 公开(公告)号: | CN111190942B | 公开(公告)日: | 2022-04-19 |
| 发明(设计)人: | 陈观林;沈佳朋 | 申请(专利权)人: | 浙江大学城市学院 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62;G06Q50/26;G08G1/14 |
| 代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 张羽振 |
| 地址: | 310015*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 数据 挖掘 技术 城市道路 停车 统筹 分析 方法 | ||
1.一种基于数据挖掘技术的城市道路停车点统筹分析方法,其特征在于,包括以下步骤:
步骤1、构造停车点数据集:根据原始的停车数据,从中提取出每个停车点的使用模式特征,对各个停车点的地理位置信息进行归一化处理后,将各停车点的使用模式特征和地理特征结合,作为每个停车点的特征向量;
步骤2、根据实际需求设置停车点特征向量不同维度的不同权重;
步骤3、使用Canopy聚类算法对设定权重之后的停车点数据进行聚类分析,获得估计的聚类个数;
步骤4、根据估计的聚类个数使用基于特征加权的K-means算法对设定权重之后的停车点数据进行聚类分析并得到聚类结果;
步骤5、根据聚类结果进行统筹分析:将属于各个聚类点的停车点数据分别进行累加或者取平均值作为聚类点的停车数据;对各个聚类点的数据进行分析,验证估计的聚类个数是否为较优值;如果不是较优值则重复执行步骤3至步骤4;直到得到较优值;所述较优值为步骤4得到的聚类结果对应的聚类数量K。
2.根据权利要求1所述基于数据挖掘技术的城市道路停车点统筹分析方法,其特征在于,步骤1所述每个停车点的特征向量如下:
〈T1,T2,...,Tn,Lat,Lon (1)
上式中,Ti,i=1,...,n,表示各时段经过归一化处理后的停车数量,n为划分的时段数量,Lat为经过归一化处理后的停车点纬度信息,Lon为经过归一化处理后的停车点经度信息。
3.根据权利要求1所述基于数据挖掘技术的城市道路停车点统筹分析方法,其特征在于,步骤2所述停车点特征向量不同维度的权重值满足以下条件:
wLat=wLon>w1=w2=...=wn (2)
上式中,wLat为停车点纬度信息Lat对应的权重;wLon为停车点经度信息Lon对应的权重;wi分别对应各时段停车数量Ti的权重,i=1,...,n,n为划分的时段数量。
4.根据权利要求1所述的基于数据挖掘技术的城市道路停车点统筹分析方法,其特征在于,步骤3所述Canopy算法的输入为经过加权计算的停车数据集List和两个距离阈值T1、T2;Canopy算法具体算法步骤如下:
1)、将停车数据集合List按照一定的规则进行排序,设定初始距离阈值为T1、T2,且T1T2;
2)、在停车数据集合List中随机挑选一个数据向量P作为中心,并使用粗糙距离计算方式计算P与停车数据集合List中其他样本数据向量之间的距离d;
3)、将2)所得距离d与初始距离阈值T1进行比较,若dT1,则将对应的数据向量放入相同的canopy中,然后将d与初始距离阈值T2进行比较,若dT2,则剔除停车数据集合List内对应的数据向量;
4)、重复执行2)和3),直至停车数据集合List为空。
5.根据权利要求1所述的基于数据挖掘技术的城市道路停车点统筹分析方法,其特征在于:步骤4所述使用基于特征加权的K-means算法在K-means聚类算法计算两点间距离的过程中添加了对权重的计算;
基于特征加权的K-means算法的输入为停车点特征向量fi、迭代次数上限R和聚类数量K;
基于特征加权的K-means算法的输出为K个聚类结果;
基于特征加权的K-means算法的过程为:
1)、r为当前迭代次数,把0赋值给r;
2)、随机选择K个聚类中心m(0);
3)、重复以下操作,直到r>R或者算法达到收敛,此时K个集合的簇内距离之和E达到局部最优;
计算E:
找到局部的最优解使得到的E值最小;
重新计算各个停车点特征向量fi与当前聚类中心的距离,并重新划分聚类C(r):
停车点特征向量fi与聚类中心ml的距离小于停车点特征向量fi与其他任意聚类中心点的距离;
重新计算新的聚类中心m(r+1):
在第r次迭代后,对重新划分的各个聚类点,取其中所有属于该聚类点的停车点特征向量的平均值,所得到的结果作为各个聚类点第r+1次的聚类中心;
把r+1赋值给r;
上式(3)至式(5)中,K为聚类的个数,E为K个集合的簇内距离之和,Cl为第l个聚类,fi为属于聚类点Cl的第i个停车点特征向量,n为特征向量的维度总数,wj为第j个维度特征值的权重,fij为第i个特征向量在第j维度上的特征值,mlj为聚类点Cl的聚类中心ml在第j维度上的特征值;Cl(r)为第r次迭代时的第l个聚类,ml为Cl(r)的聚类中心点,mk为第k个聚类中心点,mkj为聚类中心点在第j维度上的特征值;mlr为第r次迭代时Cl(r)的聚类中心。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学城市学院,未经浙江大学城市学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010011087.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





