[发明专利]一种基于Spark的路网交通运行分析方法在审
申请号: | 201910129703.7 | 申请日: | 2019-02-21 |
公开(公告)号: | CN109903554A | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 钱超;杨孟;朱熹;许宏科;刘冬伟 | 申请(专利权)人: | 长安大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G06K9/62 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 安彦彦 |
地址: | 710064 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于Spark的路网交通运行分析方法,以实时交通流数据为基础,结合k‑means和随机森林算法构建了路网交通运行态势判别模型;选择分布式文件系统存储和弹性分布式数据集并行处理交通数据,实现了路网交通运行状态的实时判别。本发明利用Spark大数据机器学习平台,结合分布式k‑means算法进行聚类分析,改善了传统的k‑means算法在大数据情况下,算法时效性的问题,实现路网交通运行状态的判别,分析结果可为高速公路管理部门提供实时、可靠的路网运行状态分析服务,同时可为建立高速公路智慧管控平台提供理论依据。 | ||
搜索关键词: | 路网交通 算法 运行分析 运行状态 大数据 分布式文件系统 高速公路管理 运行状态分析 分布式数据 实时交通流 并行处理 管控平台 机器学习 交通数据 聚类分析 判别模型 算法构建 随机森林 运行态势 传统的 时效性 路网 存储 高速公路 服务 | ||
【主权项】:
1.一种基于Spark的路网交通运行分析方法,其特征在于,包括以下步骤:1)首先利用5台PC机搭建包含一个主节点和四个从节点的Spark大数据机器学习平台;主节点作为大数据机器学习平台的控制节点,从节点作为大数据机器学习平台的工作节点,各节点间在一个局域网内通过千兆以太网进行互相连接通信;2)以实时的交通流数据为基础,在Spark大数据机器学习平台上采用分布式k‑means算法进行交通运行状态聚类,并输出最佳的交通运行状态聚类结果T′;根据实际的交通流运行情况将最佳的交通运行状态聚类结果T′中不同簇中的交通流数据赋予一个交通运行状态,其最终的聚类结果为T={(xi,Mj);i=1,2,...,n;j=1,2,...,5},其中xi表示交通流运行数据,包括交通流量、速度和占有率,n为数据集记录数,Mj表示交通流运行数据聚类后的交通运行状态;3)在交通运行状态聚类分析完成后,在Spark大数据机器学习平台上采用随机森林算法对最终的聚类结果T进行训练,利用训练完成的模型建立交通运行状态判别规则,实现路网交通运行状态判别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长安大学,未经长安大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910129703.7/,转载请声明来源钻瓜专利网。