[发明专利]一种基于乘客出行多维特征的共享巴士站点客流预测方法有效
申请号: | 201711233503.3 | 申请日: | 2017-11-30 |
公开(公告)号: | CN107730893B | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 孔祥杰;李梦琳;付振寰;郑超凡;惠煌;夏锋 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪;侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于共享巴士数据的站点乘客流预测方法,首先对共享巴士数据进行预处理,然后基于共享巴士行车规律对数据进行时间划分,之后根据预测目标的特点,从时间划分后的数据中提取出预测的多维特征,包括时间特征、周次特征、位置特征、历史流量特征和时间间隔特征,随后利用上述特征对机器学习模型XGBoost进行训练,得到预测模型,最后基于预测模型,得到站点乘客流预测结果,并对预测结果进行展示和评估。本发明能够利用机器学习算法对共享巴士站点客流量进行精准地预测,特别针对于“最后一公里”问题中从居民区到其附近地铁站的细分场景,为优化共享巴士运营提供建设性意见,具有可行性强、准确率高、稳定性强的特点。 | ||
搜索关键词: | 一种 基于 乘客 出行 多维 特征 共享 巴士 站点 客流 预测 方法 | ||
【主权项】:
1.一种基于乘客出行多维特征的共享巴士站点客流预测方法,其特征在于,步骤如下:S1,对共享巴士数据进行预处理S1.1,数据清洗:共享巴士数据包括订单数据和站点时间数据,数据清洗包括清除订单数据的错误记录、缺失值、噪声数据和异常值;S1.2,数据筛选:根据预测目标,剔除现金乘客的订单记录,并提取出预测相关的字段;S2,对步骤S1预处理得到的共享巴士数据进行时间划分;S2.1,根据预测目标,选定研究时间范围,并筛选出研究时间范围内的订单数据;S2.1,时间划分,根据共享巴士的行车规律,对研究时间范围进行时间划分,时间划分公式如下:Tk=α+(kθ,(k+1)θ),k=1,2,...,19其中,Tk代表时间段,α代表起始时间,θ代表时间间隔,k代表时间序号;S3,从步骤S2得到的时间划分后的数据中,提取出乘客出行多维特征;S3.1,时间特征提取:时间是影响交通流量的关键因素,考虑到共享巴士的运行规律,基于时间划分结果,将时间序号作为时间特征的输入;S3.2,周次特征提取:工作日和节假日中,共享巴士的客流变化规律有着很大的区别,为了体现流量预测中的周期性变化规律,将周一到周日映射为0到6七个数值作为周次特征的输入;S3.3,位置特征提取:共享巴士所处不同位置的站点交通流量变化有明显的差异,将不同站点到达最终目的站点的时间作为衡量地理位置特征的参照,地理位置特征同时也在时间层面上反映站点客流变化;S3.4,历史流量特征提取:对于流量预测而言,历史流量数据规律从本质上决定和影响着未来数据的变化趋势,对于历史流量特征,使用该站点前一天、前两天、前三天对应时间片的历史客流作为历史流量特征的输入;S3.5,时间间隔特征提取:共享巴士的车辆数在研究时间范围内的某一时间点发生了变化,基于对各站点客流情况的分析,发现该时间点前后各站点客流规律出现明显变化,用预测目标日与该时间点的距离作为时间间隔特征的输入来衡量车辆数变化因素;S4,利用步骤S3提取得到的多维特征对机器学习模型XGBoost进行训练,得到预测模型;S4.1,特征处理:为过滤掉特征数据中的不稳定因素,对提取的特征进行以下处理:S4.1.1,特征标准化:为将各个特征值处理在同一范围内,避免特征值之间差异过大影响预测效果,利用以下公式对特征进行标准化处理:
其中,x′代表标准化处理后的特征值,x代表未经处理的特征值,
代表特征的平均值,S代表特征向量的标准差;S4.1.2,离散特征处理:机器学习模型XGBoost默认其输入特征均为连续值,因此需对提取的离散特征进行处理,利用one‑hot encoding编码将具有n个状态的变量转换为n维状态;S4.1.3,多项式特征构建:多项式特征构建可扩展特征来适应特征的高维空间,不仅可增加特征数量,也可构建出在特征提取过程中忽略的特征,利用多项式函数进行数据转换,4个特征,度为2的多项式转换公式如下:
其中,x1、x2、x3、x4为原特征,x′p,p=1,2,...,15为转换后的特征;S4.2,机器学习模型XGBoost训练:将步骤S4.1处理过的特征输入到机器学习模型XGBoost中,并根据预测效果对机器学习模型XGBoost进行训练调参,得到共享巴士站点客流预测模型;S5:基于步骤S4共享巴士站点客流预测模型得到站点乘客流预测结果,并对预测结果进行展示和评估;S5.1:站点客流预测结果:基于步骤S4共享巴士站点客流预测模型得到共享巴士各个站点的预测结果;S5.2:预测效果评估:基于S5.1得到的预测结果,利用客流预测准确率衡量指标,包括相关系数CC、均方根误差RMSE和平均绝对误差MAE,评估模型预测效果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711233503.3/,转载请声明来源钻瓜专利网。