[发明专利]一种公交车服务水平可靠性预测方法在审
申请号: | 201711382496.3 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108171367A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 马红伟;孙峣;宋洋;申婵;白子建;赵巍;柯水平;刘亚帝;刘岩;张磊 | 申请(专利权)人: | 天津市市政工程设计研究院 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/30;G06N99/00 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
地址: | 300050 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 公交车 服务水平 可靠性预测 特性向量 样本数据 数据集 置换 归一化预处理 分类决策树 公交车线路 测试数据 数据生成 训练样本 训练集 子节点 最下层 准确率 采样 高维 构建 基尼 剔除 抽取 样本 输出 生长 森林 预测 | ||
一种公交车服务水平可靠性预测方法:选择影响公交车服务水平的因素,并将所述影响公交车服务水平的因素所对应的属性值作为输入的特性向量;构建公交车可靠性预测值;将输入的特性向量数据生成数据集,对数据集进行归一化预处理;对于有S个样本数据点的样本,每次采用随机有放回抽取样本数据的方法采样,得到训练集;剩下为测试数据;进行训练;生成一个分类决策树;将最下层各子节点包含的训练样本值的平均值作为该节点的输出值;生长出一片森林;进行基尼重要性值计算;计算影响公交车服务水平因素的置换重要性值;置换重要性值小于1的因素剔除;预测未来公交车线路的可靠性;计算公交车可靠性预测值的精度。本发明准确率更高,能够处理高维度数据。
技术领域
本发明涉及一种公交车服务水平可靠性预测方法。特别是涉及一种基于随机森林的公交车服务水平可靠性预测方法。
背景技术
在智慧城市快速发展的背景下,智慧交通也受到越来越多的关注,公交到达时间预测已成为近年来研究热点。准确、实时的预测线路运行状态不仅能帮助乘客更好的选择出行路线,也为交通部门科学管理提供科学依据、制定合理的安排。
在中国的大中城市,公共交通的发展并不尽如人意。例如:公交车的正点率较低、公交车辆运行的间隔不一致等。随着生活节奏的加快,出行者越来越希望快速准时的到达目的地,研究公共交通服务水平的可靠性有助于公交到站时刻表的确定,提高运输服务。
可靠性理论在交通领域最早应用于城市道路交通网络,用于评价道路网达到某种服务水平的可靠程度。近年来可靠性理论研究迅速发展,在路网连通可靠性行程时间可靠性、运行准点可靠性等方面均取得了比较成熟的理论成果。公共交通服务的可靠性既是公交企业提高公交运营状况、提高公交服务质量、提高企业服务竞争力的保障,也是增强乘客公交出行便利性的有力保障。
随机森林是一种机器学习算法,在2001由Leo Breiman首次提出。该方法将集成学习理论和随机子空间方法相结合。同支持向量机类似,随机森林也是一种基于学习的预测算法。随机森林方法相比于传统的Logit模型和支持向量机的预测能力,预测的精度总是最优的。此外,随机森林方法已经成功的应用于全基因组关联分析领域。
随机森林,是利用多棵树对样本进行训练并预测的一种分类器。该算法已成功地解决如:语音识别,图像识别,三维物体识别等领域的难题。其在当前的很多数据集上,相对其它算法有着很大的优势,并在训练完后它能够给出哪些特征比较重要,
发明内容
本发明所要解决的技术问题是,提供一种准确率更高、处理高维度数据的公交车服务水平可靠性预测方法。
本发明所采用的技术方案是:一种公交车服务水平可靠性预测方法,包括如下步骤:
1)选择影响公交车服务水平的因素,包括:道路交通状况、交叉口数量、天气状况、停靠站数量、公交专用道长度、港湾车站数量、公交线路运行长度、是否在高峰时段以及是否在休息日/节假日,并将所述影响公交车服务水平的因素所对应的属性值作为输入的特性向量;
2)构建公交车可靠性预测值Rj,j为当前时间段;
3)将输入的特性向量数据生成数据集X,对数据集X进行归一化预处理,从而把样本数据转化为0~1之间的数据;
4)对于有S个样本数据点的样本,每次采用随机有放回抽取样本数据的方法采样S次,得到包含S个样本的训练集;剩下未被选择的样本作为测试数据,得到新数据集X*,新数据集X*包含S*个样本数据;
5)对于新数据集X*中包含的Z个特征向量,训练时随机选择其中的m个特征向量作为输入;m=Z/3,m为整数,且只进不舍;
6)生成一个分类决策树t;
7)将最下层各子节点包含的训练样本值的平均值作为该节点的输出值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津市市政工程设计研究院,未经天津市市政工程设计研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711382496.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理