[发明专利]一种基于深度学习的列车控制方法有效
申请号: | 201811150477.2 | 申请日: | 2018-09-29 |
公开(公告)号: | CN109204390B | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 刘波;杜恒 | 申请(专利权)人: | 交控科技股份有限公司 |
主分类号: | B61L27/00 | 分类号: | B61L27/00 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 100070 北京市丰台区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 列车 控制 方法 | ||
本发明实施例公开了一种基于深度学习的列车控制方法,包括:从历史数据中筛选得到驾驶经验丰富的司机驾驶列车时的司机驾驶数据;根据司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型;将不同时刻的列车状态输入训练好的深度网络模型,计算得到不同时刻的列车控制量。通过采用深度学习技术对ATO控制算法建模,不需要考虑内在控制过程,极大地简化了问题的复杂性;通过采用驾驶经验丰富的司机的驾驶数据训练深度网络模型,输出不同时刻的列车控制量,当获得新的司机驾驶数据时,对深度网络模型重新进行训练便可得到具有新数据特征的列车控制量,能够在保证列车的准时性和停车精度的前提下,改善列车舒适度,提高乘客乘坐体验。
技术领域
本发明实施例涉及轨道交通技术领域,具体涉及一种基于深度学习的列车控制方法。
背景技术
随着轨道交通的迅捷发展,轨道交通客运量也迅速增加。人们在追求快捷出行的同时,也对列车舒适度提出了更高的需求。在实际应用的ATO(Automatic TrainOperation,列车自动控制)控制算法中,多是利用PID控制算法来计算列车控制量以追踪目标速度,根据当前线路条件的不同,列车控制量的值可能出现较大幅度变化。这会导致列车运行过程不平稳,列车舒适度难以有效保证。
在具备ATO功能的轨道交通线路中,列车可以由ATO控制,也可以由司机控制。通过对两种操作模式下的驾驶数据进行对比可以得出,列车舒适度在由具有丰富驾驶经验司机驾驶列车时较ATO控制条件下具有更好的效果。因此,如何利用司机驾驶列车的经验数据设计更符合人类驾驶习惯的ATO控制算法,以此改善ATO控制条件下的列车舒适度是亟需解决的问题。
发明内容
由于现有方法存在上述问题,本发明实施例提出一种基于深度学习的列车控制方法。
本发明实施例提出一种基于深度学习的列车控制方法,包括:
从历史数据中筛选得到驾驶经验丰富的司机驾驶列车时的司机驾驶数据;
根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型;
将不同时刻的列车状态输入所述训练好的深度网络模型,计算得到不同时刻的列车控制量。
可选地,所述根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型,具体包括:
根据自编码器或受限玻尔兹曼机的预训练方法,采用所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型。
可选地,所述根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型,具体包括:
将所述司机驾驶数据输入初始的深度网络模型,得到目标列车控制量,根据所述目标列车控制量计算得到各时刻的列车状态,并将各时刻的列车状态输入所述初始的深度网络模型进行训练,得到训练好的深度网络模型。
可选地,所述根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型,具体包括:
将所述司机驾驶数据输入初始的深度网络模型,得到当前时刻列车的驾驶策略,并根据当前时刻列车的驾驶策略计算代价函数中各评价部分的值;
其中,所述代价函数的评价部分包括:当前时刻模型输出与司机驾驶数据差异部分、当前时刻下的驾驶策略准时性部分、当前时刻下的驾驶策略停车精度部分以及当前时刻下的驾驶策略舒适度部分;
所述代价函数中各评价部分的值为各评价部分对应的权重。
可选地,所述方法还包括:
若判断获知所述初始的深度网络模型的训练次数小于第一阈值,则增加所述当前时刻模型输出与司机驾驶数据差异部分的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于交控科技股份有限公司,未经交控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811150477.2/2.html,转载请声明来源钻瓜专利网。