[发明专利]一种高速铁路列车停站方案优化方法有效
申请号: | 202011231937.1 | 申请日: | 2020-11-06 |
公开(公告)号: | CN112329347B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 刘帆洨;彭其渊;鲁工圆;张光远 | 申请(专利权)人: | 西南交通大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F111/06 |
代理公司: | 成都方圆聿联专利代理事务所(普通合伙) 51241 | 代理人: | 宋红宾 |
地址: | 610031 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高速铁路 列车 方案 优化 方法 | ||
1.一种高速铁路列车停站方案优化方法,其特征在于,包括如下步骤:
步骤一:基于车站节点属性特征对车站等级进行划分;
通过输入车站的特征变量,利用聚类分析实现动态划分车站等级,假设参数X={X1,X2,…,XN}T为代表沿线车站的样本,N为车站总数;每个站点都有p个特征变量,即每个特征值可以从实际运行数据中提取出来,包括:列车类型、列车对数和停站策略;
利用模糊c均值聚类方法将车站样本分为C类;每个簇的特征是其样本平均值,称为质心;模型的目标是最小化每个样本和每个聚类的质心之间的加权距离之和,如等式(1)所示:
其中,i代表样本编号,j样本划分的簇数;
m∈[1,∞)是决定聚类结果模糊权重的模糊因子;
uij是聚类j中Xi的隶属度;
Cj是p维特征空间中j类的质心;
dij=‖Xi-Ci‖表示Xi和Ci.之间的欧几里德距离;每个样本和每个簇质心之间的距离由方程(2)中的欧几里德范数计算得到,其中表示第i个变换样本的第k个特征,表示质心Cj在第k维的位置;
模糊划分是通过对方程(1)中所示的目标函数进行迭代优化来进行的,用方程(3)计算更新后的隶属度uij;
簇的质心Cj可以用方程(4)进行更新,h代表簇质心的序号;
当‖Ct+1-Ct‖≤ε时,迭代算法终止,其中ε是停止准则,Ct是一个最大迭代次数t时,k×p簇的质心;根据Xie-Beni和分离系数方法得到最佳簇数;根据最佳簇数结果得到车站节点级数;根据各簇的平均得分,可得到各站的等级,各簇的平均得分根据特征平均值计算得到;fij为j簇中车站j的特征平均值;j组的平均分数Fj可表示为:
站点级别由平均分数组成:分数越大,站点级别越高;
步骤二、基于马尔可夫决策过程的建立列车停站方案模型;
(1)模型结构设置;
基于标准马尔可夫过程进行改进,设计列车停站方案优化模型;马尔可夫决策过程存在一个五元参数组S,a,p,r,N,其中:
S:是状态s的有限集合,表示每个车站的停站信息;
A:是决策a的有限集合,包括所有可能的决策;
p(st+1|st,a):是状态st通过决策a转移到st+1的概率;
r(st+1,a):是系统从st状态转换到st+1状态的受益值;
N:是一组有限的状态转移次数;N={1…T},t∈[1…T],T是最大次数;
模型的目标是寻找能产生最优策略π的一系列决策,使得最终受益值最大化;该目标通过效用函数的最大化表示:
Rπ(s)=R(s)+γ∑s′p(s,π(s),s′)rπ(s′) (7)
R代表累计受益值,Rπ代表最优累计受益值,参数γ是折扣因子,利于函数的收敛;
(2)决策集合;
决策集A的范围是从最小停站数到最大列车停站数m之间,表示为A={2,3,…,m};每一次决策都对应一组停车方案,这组方案被称为状态子集,这是由于不同列车选择不同车站停靠方式而产生,决策参数即为列车停站次数;
(3)状态与状态过滤
本技术方案中包含两种状态集,一种是对应任意决策的状态子集,另一种是由各状态子集提取最大即时受益值而得到的适应性状态集;
令s为车站n的服务总次数,wt为停车方案总数,t为当前状态转移次数t∈[1,2,…,T],n={n1,n2,…,nz,…,nZ};车站顺序表示为z∈{1,2,…,Z},1≤z≤Z;状态集可以表示为
S={s|s=n,wt=n1,n2,…,nZ,wt} (8)
再定义两种约束:垂直约束与横向约束;
垂直约束由两部分组成:
第一部分是,在当前t内,每个车站的最大停站数必须小于或等于所有列车的最大停站数,所有列车的最大停站数表示为每个车站的最大停站数为n=n1,n2,…,nZ;
第二部分是,每个站点的剩余停站次数从当前状态s到最后一个状态s在站点z的剩余停站次数必须等于剩余状态数该值与每个车站的最大停站次数有关;
横向约束是每列车的最大停车次数;每列车的停站次数ht必须小于或等于其阈值δt;
以γz为z站的列车停站率,由车站总数和各站的上下客流量决定,表示为:
式中,f1和f2分别是从车站i出发的客流和到达车站i的客流;ρ为该区间的客流密度;系数α是依据同一类型列车的平均停站次数来取值的,铁路部门通常会给出这个数值;βz是基于车站等级的权重系数,表示为:
得到每个站点的最大停止时间qz=γz×Q,其中Q是最大站点数;
为了保持模型的性能,需要通过子状态集计算每一种决策的即时受益值,从子状态集中的所有备选方案中选择即时受益值最高的停车方案,进而得到适应性状态集,表示为max{rm(s,a)},m∈[1,…,M],M是决策a状态子集中最大停车方案数量;适应性状态集对应的停车方案集合表示为:
max{rm(s,a)},m∈[1,…,M] (11)
(4)受益值定义;
受益值由每列车停车方案的跳站均衡值描述;有两种受益值:期望受益值和即时受益值;即时受益值是每一停车方案产生所得到的受益值;期望受益值可通过计算适应性状态集,即所有停车方案的即时受益值得到;令xtz表示t次列车是否计划停靠z站,xtz为0代表列车t不会停靠z站,如果为1则反之;
由此,受益值可函数表示为
式中:qtz=z·xtz,xtz≠0;z为按升序排列的车站序列值;vt为t次列车停站平均跳过的车站数量;是列车t的最大停车次数,期望受益值即为每次生成新停车方案的即时受益值之和;
(5)转移概率;
每一次决策中,生成不同停车方案的概率值,状态转移概率表示为:
式中表示从当前状态s′,在决策a下转换到新状态s的概率;
(6)基于改进马尔可夫决策过程建立停站方案优化模型;
期望受益值通过迭代每次状态转移生成新停车方案的均衡指数来计算;因此,期望受益值通过每次不同的即时受益值迭代计算获得;而最优决策策略则应是具有最大期望受益值所对应的决策链,该策略可描述为:
其中γ∈[0,1]是折扣因子;该模型可以用经典的相对值迭代算法来求解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011231937.1/1.html,转载请声明来源钻瓜专利网。