[发明专利]一种基于TD3算法的燃料电池汽车能量管理方法有效

专利信息
申请号: 202110506276.7 申请日: 2021-05-10
公开(公告)号: CN113085665B 公开(公告)日: 2022-02-11
发明(设计)人: 唐小林;周海涛;汪锋;胡晓松;邓忠伟;李佳承 申请(专利权)人: 重庆大学
主分类号: B60L58/30 分类号: B60L58/30;G06F30/20
代理公司: 北京同恒源知识产权代理有限公司 11275 代理人: 杨柳岸
地址: 400044 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 td3 算法 燃料电池 汽车 能量 管理 方法
【权利要求书】:

1.一种基于TD3算法的燃料电池汽车能量管理方法,其特征在于,该方法包括以下步骤:

S1:获取燃料电池汽车的车辆状态信息、动力电池状态信息以及燃料电池状态信息;

S2:建立燃料电池汽车能量管理系统模型,包括:整车纵向动力学模型、燃料电池氢耗模型、动力电池等效电路模型、燃料电池衰退模型、动力电池老化模型;

建立的整车纵向动力学模型为:

其中,Pdrive为驱动功率,Pm为需求功率,Pbat为动力电池功率,Pfc为燃料电池功率,mv为车辆的重量,v为速度,a为加速度,Faero为空气阻力,Froll为滚动摩擦,Fgrade为坡度阻力,ηmotor为电机效率,ηDC/DC为DC/DC转换器的效率,ηDC/AC为DC/AC转换器的效率;

建立的燃料电池衰退模型为:

其中,k1为燃料电池输出功率等于或大于80%额定功率时的电压退化率,k2为燃料电池输出功率小于20%时的电压退化率,k3为瞬时负载变化时每千瓦的电压退化率,Phigh和Plow分别为燃料电池的高功率和低功率阈值,ΔP为每采样时间功率的变化,t1为工作点等于或大于80%额定功率的次数,t2为工作点的输出功率小于20%的次数;

建立的动力电池老化模型为:

Qaging=(αSOC+β)·exp((-Ea+η·Crate)/Rgas·TK)Ahz

其中,Qaging为电池的容量衰减,α,β为拟合系数,Ea为活化能,Crate为电流充放电速率,η为Crate的补偿系数,Rgas为气体常数,TK为测试电池时的环境温度,Ah为安时通量,z为幂系数,Qaging,k+1为k+1时刻电池的容量衰减,Qaging,k为k时刻电池的容量衰减,ΔAh为k时刻到k+1时刻的安时通量的变化;Aheff为有效安时通量,σ为严重程度因子,Ibat为锂离子电池电流;

S3:利用TD3算法构建燃料电池汽车能量管理策略,求解包含能耗经济性、燃料电池寿命以及动力电池寿命的多目标优化问题;所述TD3算法是双延迟深度确定性策略梯度算法。

2.根据权利要求1所述的燃料电池汽车能量管理方法,其特征在于,步骤S1中,所述车辆状态信息包括:车辆的速度、电机转速、电机效率以及传动系统;所述动力电池状态信息包括:电池电流、电压、内阻以及SOC;所述燃料电池状态信息包括:燃料电池的功率、效率以及氢耗。

3.根据权利要求1所述的燃料电池汽车能量管理方法,其特征在于,步骤S2中,建立的燃料电池氢耗模型为:

其中,为氢耗量,为氢的低热值,ηfc为燃料电池效率,Pfc为燃料电池功率。

4.根据权利要求1所述的燃料电池汽车能量管理方法,其特征在于,步骤S2中,建立的动力电池等效电路模型为:

其中,Ibat为锂离子电池电流,Voc为锂离子电池开路电压,Rbat为锂离子电池内阻,Pbat为电池功率,SOC(k+1)为下一时刻电池的荷电状态,SOC(k)为当前时刻电池的荷电状态,Δt为离散时间间隔,Qbat为锂离子电池容量。

5.根据权利要求1~4中任意一项所述的燃料电池汽车能量管理方法,其特征在于,所述步骤S3具体包括以下步骤:

S31:状态变量空间为包含燃料电池功率Pfc、车辆的转速w、电池的荷电状态SOC以及电池安时通量Ah的集合,表示为:

S={Pfc,w,SOC,Ah}

S32:在TD3算法中,智能体将当前状态S作为演员网络的输入,并输出一个确定的动作;通过在确定动作的基础上增加噪声来选择最终动作;动作集A={Pfc};

S33:在智能体采取动作后,获得相应的奖励,奖励函数R定义为:

其中,α,β,λ,ω为权重系数;DFC为燃料电池衰退容量,Aheff为有效安时通量;

S34:智能体在采取动作后,获得相应的奖励并且进入下一时刻状态S′,并在经验池中储存经验样本{S,A,R,S′};在经验样本数超过经验池容量时,新的采样经验会覆盖旧的经验;

S35:从经验池中随机抽取小批量经验样本,目标演员网络根据状态S′输出下一时刻动作A′;对动作A′施加随机噪声,即:

A'=πφ′(S')+∈

其中,πφ′为目标演员网络,∈为随机噪声;

S36:使用一对独立的评论家网络估计动作值函数;下一时刻的状态与动作作为目标评论家网络的输入,选择两个网络中输出的最小Q值计算目标值y;评论家网络目标值计算公式为:

其中,γ为折扣因子,为目标评论家网络输出的Q值;然后,利用平方差损失函数更新评论家网络;

S37:更新策略网络时,使用评论家网络进行更新;使用梯度上升法对策略网络进行更新,更新公式为:

其中,为在状态S下,遵从策略π,做出动作所得到奖励的期望;为演员网络梯度,为评论家网络梯度;

S38:当评论家网络估值不准确的时候,演员网络根据不准确的估值往错误的方向进行更新。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110506276.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top