[发明专利]一种混合动力汽车能量管理策略的加速学习方法在审

专利信息
申请号: 202110333743.0 申请日: 2021-03-29
公开(公告)号: CN113051667A 公开(公告)日: 2021-06-29
发明(设计)人: 彭剑坤;连仁宗;范毅;张思雨;谭华春;伍元凯 申请(专利权)人: 东南大学
主分类号: G06F30/15 分类号: G06F30/15;G06F30/27;G06N3/04;G06N3/08;G06F119/14
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 李想
地址: 210018 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 混合 动力 汽车 能量 管理 策略 加速 学习方法
【权利要求书】:

1.一种混合动力汽车能量管理策略的加速学习方法,其特征在于:学习步骤如下:

步骤一、收集不同混合动力汽车的驾驶工况信息,驾驶工况信息分为:通常使用的标准驾驶工况,历史记录的驾驶工况;确定目标域和源域;

步骤二、基于深度神经网络结构创建Actor网络和Critic网络,为Actor网络和Critic网络各自创建一个目标网络,

步骤三、使用DDPG算法对源域的驾驶工况数据进行训练,以获得迁移学习所需要的内部表征;

步骤四、用步骤三获得的来自源域的内部表征初始化用来训练目标域的Actor网络和Critic网络,

步骤五、随机初始化训练目标域的Actor、Critic网络中的其他参数,并用少量的驾驶工况数据微调目标域的内部表征;

步骤六、目标域混合动力汽车执行训练完成的能量管理策略。

2.根据权利要求1所述的混合动力汽车能量管理策略的加速学习方法,其特征在于:所述的步骤二中使用惯性导航系统和全球定位系统获得混合动力汽车的速度与加速度信息;并根据下列等式求得混合动力汽车在任意时刻的SoC(t):

其中SoC(t)是荷电状态,Voc是开路电压,R0是内阻,Pbatt是在充放电阶段的输出能量,Q0是电池的初始容量,Q是标称电池容量,I(t)是电池在t时刻的电荷量;

通过汽车速度及加速度,定义状态集和行为集如下:

其中v是混合动力汽车的速度,acc是混合动力汽车的加速度,Teng是引擎的扭矩,Weng是引擎的速度,Tmo1是发动机的扭矩;

再定义奖励函数如下:

rewaKd=-{α[Puel(t)+elec(t)]+β[SoCWef-SoC(t)]n}

其中,α表示燃油和电力消耗的权重,β表示电池电量维持系数,SoCWef代表电池的标称SoC值;

构建Actor网络,记为μ(s|θμ),θμ是网络参数,该网络输入参数为当前状态,输出为确定性的动作;

构建Critic网络,记为Q(s,a|θQ),θQ是网络参数,该网络输入参数为Actor网络输出的确定性动作、当前状态,输出值函数和梯度信息;

分别建立Actor网络、Critic网络的目标网络,目标网络的网络结构和参数与对应网络相同,记θμ′为Actor网络的目标网络的参数,θQ′为Critic网络的目标网络的参数;应用构建完成的Actor网络、Critic网络的目标网络对训练网络的HEV能量管理策略。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110333743.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top