[发明专利]一种混合动力汽车能量管理策略的加速学习方法在审
申请号: | 202110333743.0 | 申请日: | 2021-03-29 |
公开(公告)号: | CN113051667A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 彭剑坤;连仁宗;范毅;张思雨;谭华春;伍元凯 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F30/15 | 分类号: | G06F30/15;G06F30/27;G06N3/04;G06N3/08;G06F119/14 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 李想 |
地址: | 210018 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 混合 动力 汽车 能量 管理 策略 加速 学习方法 | ||
1.一种混合动力汽车能量管理策略的加速学习方法,其特征在于:学习步骤如下:
步骤一、收集不同混合动力汽车的驾驶工况信息,驾驶工况信息分为:通常使用的标准驾驶工况,历史记录的驾驶工况;确定目标域和源域;
步骤二、基于深度神经网络结构创建Actor网络和Critic网络,为Actor网络和Critic网络各自创建一个目标网络,
步骤三、使用DDPG算法对源域的驾驶工况数据进行训练,以获得迁移学习所需要的内部表征;
步骤四、用步骤三获得的来自源域的内部表征初始化用来训练目标域的Actor网络和Critic网络,
步骤五、随机初始化训练目标域的Actor、Critic网络中的其他参数,并用少量的驾驶工况数据微调目标域的内部表征;
步骤六、目标域混合动力汽车执行训练完成的能量管理策略。
2.根据权利要求1所述的混合动力汽车能量管理策略的加速学习方法,其特征在于:所述的步骤二中使用惯性导航系统和全球定位系统获得混合动力汽车的速度与加速度信息;并根据下列等式求得混合动力汽车在任意时刻的SoC(t):
其中SoC(t)是荷电状态,Voc是开路电压,R0是内阻,Pbatt是在充放电阶段的输出能量,Q0是电池的初始容量,Q是标称电池容量,I(t)是电池在t时刻的电荷量;
通过汽车速度及加速度,定义状态集和行为集如下:
其中v是混合动力汽车的速度,acc是混合动力汽车的加速度,Teng是引擎的扭矩,Weng是引擎的速度,Tmo1是发动机的扭矩;
再定义奖励函数如下:
rewaKd=-{α[Puel(t)+elec(t)]+β[SoCWef-SoC(t)]n}
其中,α表示燃油和电力消耗的权重,β表示电池电量维持系数,SoCWef代表电池的标称SoC值;
构建Actor网络,记为μ(s|θμ),θμ是网络参数,该网络输入参数为当前状态,输出为确定性的动作;
构建Critic网络,记为Q(s,a|θQ),θQ是网络参数,该网络输入参数为Actor网络输出的确定性动作、当前状态,输出值函数和梯度信息;
分别建立Actor网络、Critic网络的目标网络,目标网络的网络结构和参数与对应网络相同,记θμ′为Actor网络的目标网络的参数,θQ′为Critic网络的目标网络的参数;应用构建完成的Actor网络、Critic网络的目标网络对训练网络的HEV能量管理策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110333743.0/1.html,转载请声明来源钻瓜专利网。