[发明专利]汽车能量控制方法、装置及终端设备有效
申请号: | 201711372559.7 | 申请日: | 2017-12-19 |
公开(公告)号: | CN109927711B | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 李卫民;秦斐燕;徐坤;胡悦;刘玢玢 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | B60W20/10 | 分类号: | B60W20/10 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 官建红 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汽车 能量 控制 方法 装置 终端设备 | ||
1.一种汽车能量控制方法,其特征在于,包括:
预测未来时间段[k,k+p-1]内汽车变速箱的需求功率Preq(k+jj),其中,jj=0,1,…,p-1,k为当前时刻,p取正整数;
计算所述未来时间段[k,k+p-1]内汽车的状态向量X(k+jj);
通过动态规划算法和即时差分学习算法,计算汽车在当前时刻k的控制向量U(k),并将所述控制向量U(k)输出给汽车;
所述通过动态规划算法和即时差分学习算法,计算汽车在当前时刻k的控制向量U(k),包括:
判断即时差分学习算法在上一时刻的误差指标是否大于预设阈值;
若是,则结合动态规划算法和即时差分学习算法,计算汽车在当前时刻k的控制向量U(k);
若否,则通过即时差分学习算法,计算汽车在当前时刻k的控制向量U(k)。
2.如权利要求1所述的汽车能量控制方法,其特征在于,所述计算所述未来时间段[k,k+p-1]内汽车的状态向量X(k+jj),包括:
根据汽车变速箱的需求功率Preq(k+jj)计算所述未来时间段[k,k+p-1]内汽车变速箱的需求转矩Treq(k+jj)和车速v(k+jj),计算电池荷电状态SOC(k+jj),得到状态向量X(k+jj)=(Treq(k+jj),v(k+jj),SOC(k+jj))T。
3.如权利要求1或2所述的汽车能量控制方法,其特征在于,所述结合动态规划算法和即时差分学习算法,计算汽车在当前时刻k的控制向量U(k),包括:
通过动态规划算法,计算控制域C内的最优控制向量序列[U0(k),…,UC-1(k+C-1)],并将计算出的第一个控制向量U0(k)假定为当前时刻k的假定控制向量U0(k);采用即时差分学习算法根据汽车当前时刻k的状态向量X(k),在控制域C内预测当前时刻k的预测控制向量U1(k),其中,所述控制域C=p;
根据所述假定控制向量U0(k)和预测控制向量U1(k)计算所述即时差分学习算法当前时刻k的误差指标;
若当前时刻k的误差指标大于所述预设阈值,则将所述假定控制向量U0(k)作为所述汽车在当前时刻k的控制向量U(k);
若当前时刻k的误差指标小于或等于所述预设阈值,则将所述预测控制向量U1(k)作为所述汽车在当前时刻k的控制向量U(k)。
4.如权利要求3所述的汽车能量控制方法,其特征在于,所述采用即时差分学习算法根据汽车当前时刻k的状态向量X(k),在控制域C内预测当前时刻k的预测控制向量U1(k),包括:
初始化当前时刻k的所述即时差分学习算法,初始化训练次数ii=0;
计算当前时刻k的即时差分序列;
计算当前时刻k的预测控制向量U1(k)对权值向量的各分量的梯度;
计算所述权值向量的各分量的增量;
更新所述权值向量的各分量;
判断当前时刻k的训练次数是否小于所述动态规划算法的控制域C;
若是,更新训练次数为ii=ii+1,重新计算当前时刻k的即时差分序列;
若否,输出当前时刻k的权值向量;根据获取到的汽车当前时刻k的状态向量X(k),和所述当前时刻k的权值向量计算当前时刻k的预测控制向量U1(k)。
5.如权利要求4所述的汽车能量控制方法,其特征在于,所述输出当前时刻k的权值向量之后,还包括:若当前时刻k的误差指标小于或等于所述预设阈值,将所述即时差分学习算法在当前时刻的误差指标设置为等于所述预设阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711372559.7/1.html,转载请声明来源钻瓜专利网。