[发明专利]用于对技术系统、尤其是燃气轮机进行计算机辅助的调节和/或控制的方法有效
申请号: | 200780049091.6 | 申请日: | 2007-12-19 |
公开(公告)号: | CN101573667A | 公开(公告)日: | 2009-11-04 |
发明(设计)人: | V·斯特津格;S·尤德卢夫特 | 申请(专利权)人: | 西门子公司 |
主分类号: | G05B13/02 | 分类号: | G05B13/02;G05B17/02 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 卢 江;刘春元 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 技术 系统 尤其是 燃气轮机 进行 计算机辅助 调节 控制 方法 | ||
1.一种用于对燃气轮机进行计算机辅助的调节和/或控制的方法, 其中:
a)基于该燃气轮机的已知的、在时间上彼此相继的状态(xt)来 建立该燃气轮机的仿真模型;
b)将多种学习方法和/或优化方法应用于该仿真模型,其 中所述学习方法和/或优化方法分别提供所学习的参数以及状态 (xt)与分配给所述状态(xt)的动作(at)的序列作为结果,且 分配给状态(xt)的动作(at)导致所述序列中的新的状态(xt+1);
c)根据所述多种学习方法和/或优化方法的结果,按照预先给定的 标准,从所述多种学习方法和/或优化方法中选出适于调节和/或 控制该燃气轮机的学习方法和/或优化方法,其中根据对所述学习 方法和/或优化方法中的每一种的评价来进行学习方法和/或优化 方法的选出,其中该评价由该仿真模型输出,和/或该评价通过相 应的学习方法和/或优化方法的结果被确定;
d)利用所选出的学习方法和/或优化方法来调节和/或控制该燃气 轮机,其中所述调节和/或控制根据该燃气轮机的状态(xt)来说 明随后要在该燃气轮机处执行的动作(at)。
2.根据权利要求1所述的方法,其中,在步骤d)中,利用所选出 的学习方法基于在步骤b)中所学习的参数来调节和/或控制该燃气轮 机,其中在对该燃气轮机进行调节和/或控制的情况下不改变所学习的 参数。
3.根据权利要求1所述的方法,其中,在步骤d)中,利用所选出 的学习方法来调节和/或控制该燃气轮机,使得在该调节或控制开始时 使用在步骤b)中所学习的参数,这些参数在该调节和/或控制期间借 助于在进行该调节和/或控制的情况下得出的新的状态(xt+1)和动作 (at)被进一步学习。
4.根据权利要求1所述的方法,其中,在步骤d)中,利用所述学 习方法和/或优化方法在步骤b)中所学习的参数被复位,并在调节和/ 或控制该燃气轮机的情况下被重新学习。
5.根据前述权利要求之一所述的方法,其中,在步骤a)中,基于 递归神经网络来建立所使用的仿真模型。
6.根据权利要求1-4之一所述的方法,其中,该评价是该学习方法 和/或优化方法在评价或报酬函数方面的品质的度量。
7.根据权利要求1-4之一所述的方法,其中,所述多种被应用于该 仿真模型的学习方法和/或优化方法包括一种或多种强化学习方法。
8.根据权利要求7所述的方法,其中,所述一种或多种强化学习方 法是基于表格的强化学习方法。
9.根据权利要求1-4之一所述的方法,其中,所述多种被应用于该 仿真模型的学习方法和/或优化方法包括:自适应启发式批评算法、和 /或Q学习算法、和/或优先扫除算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子公司,未经西门子公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780049091.6/1.html,转载请声明来源钻瓜专利网。