[发明专利]聚合物品牌切换的控制方法有效
申请号: | 201310419142.7 | 申请日: | 2013-09-13 |
公开(公告)号: | CN103488083A | 公开(公告)日: | 2014-01-01 |
发明(设计)人: | 黄德先;魏宇杰;江永亨 | 申请(专利权)人: | 清华大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 北京聿宏知识产权代理有限公司 11372 | 代理人: | 吴大建;刘华联 |
地址: | 100084 北京市海淀区1*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种聚合物品牌切换的控制方法,包括:获得离线优化轨迹作为系统行为的观测样本集;利用决策树的非参数建模方法基于所述观测样本集建立Q函数的学习模型;基于所述Q函数的学习模型获得最优控制策略并予以实施;收集历史操作轨迹补充到所述观测样本集中,并重复以上步骤,直到停止学习。本发明基于动态批次强化学习的优点,根据观测到的样本数据,借助决策树的建模方法,学习Q函数并从中得到平稳的闭环最优策略。 | ||
搜索关键词: | 聚合物 品牌 切换 控制 方法 | ||
【主权项】:
一种聚合物品牌切换的控制方法,包括:获得离线优化轨迹作为系统行为的观测样本集;利用决策树的非参数建模方法基于所述观测样本集建立Q函数的学习模型;基于所述Q函数的学习模型获得最优控制策略并予以实施;收集历史操作轨迹补充到所述观测样本集中,并重复以上步骤,直到停止学习。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310419142.7/,转载请声明来源钻瓜专利网。
- 上一篇:控制板组件系统及其系统架构
- 下一篇:一种对位标记及其制作方法