[发明专利]策略模型获取及参数调整方法、装置及存储介质在审
申请号: | 202211086266.3 | 申请日: | 2022-09-06 |
公开(公告)号: | CN116304655A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 蒋冠莹 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06N3/0475;G06N3/094;G06N3/092;G06N3/044;G06N3/0442 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 谷春静 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 策略 模型 获取 参数 调整 方法 装置 存储 介质 | ||
本公开提供了策略模型获取及参数调整方法、装置及存储介质,涉及物联网、深度学习以及大数据处理等人工智能领域,适用于各种流程型工艺场景。其中的策略模型获取方法可包括:构建虚拟仿真环境;利用所述虚拟仿真环境,基于生成对抗模仿学习架构,对虚拟仿真环境智能体以及决策智能体进行训练;将训练得到的决策智能体作为策略模型,用于针对待处理订单对应的待调整参数、根据获取到的工况数据确定出最优参数值,所述待调整参数为能耗相关参数。应用本公开所述方案,可提升节能效果,降低实现成本等。
技术领域
本公开涉及人工智能技术领域,特别涉及物联网、深度学习以及大数据处理等领域的策略模型获取及参数调整方法、装置及存储介质。
背景技术
在制造业生产中,如对于印染行业长车染色机台等流程型工艺,常常面临高能耗问题,从而给企业带来很大的成本压力。
发明内容
本公开提供了策略模型获取及参数调整方法、装置及存储介质。
一种策略模型获取方法,包括:
构建虚拟仿真环境;
利用所述虚拟仿真环境,基于生成对抗模仿学习架构,对虚拟仿真环境智能体以及决策智能体进行训练;
将训练得到的所述决策智能体作为所述策略模型,用于针对待处理订单对应的待调整参数、根据获取到的工况数据确定出最优参数值,所述待调整参数为能耗相关参数。
一种参数调整方法,包括:
针对待处理订单对应的待调整参数,利用策略模型确定出最优参数值,所述策略模型为利用构建的虚拟仿真环境、基于生成对抗模仿学习架构、对虚拟仿真环境智能体和决策智能体进行训练后得到的所述决策智能体;
根据所述最优参数值对所述待调整参数进行调整。
一种策略模型获取装置,包括:构建模块、训练模型以及获取模块;
所述构建模块,用于构建虚拟仿真环境;
所述训练模块,用于利用所述虚拟仿真环境,基于生成对抗模仿学习架构,对虚拟仿真环境智能体以及决策智能体进行训练;
所述获取模块,用于将训练得到的所述决策智能体作为所述策略模型,用于针对待处理订单对应的待调整参数、根据获取到的工况数据确定出最优参数值,所述待调整参数为能耗相关参数。
一种参数调整装置,包括:确定模块以及调整模块;
所述确定模块,用于针对待处理订单对应的待调整参数,利用策略模型确定出最优参数值,所述策略模型为利用构建的虚拟仿真环境、基于生成对抗模仿学习架构、对虚拟仿真环境智能体和决策智能体进行训练后得到的所述决策智能体;
所述调整模块,用于根据所述最优参数值对所述待调整参数进行调整。
一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如以上所述的方法。
一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行如以上所述的方法。
一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如以上所述的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211086266.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:内网主机识别方法、装置、电子设备和存储介质
- 下一篇:黄花菜智能养护控制系统