[发明专利]策略模型获取及参数调整方法、装置及存储介质在审

申请号：	202211086266.3	申请日：	2022-09-06
公开（公告）号：	CN116304655A	公开（公告）日：	2023-06-23
发明（设计）人：	蒋冠莹	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06F18/214	分类号：	G06F18/214;G06N3/0475;G06N3/094;G06N3/092;G06N3/044;G06N3/0442
代理公司：	北京鸿德海业知识产权代理有限公司 11412	代理人：	谷春静
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	策略模型获取参数调整方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了策略模型获取及参数调整方法、装置及存储介质，涉及物联网、深度学习以及大数据处理等人工智能领域，适用于各种流程型工艺场景。其中的策略模型获取方法可包括：构建虚拟仿真环境；利用所述虚拟仿真环境，基于生成对抗模仿学习架构，对虚拟仿真环境智能体以及决策智能体进行训练；将训练得到的决策智能体作为策略模型，用于针对待处理订单对应的待调整参数、根据获取到的工况数据确定出最优参数值，所述待调整参数为能耗相关参数。应用本公开所述方案，可提升节能效果，降低实现成本等。

技术领域

本公开涉及人工智能技术领域，特别涉及物联网、深度学习以及大数据处理等领域的策略模型获取及参数调整方法、装置及存储介质。

背景技术

在制造业生产中，如对于印染行业长车染色机台等流程型工艺，常常面临高能耗问题，从而给企业带来很大的成本压力。

发明内容

本公开提供了策略模型获取及参数调整方法、装置及存储介质。

一种策略模型获取方法，包括：

构建虚拟仿真环境；

利用所述虚拟仿真环境，基于生成对抗模仿学习架构，对虚拟仿真环境智能体以及决策智能体进行训练；

将训练得到的所述决策智能体作为所述策略模型，用于针对待处理订单对应的待调整参数、根据获取到的工况数据确定出最优参数值，所述待调整参数为能耗相关参数。

一种参数调整方法，包括：

针对待处理订单对应的待调整参数，利用策略模型确定出最优参数值，所述策略模型为利用构建的虚拟仿真环境、基于生成对抗模仿学习架构、对虚拟仿真环境智能体和决策智能体进行训练后得到的所述决策智能体；