[发明专利]网络的训练及设备的控制方法、装置、设备以及存储介质在审
申请号: | 202111672995.2 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114219087A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 刘杰;张胤民;李楚鸣 | 申请(专利权)人: | 上海商汤临港智能科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京中知恒瑞知识产权代理事务所(普通合伙) 11889 | 代理人: | 袁忠林 |
地址: | 200232 上海市浦东新区中国(上海)自由贸易*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供了一种网络的训练及设备的控制方法、装置、设备以及存储介质,其中,该方法包括:从离线数据池中获取训练样本数据;基于所述策略网络以及所述训练样本数据,确定目标策略;基于所述评价网络,对所述目标策略进行评价,生成相应的评价值;所述评价值用于指示所述策略网络调整所述目标策略;基于预设的目标损失函数,对所述评价网络的参数进行调整;其中,所述目标损失函数包括限制损失函数以及利用损失函数,所述限制损失函数用于最小化所述评价值,所述利用损失函数用于最大化所述评价值,且所述限制损失函数与所述利用损失函数之间存在预设的关联关系。本公开实施例,可以提升训练的稳定性。 | ||
搜索关键词: | 网络 训练 设备 控制 方法 装置 以及 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海商汤临港智能科技有限公司,未经上海商汤临港智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111672995.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种无线网络的接入控制系统及方法
- 下一篇:一种二氧化碳除沫控制系统及方法