专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果558835个,建议您升级VIP下载更多相关专利
  • [发明专利]基于深度强化习的股票量化交易方法、存储介质及设备-CN202010718040.5在审
  • 吝勃;吴炳鑫;史维峰 - 西北大学
  • 2020-07-23 - 2020-10-30 - G06Q40/04
  • 本发明公开了一种基于深度强化习的股票量化交易方法、存储介质及设备,获取基本面数据并进行预处理,构建技术指标因子;根据基本面数据和技术指标因子构建深度残差网络,定义深度强化习模型并进行训练;对训练好的深度强化习模型进行回测,分析回测结果验证强化习模型的有效性;利用回测后的深度强化习模型构建股票池,获取每只股票的历史数据,传入训练好的目标网络中,计算对应采取动作,完成交易策略构建,根据策略实现股票量化交易。本发明使用引入了深度残差网络的深度强化习模型来进行股票的量化交易,在提升了模型对股票市场的拟合程度的同时,提高了交易效率。避免了人手工操盘的缺陷。
  • 基于深度强化学习股票量化交易方法存储介质设备
  • [发明专利]一种基于深度强化习的加锭策略方法-CN202010608285.2在审
  • 陈丽娟;陈刚;彭炜;周诗正;赵雪松 - 武汉钢铁有限公司
  • 2020-06-29 - 2020-11-03 - G06N3/04
  • 本发明公开了一种基于深度强化习的加锭策略方法,所述方法包括:将当前生产工艺状态、铝含量目标、液位目标输入深度强化习神经网络中,使得深度强化习神经网络基于当前生产工艺状态、铝含量目标、液位目标输出加锭策略,并控制加锭设备执行所述加锭策略对应的加锭动作,实现锌锭的投放,由于深度强化习神经网络是基于与当前生产工艺状态、铝含量目标、液位目标相同维度的训练样本基于深度强化习算法训练好的,因此,基于该深度强化习神经网络输出的加锭策略去控制加锭设备的加锭动作
  • 一种基于深度强化学习策略方法
  • [发明专利]深度强化习模型的训练方法、装置、介质及电子设备-CN202110351941.X在审
  • 范嘉骏 - 北京字节跳动网络技术有限公司
  • 2021-03-31 - 2021-06-29 - G06N3/08
  • 本公开涉及一种深度强化习模型的训练方法、装置、介质和电子设备,所述方法包括:获取深度强化习模型与虚拟环境交互所产生的交互序列,交互序列包括多个采样数据;针对每一采样数据,确定深度强化习模型的优势函数与该采样数据中的环境状态对应的优势函数值,以及在采样数据对应的决策策略下优势函数值的优势期望,其中,决策策略为基于优势函数和深度强化习模型中多个具有关联关系的策略参数所形成的策略族函数确定出的;针对每一采样数据,根据采样数据、对应的优势函数值、优势期望以及深度强化习模型的状态值函数,确定动作价值;基于动作价值确定动作值函数的更新梯度信息;根据更新梯度信息对深度强化习模型进行更新。
  • 深度强化学习模型训练方法装置介质电子设备
  • [发明专利]一种基于生成对抗网络的强化习探索方法-CN202010018402.X在审
  • 洪伟峻;张伟楠 - 上海交通大学
  • 2020-01-08 - 2020-06-09 - G06N20/00
  • 本发明公开了一种基于生成对抗网络的强化习探索方法,辅助机器人在物流运输场景中进行探索,涉及强化习探索方法领域。本发明生成对抗网络可以与任意强化习算法结合使用,且不局限于特定的状态空间,可以针对各种维度、各种类型(连续或离散)的状态空间进行密度估计,从而给出内部奖励。实践证明,生成对抗网络的训练频率在远小于强化习策略更新频率的情况下效果更为优秀,这意味着本发明相较于不辅助探索的强化习算法的额外计算开销可以忽略不计,可以用于物流运输等强化习应用场景中辅助机器人进行探索
  • 一种基于生成对抗网络强化学习探索方法
  • [发明专利]基于迁移强化习的碳排放指数预测与治理方法-CN202111047552.4在审
  • 张志亮;赵永国;杨荣霞;曹熙;张仙梅;郭鑫 - 南方电网大数据服务有限公司
  • 2021-09-07 - 2022-01-28 - G06Q10/04
  • 本发明涉及一种基于迁移强化习的碳排放指数预测与治理方法,是针对现有同类技术中碳排放指数迁移强化习和预测治理方法较难准确精准预测,以及较难最大化治理的技术问题。其要点是该预测方法通过迁移学习方法对具有相似特征区域的碳排放模型进行迁移,共享碳排放指数预测的信息;将迁移学习预测到的碳排放指数作为强化习状态的输入,结合强化习MDP进行碳排放治理建模,构建奖赏函数,运用强化习算法实现预测。该治理方法利用MDP构建大规模自适应动态治理工具选择和组合,并利用强化习的方法进行最优化策略求解,这个最优策略将引导整个治理工具组合过程达到最终目标,最优的工具组合方案即为MDP最优策略所对应的动作序列
  • 基于迁移强化学习排放指数预测治理方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top