“化学强化”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果558835个，建议您升级VIP下载更多相关专利

[发明专利]阴极射线管用的玻璃壳及其制造方法-CN02806879.3无效
发明人：菅原恒彦;植木干夫 -专利权人：旭硝子株式会社
申请日： 2002-06-11 - 公布日： 2004-05-19 - 主分类号： H01J29/86 文献下载
摘要：本发明为了利用即使对大拉伸真空应力也能确保有效地压缩应力层厚度的化学强化，取得重量轻、安全性和可靠性高的玻璃壳，至少在玻璃管锥的管体部(4)的外表面，利用电场辅助法和糊剂化学强化法使产生最大拉伸真空应力，并且机械强度小、容易破坏的区域局部化学强化，该区域设置强化压缩应力层的注入离子浓度在从玻璃的表面往内部的方向大致按阶梯函数分布的化学强化部分(9)。
阴极射线管用玻璃及其制造方法

[发明专利]基于适合度轨迹的神经网络强化学习方法及系统-CN201710899730.3在审
发明人：王婷婷 -专利权人：中国石油化工股份有限公司;中国石油化工股份有限公司石油物探技术研究院
申请日： 2017-09-28 - 公布日： 2019-04-05 - 主分类号： G06N3/08 文献下载
摘要：本发明公开了一种基于适合度轨迹的神经网络强化学习方法及系统。该神经网络强化学习方法包括：初始化神经网络权值，强化学习参数及适合度轨迹；获取当前环境状态和立即回报值；计算强化学习的Q值函数；获取适合度轨迹和更新神经网络权值；检测新的环境状态和立即回报值；新的环境状态和立即回报值满足结束条件，强化学习结束，不满足结束条件，返回重新检测获取当前环境状态和立即回报值。其优点在于：解决了强化学习面对连续状态空间的函数逼近问题，同时引进的适合度轨迹，对经历过的状态动作正确的访问路径的有效保存，提高神经网络的泛化性能，最后加快算法的收敛速度。
强化学习神经网络适合度环境状态回报结束条件连续状态空间泛化性能访问路径函数逼近状态动作初始化检测算法收敛保存返回更新

[发明专利]一种图像布局、模型训练方法、装置、设备及存储介质-CN202010138426.9在审
发明人：利啟东;胡浩;梁容铭;高玮;杨超龙;黄聿;张超;赵茜 -专利权人：广东博智林机器人有限公司
申请日： 2020-03-03 - 公布日： 2020-06-30 - 主分类号： G06Q30/02 文献下载
摘要：设备及存储介质，其中，图像布局方法包括：从原始图像中提取图像元素，得到元素框架图；确定元素框架图的当前结构化数据；其中，当前结构化数据包括各个图像元素对应的坐标以及长宽长度属性；将当前结构化数据输入到分层强化学习模型中，确定最高评分对应的结构化数据，并基于最高评分对应的结构化数据确定图像布局结果；其中，分层强化学习模型包括第一强化学习模型和第二强化学习模型；第一强化学习模型，用于选择需要移动的目标图像元素，第二强化学习模型用于选择目标图像元素需要移动的方向
一种图像布局模型训练方法装置设备存储介质

[发明专利]基于深度强化学习的股票量化交易方法、存储介质及设备-CN202010718040.5在审
发明人：吝勃;吴炳鑫;史维峰 -专利权人：西北大学
申请日： 2020-07-23 - 公布日： 2020-10-30 - 主分类号： G06Q40/04 文献下载
摘要：本发明公开了一种基于深度强化学习的股票量化交易方法、存储介质及设备，获取基本面数据并进行预处理，构建技术指标因子；根据基本面数据和技术指标因子构建深度残差网络，定义深度强化学习模型并进行训练；对训练好的深度强化学习模型进行回测，分析回测结果验证强化学习模型的有效性；利用回测后的深度强化学习模型构建股票池，获取每只股票的历史数据，传入训练好的目标网络中，计算对应采取动作，完成交易策略构建，根据策略实现股票量化交易。本发明使用引入了深度残差网络的深度强化学习模型来进行股票的量化交易，在提升了模型对股票市场的拟合程度的同时，提高了交易效率。避免了人手工操盘的缺陷。
基于深度强化学习股票量化交易方法存储介质设备

[发明专利]一种基于深度强化学习的加锭策略方法-CN202010608285.2在审
发明人：陈丽娟;陈刚;彭炜;周诗正;赵雪松 -专利权人：武汉钢铁有限公司
申请日： 2020-06-29 - 公布日： 2020-11-03 - 主分类号： G06N3/04 文献下载
摘要：本发明公开了一种基于深度强化学习的加锭策略方法，所述方法包括：将当前生产工艺状态、铝含量目标、液位目标输入深度强化学习神经网络中，使得深度强化学习神经网络基于当前生产工艺状态、铝含量目标、液位目标输出加锭策略，并控制加锭设备执行所述加锭策略对应的加锭动作，实现锌锭的投放，由于深度强化学习神经网络是基于与当前生产工艺状态、铝含量目标、液位目标相同维度的训练样本基于深度强化学习算法训练好的，因此，基于该深度强化学习神经网络输出的加锭策略去控制加锭设备的加锭动作
一种基于深度强化学习策略方法

[发明专利]一种基于分布式协同采样中心式优化的强化学习训练系统及方法-CN202011032658.2在审
发明人：杨理想;王云甘;张侨;王银瑞;范鹏炜 -专利权人：南京星耀智能科技有限公司
申请日： 2020-09-27 - 公布日： 2021-01-08 - 主分类号： G06F9/455 文献下载
摘要：本发明提供了一种基于分布式协同采样中心式优化的强化学习训练系统，包括强化学习算法模块、优先级队列缓存模块、远端奖励回溯模块、中心式优化模块、分布式机器，同时还提供了上述系统的训练方法，是通过对多组分布式采样机，采集仿真环境实例数据库中多组环境案例，进行与服务端之间的信息交互，输出对应环境案例的轨迹数据给客户端；再通过强化学习算法模块的进行配置强化学习算法模型、初始化参数该系统，还提供了上述系统的方法是通过分布式协同采样、C/S架构模式，结合奖励回溯技术，解决强化学习训练系统满足大规模强化学习训练问题，具备优秀的普适性，较高的采样效率。
一种基于分布式协同采样中心优化强化学习训练系统方法

[发明专利]一种基于进化强化学习的机器人对抗方法-CN202110351009.7在审
发明人：张雪波;古明阳;赵铭慧;姜帆 -专利权人：南开大学
申请日： 2021-03-31 - 公布日： 2021-07-09 - 主分类号： G06N3/00 文献下载
摘要：本发明公开了一种基于进化强化学习的机器人对抗方法，包括：构建基于深度强化学习的机器人对抗策略；所述对抗策略为深度确定性策略梯度算法DDPG；结合进化算法与所述对抗策略，形成进化深度确定性策略梯度算法EDDPG该方法考虑使用进化强化学习方法，它是深度强化学习与进化思想的结合，其中，深度强化学习方法无需建模，可以实现对机器人端到端的控制，且具有一定的泛化能力，能够有效解决现有方法存在的问题，进化思想则利用种群提高强化学习的探索能力和稳定性
一种基于进化强化学习机器人对抗方法

[发明专利]一种一步法化学强化钠霞石微晶玻璃的方法及化学强化钠霞石微晶玻璃-CN202110484336.X在审
发明人：王静;李挺政;韩建军;李路瑶 -专利权人：武汉理工大学
申请日： 2021-04-30 - 公布日： 2021-07-23 - 主分类号： C03C10/10 文献下载
摘要：本发明实施例涉及玻璃制备技术领域，具体涉及一种一步法化学强化钠霞石微晶玻璃的方法及化学强化钠霞石微晶玻璃，将钠霞石微晶玻璃在380～480℃下加入硝酸钾熔盐中，保温1～9h后取出，冷却至室温，得到化学强化钠霞石微晶玻璃本发明的方法，克服了一般的微晶玻璃难以进行化学强化的缺点，可以直接与硝酸钾熔盐中K+进行离子交换，实现化学强化，交换深度最高能达到55μm，表面压应力能达到1550MPa以上，化学强化后可以明显提高微晶玻璃的硬度，且透过率最高可达到90％。
一种一步法化学强化霞石玻璃方法

[发明专利]深度强化学习模型的训练方法、装置、介质及电子设备-CN202110351941.X在审
发明人：范嘉骏 -专利权人：北京字节跳动网络技术有限公司
申请日： 2021-03-31 - 公布日： 2021-06-29 - 主分类号： G06N3/08 文献下载
摘要：本公开涉及一种深度强化学习模型的训练方法、装置、介质和电子设备，所述方法包括：获取深度强化学习模型与虚拟环境交互所产生的交互序列，交互序列包括多个采样数据；针对每一采样数据，确定深度强化学习模型的优势函数与该采样数据中的环境状态对应的优势函数值，以及在采样数据对应的决策策略下优势函数值的优势期望，其中，决策策略为基于优势函数和深度强化学习模型中多个具有关联关系的策略参数所形成的策略族函数确定出的；针对每一采样数据，根据采样数据、对应的优势函数值、优势期望以及深度强化学习模型的状态值函数，确定动作价值；基于动作价值确定动作值函数的更新梯度信息；根据更新梯度信息对深度强化学习模型进行更新。
深度强化学习模型训练方法装置介质电子设备

[发明专利]一种基于生成对抗网络的强化学习探索方法-CN202010018402.X在审
发明人：洪伟峻;张伟楠 -专利权人：上海交通大学
申请日： 2020-01-08 - 公布日： 2020-06-09 - 主分类号： G06N20/00 文献下载
摘要：本发明公开了一种基于生成对抗网络的强化学习探索方法，辅助机器人在物流运输场景中进行探索，涉及强化学习探索方法领域。本发明生成对抗网络可以与任意强化学习算法结合使用，且不局限于特定的状态空间，可以针对各种维度、各种类型(连续或离散)的状态空间进行密度估计，从而给出内部奖励。实践证明，生成对抗网络的训练频率在远小于强化学习策略更新频率的情况下效果更为优秀，这意味着本发明相较于不辅助探索的强化学习算法的额外计算开销可以忽略不计，可以用于物流运输等强化学习应用场景中辅助机器人进行探索
一种基于生成对抗网络强化学习探索方法

[发明专利]一种基于边缘计算的强化学习方法、装置与系统-CN202010380253.1在审
发明人：吴栋;周胜平;林俊杰;吴敏;梁乔忠;仲景武 -专利权人：阿尔法云计算（深圳）有限公司
申请日： 2020-05-08 - 公布日： 2021-11-09 - 主分类号： G06N20/00 文献下载
摘要：本发明提出一种基于边缘计算的强化学习方法，所述强化学习过程还有至少一个边缘节点与至少有一个终端设备的参与。所述方法为：云服务器以策略来控制运行于终端设备上的强化学习任务的终端采样；在边缘节点以采集与评估作局部更新，从而得到边缘节点范围内局部的优化策略；边缘节点再将局部优化的结果上报给云服务器，云服务器对强化学习的策略作全局优化并下发，以此完成分布式算力下的强化学习任务。此边缘计算的强化学习方法可以有效利用端边云的算力分布式特点，提升边缘节点数据采集与处理的实时性，降低AI应用的成本，加速AI的应用普及。
一种基于边缘计算强化学习方法装置系统

[发明专利]一种电热耦合系统调度方法、装置、电子设备及其存储介质-CN202110989053.0在审
发明人：孙宏斌;王宣元;席嫣娜;郭庆来;宁卜;张浩;张宏宇;王彬;刘庆时;赵昊天;刘蓁;韦凌霄;潘昭光 -专利权人：清华大学;国网冀北电力有限公司;国网北京市电力公司
申请日： 2021-08-26 - 公布日： 2021-12-10 - 主分类号： G06F30/27 文献下载
摘要：本方法首先构建一个用于电热耦合系统调度的强化学习网络；实时采集电热耦合系统中的量测数据，根据量测数据及电热耦合系统对控制信号的反应情况，对所述强化学习网络进行训练，更新强化学习网络中的参数；利用训练好的强化学习网络克服传统基于模型的优化方法和传统强化学习算法的不足之处，基于附加记忆的强化学习，不依赖于建筑物的精确模型，且可处理电热耦合系统中热传递大时延带来的难以学习的问题，最大限度挖掘负荷侧的灵活性，适于在线应用
一种电热耦合系统调度方法装置电子设备及其存储介质

[发明专利]基于迁移强化学习的碳排放指数预测与治理方法-CN202111047552.4在审
发明人：张志亮;赵永国;杨荣霞;曹熙;张仙梅;郭鑫 -专利权人：南方电网大数据服务有限公司
申请日： 2021-09-07 - 公布日： 2022-01-28 - 主分类号： G06Q10/04 文献下载
摘要：本发明涉及一种基于迁移强化学习的碳排放指数预测与治理方法，是针对现有同类技术中碳排放指数迁移强化学习和预测治理方法较难准确精准预测，以及较难最大化治理的技术问题。其要点是该预测方法通过迁移学习方法对具有相似特征区域的碳排放模型进行迁移，共享碳排放指数预测的信息；将迁移学习预测到的碳排放指数作为强化学习状态的输入，结合强化学习MDP进行碳排放治理建模，构建奖赏函数，运用强化学习算法实现预测。该治理方法利用MDP构建大规模自适应动态治理工具选择和组合，并利用强化学习的方法进行最优化策略求解，这个最优策略将引导整个治理工具组合过程达到最终目标，最优的工具组合方案即为MDP最优策略所对应的动作序列
基于迁移强化学习排放指数预测治理方法

[发明专利]强化学习网络训练方法、装置、电子设备及存储介质-CN202111270024.5在审
发明人：邵昊;陈若冰;刘宇 -专利权人：上海商汤临港智能科技有限公司
申请日： 2021-10-29 - 公布日： 2022-02-01 - 主分类号： G06N3/08 文献下载
摘要：本公开提供了一种强化学习网络训练方法、装置、电子设备及存储介质，该方法包括：获取样本图像的图像特征数据、虚拟车辆的方向盘角度信息、和虚拟车辆对应的导航命令；利用待训练的强化学习网络基于图像特征数据、方向盘角度信息和导航命令，生成对虚拟车辆进行控制的控制信息；基于控制信息和虚拟车辆对应的前一时刻的历史行驶信息，确定虚拟车辆的当前行驶信息；基于当前行驶信息和虚拟车辆对应的当前环境信息，确定待训练强化学习网络的奖励信息；基于奖励信息和控制信息，对待训练强化学习网络进行训练，直至训练后的强化学习网络收敛，得到至少一个训练阶段的目标强化学习网络。
强化学习网络训练方法装置电子设备存储介质

[发明专利]一种基于强化学习的关系抽取方法-CN202111237900.4在审
发明人：章莉莉;刘森淼;王永利;胡镑 -专利权人：江苏腾霜白信息科技有限公司;南京理工大学
申请日： 2021-10-25 - 公布日： 2022-02-11 - 主分类号： G06F16/35 文献下载
摘要：本发明公开了一种基于强化学习的关系抽取方法，基于强化学习的关系抽取模型包括基于强化学习的实例选择器和基于PCNN模型的关系分类器；基于强化学习的实例选择器通过强化学习过程得到选择结果，所述选择结果为相同实体对句子组成的包中最能表达包标签的句子根据输入的句子识别出表达相同关系的语句，对所述实例选择器进行反馈，根据反馈更新策略函数选择句子，再用选择的句子训练出更好的关系分类器，优化实例的选择和关系分类过程；最终选择出最能代表关系标签的句子作为所述基于强化学习的关系抽取模型的训练数据
一种基于强化学习关系抽取方法