专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果608791个,建议您升级VIP下载更多相关专利
  • [发明专利]一种被用于无线通信的通信节点中的方法和装置-CN202210273378.3在审
  • 于巧玲;张晓博 - 上海朗帛通信技术有限公司
  • 2022-03-18 - 2023-09-22 - H04W52/02
  • 通信节点接收第一消息,所述第一消息指示目标无线承载集合,所述第一消息被用于确定进入或维持RRC不活跃状态;作为所述第一消息被接收的响应,根据至少第一条件集合是否被满足确定是否执行第一动作集合,所述第一动作集合包括挂起第一无线承载;所述目标无线承载集合中包括至少一个无线承载,所述第一无线承载是所述目标无线承载集合的一个无线承载;所述第一条件集合中的一个条件与第二消息有关,所述第二消息被用于确定是否维持所述第一无线承载的状态;如果所述第一条件集合被满足,执行所述第一动作集合;如果所述第一条件集合中的至少一个条件不被满足,所述第一动作集合不被执行。
  • 一种用于无线通信通信节点中的方法装置
  • [发明专利]自动驾驶策略的训练方法、自动驾驶方法、设备和车辆-CN202010878168.8有效
  • 由长喜 - 腾讯科技(深圳)有限公司
  • 2020-08-27 - 2022-02-01 - B60W60/00
  • 本申请公开了一种自动驾驶策略的训练方法,包括:确定状态集合,其表示自动驾驶车辆的至少两个目标环境区域的可用性;确定动作集合,其表示自动驾驶车辆的驾驶动作;确定状态转移,转移后的状态是自动驾驶车辆在执行所决策的动作后、道路中的至少一个障碍物各自执行动作集合中的一个动作之后,自动驾驶车辆的至少两个目标环境区域的可用性;确定收益函数,其表示针对自动驾驶车辆的驾驶动作的评价;基于上述确定,在训练环境下使用强化学习方法获取最优策略,训练环境给定至少一个障碍物执行动作集合中的各个动作的概率。
  • 自动驾驶策略训练方法设备车辆
  • [发明专利]基于多智能体强化学习的动作集合输出方法及系统-CN202010705611.1在审
  • 赵佳 - 赵佳
  • 2020-07-21 - 2020-10-30 - G06K9/62
  • 本发明公开了基于多智能体强化学习的动作集合输出方法及系统,方法包括S1、构建树结构的模型架构;S2、将步骤S1中构建的树结构中的每个子节点均建模为智能体,并通过层级化扩展的马尔科夫博弈建模多智能体强化学习系统;S3、所有智能体与环境交互,进行强化学习训练以形成动作集合输出模型;S4、利用基于多智能体强化学习动作集合输出模型对待处理的动作空间中的各动作进行评分,生成目标动作集合进行推荐。本发明使用多智能体强化学习方法处理大规模动作空间的动作集合决策问题,可以获得良好的可扩展性、更精准更快的训练和推理速度;本发明使用MCTS算法增加上层智能体决策的信息量,可进行有效的搜索,得到更加准确的决策
  • 基于智能强化学习动作集合输出方法系统
  • [发明专利]动作识别方法和装置-CN201910671411.6有效
  • 张洋;张虎 - 张洋;张虎
  • 2019-07-24 - 2023-06-09 - G06F3/01
  • 本申请公开了一种动作识别方法和装置。所述方法包括:采集三轴加速度和三轴角速度;计算合加速度,如果合加速度不等于重力加速度,则判定动作开始;对每个时间窗口,执行如下识别步骤:根据每个轴上的加速度标准差、加速度均值、角速度均值,判定该时间窗口内动作的主运动方向,只保留预设动作集合中与主运动方向一致的预设已知动作,再计算并利用该时间窗口内动作动作特征数据对预设动作集合进行进一步的筛选,筛选后,如果预设动作集合中只有一个预设已知动作,则将该预设已知动作作为识别出的目标动作,否则,执行下一个时间窗口的识别步骤,继续对动作集合进行筛选。
  • 动作识别方法装置
  • [发明专利]用于多维对话行动选择的强化学习代理-CN202211044586.2在审
  • S·凯泽尔;S·斯托扬查夫;R·S·多迪帕特拉 - 株式会社东芝
  • 2022-08-30 - 2023-05-19 - G06F16/332
  • 一种用于在对话系统中产生响应的计算机实现方法,其中所述对话系统用于与用户进行对话,所述方法包括:从用户接收话语;更新对话状态;第一对话行动代理使用第一机器学习模型从第一候选动作集合选择第一候选动作,其中所述第一候选动作集合与第一对话维度相关联;第二对话行动代理使用第二机器学习模型从第二候选动作集合选择第二候选动作,其中所述第二候选动作集合与第二对话维度相关联;评估代理使用第三机器学习模型来选择输出动作,其中所述输出动作包括:所述第一候选动作和/或所述第二候选动作的组合;以及产生系统响应。
  • 用于多维对话行动选择强化学习代理

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top