[发明专利]一种基于强化学习Q学习的实时整周模糊度快速搜索方法有效
申请号: | 202010061924.8 | 申请日: | 2020-01-19 |
公开(公告)号: | CN111273329B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 林楠;杨大兵;陈刚;满贵鑫;周晓彬 | 申请(专利权)人: | 中国十七冶集团有限公司 |
主分类号: | G01S19/44 | 分类号: | G01S19/44 |
代理公司: | 马鞍山市金桥专利代理有限公司 34111 | 代理人: | 王益西 |
地址: | 243000 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于强化学习Q学习的实时整周模糊度快速搜索方法,属于Q学习技术领域。本发明的步骤为:步骤1、设定Q学习的学习参数以及奖励矩阵;步骤2、初始化模糊度搜索过程的学习矩阵;步骤3、对于学习矩阵的每一个episode,随机选择一个初始状态;步骤4、如果没有达到目标状态,执行以下几步:1)在当前状态中的所有可能行为中选取一个行为;2)利用选定的行为,得到下一个状态;3)按照转移规则计算Q学习的学习矩阵;4)递推至下一个状态;步骤5、利用训练好的学习矩阵,就可以找出一条从任意状态到达目标状态的行为路径。本发明操作简单方便,能够实现对实时模糊度的快速搜索。 | ||
搜索关键词: | 一种 基于 强化 学习 实时 模糊 快速 搜索 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国十七冶集团有限公司,未经中国十七冶集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010061924.8/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G01 测量;测试
G01S 无线电定向;无线电导航;采用无线电波测距或测速;采用无线电波的反射或再辐射的定位或存在检测;采用其他波的类似装置
G01S19-00 卫星无线电信标定位系统;利用这种系统传输的信号确定位置、速度或姿态
G01S19-01 .传输时间戳信息的卫星无线电信标定位系统,例如,GPS [全球定位系统]、GLONASS[全球导航卫星系统]或GALILEO
G01S19-38 .利用卫星无线电信标定位系统传输的信号来确定导航方案
G01S19-39 ..传输带有时间戳信息的卫星无线电信标定位系统,例如GPS [全球定位系统], GLONASS [全球导航卫星系统]或GALILEO
G01S19-40 ...校正位置、速度或姿态
G01S19-42 ...确定位置
G01S 无线电定向;无线电导航;采用无线电波测距或测速;采用无线电波的反射或再辐射的定位或存在检测;采用其他波的类似装置
G01S19-00 卫星无线电信标定位系统;利用这种系统传输的信号确定位置、速度或姿态
G01S19-01 .传输时间戳信息的卫星无线电信标定位系统,例如,GPS [全球定位系统]、GLONASS[全球导航卫星系统]或GALILEO
G01S19-38 .利用卫星无线电信标定位系统传输的信号来确定导航方案
G01S19-39 ..传输带有时间戳信息的卫星无线电信标定位系统,例如GPS [全球定位系统], GLONASS [全球导航卫星系统]或GALILEO
G01S19-40 ...校正位置、速度或姿态
G01S19-42 ...确定位置