[发明专利]面向遗传模糊推理的随机策略转化方法在审
申请号: | 201810797815.5 | 申请日: | 2018-07-19 |
公开(公告)号: | CN109165739A | 公开(公告)日: | 2019-01-08 |
发明(设计)人: | 费思邈;管聪;杨芳 | 申请(专利权)人: | 中国航空工业集团公司沈阳飞机设计研究所 |
主分类号: | G06N5/04 | 分类号: | G06N5/04 |
代理公司: | 北京航信高科知识产权代理事务所(普通合伙) 11526 | 代理人: | 王子溟 |
地址: | 110035 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向遗传模糊推理的随机策略转化方法,包括:假设模糊推理树所代表的策略用π(s,θ)=a表示,由于模糊推理树是由多个模糊推理系统组成,因此,将策略改写成π(s,FISi(θii))=a;设定输出动作action为分布采样形态;利用第i个输出节点FISouti构建动作分布参数,形成动作生成分布;利用分布采样技术输出相应的动作。本发明能够解决GFT算法模型在零和博弈中不能保证收敛到纳什均衡的问题,通过将GFT由确定性策略转化为随机策略,使其经过充分的自博弈训练之后具备收敛到纳什均衡的能力。 | ||
搜索关键词: | 模糊推理 随机策略 博弈 收敛 转化 遗传 均衡 模糊推理系统 采样技术 动作生成 分布参数 输出动作 输出节点 算法模型 采样 构建 确定性 改写 输出 保证 | ||
【主权项】:
1.一种面向遗传模糊推理的随机策略转化方法,其特征在于,包括模糊推理树所代表的策略用π(s,θ)=a表示,将所述模糊推理树所代表的策略改写成π(s,FISi(θi))=a;设定输出动作action为分布采样形态;利用第i个输出节点FISouti构建动作分布参数,形成动作生成分布;利用分布采样技术输出相应的动作;其中,s为模糊推理树的输入量全集,a为为模糊推理树经过随机策略转化最终输出的动作值,θi为模糊推理树中第i个模糊推理系统所包含的参数,FISi(θi)为模糊推理树第i个输出节点取值,π(s,FISi(θi))为以一定的概率阈值并且以FISi(θi)作为分布参数进行采样。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航空工业集团公司沈阳飞机设计研究所,未经中国航空工业集团公司沈阳飞机设计研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810797815.5/,转载请声明来源钻瓜专利网。