[发明专利]基于游戏树搜索算法的决策模型数据处理方法及系统在审
申请号: | 202110369855.1 | 申请日: | 2021-04-07 |
公开(公告)号: | CN112765242A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 王嘉旸;雷捷维;李一华;任航;黄伟;熊唤亮;王命延 | 申请(专利权)人: | 中至江西智能技术有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 何世磊 |
地址: | 330100 江西省南*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 游戏 搜索 算法 决策 模型 数据处理 方法 系统 | ||
1.一种基于游戏树搜索算法的决策模型数据处理方法,其特征在于,包括:
在游戏树搜索算法的剪枝策略的设计过程中,利用双深度Q学习算法模型预估在当前出牌决策中出每张牌对应的分数,选择预估得分大于或等于分数阈值的出牌动作来扩展游戏树,以得到对游戏树进行剪枝的结果;
在游戏树搜索算法的估值函数的设计过程中,若游戏树搜索算法能够在限定时间内搜索到游戏终局,则将估值函数设置为游戏终局能够获取到的游戏得分,若游戏树搜索算法不能在限定时间内搜索到游戏终局,则利用双深度Q学习算法模型计算当前游戏节点的每个动作的预估分数,并将预估分数的最大值作为估值函数的值。
2.根据权利要求1所述的基于游戏树搜索算法的决策模型数据处理方法,其特征在于,在游戏树搜索算法的剪枝策略的设计过程中,对于预估得分小于分数阈值的出牌动作不予考虑。
3.根据权利要求2所述的基于游戏树搜索算法的决策模型数据处理方法,其特征在于,在游戏树搜索算法的剪枝策略的设计过程中,利用双深度Q学习算法模型预估在当前出牌决策中出每张牌对应的分数,选择预估得分大于或等于分数阈值的出牌动作来扩展游戏树,以得到对游戏树进行剪枝的结果的步骤具体包括:
获取当前出牌决策状态信息;
将当前出牌决策状态信息输入至双深度Q学习算法模型中,以计算出每张牌对应的预估得分;
将双深度Q学习算法模型计算的预估得分降序排序,选择预估得分排前k个的出牌动作,以得到对游戏树进行剪枝的结果,其余的出牌动作不予考虑,作剪枝处理。
4.根据权利要求1所述的基于游戏树搜索算法的决策模型数据处理方法,其特征在于,所述决策模型为麻将决策模型,在游戏树搜索算法的估值函数的设计过程中,若游戏树搜索算法能够在限定时间内搜索到游戏终局,则将估值函数设置为游戏终局能够获取到的游戏得分,若游戏树搜索算法不能在限定时间内搜索到游戏终局,则利用双深度Q学习算法模型计算当前游戏节点的每个动作的预估分数,并将预估分数的最大值作为估值函数的值的步骤具体包括:
获取当前出牌决策状态下的麻将场面信息;
根据当前出牌决策状态下的麻将场面信息确定当前节点的类型是抓牌节点还是出牌节点;
根据当前节点的类型将当前节点往下展开若干层游戏树进行计算,对于没有达到终局的情况,将双深度Q学习算法模型的拟合值作为当前节点的分数,对于到达终局的情况,则将当前游戏分数作为当前节点的分数。
5.根据权利要求4所述的基于游戏树搜索算法的决策模型数据处理方法,其特征在于,所述麻将场面信息包括手牌信息、副露信息、弃牌信息。
6.一种基于游戏树搜索算法的决策模型数据处理系统,其特征在于,包括:
剪枝策略设计模块,用于在游戏树搜索算法的剪枝策略的设计过程中,利用双深度Q学习算法模型预估在当前出牌决策中出每张牌对应的分数,选择预估得分大于或等于分数阈值的出牌动作来扩展游戏树,以得到对游戏树进行剪枝的结果;
估值函数设计模块,用于在游戏树搜索算法的估值函数的设计过程中,若游戏树搜索算法能够在限定时间内搜索到游戏终局,则将估值函数设置为游戏终局能够获取到的游戏得分,若游戏树搜索算法不能在限定时间内搜索到游戏终局,则利用双深度Q学习算法模型计算当前游戏节点的每个动作的预估分数,并将预估分数的最大值作为估值函数的值。
7.根据权利要求6所述的基于游戏树搜索算法的决策模型数据处理系统,其特征在于,所述剪枝策略设计模块在游戏树搜索算法的剪枝策略的设计过程中,对于预估得分小于分数阈值的出牌动作不予考虑。
8.根据权利要求7所述的基于游戏树搜索算法的决策模型数据处理系统,其特征在于,所述剪枝策略设计模块具体用于:
获取当前出牌决策状态信息;
将当前出牌决策状态信息输入至双深度Q学习算法模型中,以计算出每张牌对应的预估得分;
将双深度Q学习算法模型计算的预估得分降序排序,选择预估得分排前k个的出牌动作,以得到对游戏树进行剪枝的结果,其余的出牌动作不予考虑,作剪枝处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中至江西智能技术有限公司,未经中至江西智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110369855.1/1.html,转载请声明来源钻瓜专利网。