[发明专利]基于UCT算法的亚马逊棋机器博弈系统在审
申请号: | 201710247262.1 | 申请日: | 2017-04-14 |
公开(公告)号: | CN107050839A | 公开(公告)日: | 2017-08-18 |
发明(设计)人: | 李学俊;陈睿卿;刘剑秋;陆梦轩;朱二周 | 申请(专利权)人: | 安徽大学 |
主分类号: | A63F3/02 | 分类号: | A63F3/02;A63F3/00;A63F13/822 |
代理公司: | 南京知识律师事务所32207 | 代理人: | 高玲玲 |
地址: | 230039*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 uct 算法 亚马逊 机器 博弈 系统 | ||
技术领域
本发明属于机器博弈棋类竞技游戏博弈水平的研究领域,特别涉及一种基于UCT算法的亚马逊棋机器博弈系统。
技术背景
1.机器博弈
机器博弈,也称计算机博弈,就是指计算机通过运行人类编写的程序,模拟人类在下棋时复杂的思维,从而让计算机像人类一样具有下棋的能力,下国际象棋,五子棋,西洋跳棋,中国象棋等等。计算机博弈作为人工智能领域一个非常重要而且极具挑战性的课题,在最开始人工智能领域的研究,正是从计算机下棋开始。早在上世纪50年代,计算机和信息论的先驱者阿兰·图灵(Alan Turing)、克劳德·香浓(Claude Shannon)等大师就都非常重视计算机博弈的研究。人类开发下棋软件就是让计算机模仿人脑进行思维。如果能够掌握下棋的本质,也就掌握了人类智能行为的核心,那些能够存在于下棋活动中的重大原则,或许就存在于其他任何需要的人类智能活动中。
2016年3月10日,一场震惊世界的围棋大战在AlphaGo与李世石之间展开并且最终AlphaGo取得了胜利,2017年1月4日,升级版的AlphaGo匿名为Master在网络上横扫了中、日、韩三国的世界顶尖围棋手后以60胜0负1平完美收官,使我们不得不重新审视计算机博弈这个可以颠覆人类认知的领域。
2.亚马逊棋简介
亚马逊棋属于两人对弈确定性的棋盘类游戏,属于零和游戏(游戏双方在游戏结束时肯定会分出胜负),于1988年由阿根廷的Walter Zamkauskas发明。1922年西班牙的游戏杂志发布了相应的游戏规则;1993年,Michael Keller推荐进入到“kNight Of The Square Table”邮政游戏俱乐部,从此之后被逐步得到推广。2000年和2001年的国际计算机奥林匹克锦标赛都开展了亚马逊棋的比赛,亚马逊棋也由此推向全世界。亚马逊棋目前已经成为国际计算机奥林匹克锦标赛的常规比赛项目,2011年开始的全国大学生计算机博弈大赛也将其列为比赛项目,也是比赛参与者较多的项目之一。
亚马逊棋的规则比较简单,棋子下棋的规则与设置障碍的规则相同。只要理解下棋的规则,障碍设置的规则就迎刃而解。具体规则如下:
(1)在10*10的棋盘上红方(或白方)在A4、D1、G1和J4位置上摆放白方的四个皇后,蓝方(或黑方)在A7、D10、G10和J7位置上摆放四个皇后。
(2)皇后可下棋的位置与国际象棋皇后下法的规则相同。
(3)由红方(或白方)开始游戏,每轮下棋由两步组成:
①移动摆放皇后位置,规则和国际象棋皇后走棋的规则相同;
②落子后以当前皇后的位置为基点设置障碍,障碍摆放点的位置和皇后可摆放点的位置相同(即两者使用的规则相同)。
(4)皇后和障碍设置的线路上不得有其他棋子或障碍。
(5)可以完成最后一步的一方为赢家。
3.亚马逊棋博弈的搜索算法
当前的亚马逊棋机器博弈系统所采用的搜索技术多为Alpha-Beta剪枝算法。棋类游戏系统通常是根据当前局面对存在的所有可能情况向下搜索,构造出一棵模拟的树状图,称之为博弈树。由于Alpha-Beta剪枝算法中的α值和β值就是当前棋盘节点的估值,所以亚马逊棋必须有一个期盼的估值函数。估值函数可以将不同的棋盘量化,通过量化后的数字来比较不同的棋盘对于博弈双方的优劣情况。亚马逊棋属于添子类游戏,在开局可行的走法就有两千多种,平均可行的走法也有80多种,形成的博弈树无疑是十分巨大的,因此使得整个博弈树的估值变得十分困难。Alpha-Beta剪枝算法必须要设计一个估值函数对整个博弈树进行估值。然而亚马逊棋走法巨大的特性导致搜索深度无法增加,在比赛时间的限制下基于当代计算机的性能最多能搜索到四至五层,胜率以及稳定性有待提高。
蒙特卡罗方法也称为统计模拟方法,是一种以概率统计理论为基础的一类非常重要的数值计算方法。概率统计方法可以解决亚马逊棋中估值设计随机性强的问题。置信上限树算法又称UCT(Upper Confidence Tree)算法是一种采用概率估值的搜索方法,是蒙特卡罗算法的发展。该方法通过对博弈树中的走法进行快速模拟,计算出UCB(Upper Confidence Bound)值,选择UCB最优的节点作为最佳走法,大大提升了亚马逊棋机器博弈系统的搜索性能。
发明内容
本发明目的是针对现有亚马逊棋博弈系统搜索算法的缺陷,提供一种基于UCT算法的亚马逊棋机器博弈系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710247262.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:落子信号放大采集装置
- 下一篇:一种九宫盲文数独游戏盘