美大学联同Facebook开发人工智能玩扑克 击败多名世界顶尖选手
2019-07-12 22:12
美国卡内基-梅隆大学宣布,该校和科技巨头facebook合作开发的人工智能Pluribus,在六人桌德州扑克比赛中击败多名世界顶尖选手,成为机器在多人游戏中战胜人类的一个里程碑。
美国《科学》杂志周四在网上发表的相关论文显示,Pluribus与十三名德州扑克高手,进行了10000手不限注对局的六人桌比赛,每次比赛均由机器与5名人类选手对战,结果机器取得胜利。
在另外一种形式的六人桌比赛中,由5个Pluribus与一名人类选手对局,结果机器先后击败了德州扑克世界冠军达伦·伊莱亚斯和克里斯·弗格森,分别各对局5000手。
Pluribus起初和自己对战,一点一滴的学习,透过扑克牌的出牌顺序,获取最佳优势。在比赛中,Pluribus会让自己变得难以预测。例如常规打法是在牌最好的时候押注,但这很快会被对手识破,因此它会「使点小聪明」,不按常理出牌。分析显示,它会做出一些多数人类玩家都认为不好的决策,在客观上迷惑了对手。伊莱亚斯说:「它的主要优点是运用综合策略的能力。」
研究人员指出,与让机器下国际象棋和围棋相比,德州扑克的挑战更大。德州扑克比赛中每方都不知道对手的牌,对手还可能在押注时虚张声势或隐藏关键资讯,因此决策只能基于不完全信息,这与真实世界中的问题更接近。
卡内基-梅隆大学教授图奥马斯·桑德霍尔姆说:「(人工智慧系统)Pluribus在多人扑克中成就了超人的表现,堪称是人工智慧和赛局理论的里程碑。」他表示,此前人工智能在「战略性推理」方面取得的成就仅限于二人游戏,此次在复杂游戏中战胜五名人类选手,将为人工智能解决真实世界问题提供新的可能性。
据介绍,在二人游戏中,机器的策略是实现博弈论中的「纳什均衡」,即确保结果至少是平局,而只要对手犯错打破均衡,机器就能获胜。但这一策略不适用于多人游戏,机器不能保持平局,必须不断争取先手才能最终获胜。研究人员为此设计了一种新的「有限前瞻搜索」算法,让机器能做出一个平衡的整体决策。
桑德霍尔姆和在facebook工智慧部门工作的布朗合作。布朗一边工作一边在匹兹堡的卡内基-梅隆大学完成博士学业。他表示,他本人facebook都没有计划将Pluribus应用在真正的扑克游戏中。事实上,该公司表示大部分代码都不会公开披露,以免对扑克社群产生负面影响。发言人表示,只会向其他人工智能研究人员公开一些技术示例。
2017年,卡内基-梅隆大学开发的人工智能Libratus曾在12万手一对一不限注德州扑克比赛中,分别战胜4名人类选手。
最新回应