美大學聯同Facebook開發人工智能玩撲克擊敗多名世界頂尖選手

2019-07-12 22:12

美國卡內基-梅隆大學和facebook合作開發人工智能Pluribus，在六人桌德州撲克比賽中擊敗多名世界頂尖選手。　示意圖

美國卡內基-梅隆大學宣佈，該校和科技巨頭facebook合作開發的人工智能Pluribus，在六人桌德州撲克比賽中擊敗多名世界頂尖選手，成為機器在多人遊戲中戰勝人類的一個里程碑。

美國《科學》雜誌周四在網上發表的相關論文顯示，Pluribus與十三名德州撲克高手，進行了10000手不限注對局的六人桌比賽，每次比賽均由機器與5名人類選手對戰，結果機器取得勝利。

在另外一種形式的六人桌比賽中，由5個Pluribus與一名人類選手對局，結果機器先後擊敗了德州撲克世界冠軍達倫·伊萊亞斯和克里斯·弗格森，分別各對局5000手。

Pluribus起初和自己對戰，一點一滴的學習，透過撲克牌的出牌順序，獲取最佳優勢。在比賽中，Pluribus會讓自己變得難以預測。例如常規打法是在牌最好的時候押注，但這很快會被對手識破，因此它會「使點小聰明」，不按常理出牌。分析顯示，它會做出一些多數人類玩家都認為不好的決策，在客觀上迷惑了對手。伊萊亞斯說：「它的主要優點是運用綜合策略的能力。」

研究人員指出，與讓機器下國際象棋和圍棋相比，德州撲克的挑戰更大。德州撲克比賽中每方都不知道對手的牌，對手還可能在押注時虛張聲勢或隱藏關鍵資訊，因此決策只能基於不完全信息，這與真實世界中的問題更接近。

卡內基-梅隆大學教授圖奧馬斯·桑德霍爾姆說：「（人工智慧系統）Pluribus在多人撲克中成就了超人的表現，堪稱是人工智慧和賽局理論的里程碑。」他表示，此前人工智能在「戰略性推理」方面取得的成就僅限於二人遊戲，此次在複雜遊戲中戰勝五名人類選手，將為人工智能解決真實世界問題提供新的可能性。

據介紹，在二人遊戲中，機器的策略是實現博弈論中的「納什均衡」，即確保結果至少是平局，而只要對手犯錯打破均衡，機器就能獲勝。但這一策略不適用於多人遊戲，機器不能保持平局，必須不斷爭取先手才能最終獲勝。研究人員為此設計了一種新的「有限前瞻搜索」算法，讓機器能做出一個平衡的整體決策。

桑德霍爾姆和在facebook工智慧部門工作的布朗合作。布朗一邊工作一邊在匹茲堡的卡內基-梅隆大學完成博士學業。他表示，他本人facebook都沒有計劃將Pluribus應用在真正的撲克遊戲中。事實上，該公司表示大部分代碼都不會公開披露，以免對撲克社群產生負面影響。發言人表示，只會向其他人工智能研究人員公開一些技術示例。

2017年，卡內基-梅隆大學開發的人工智能Libratus曾在12萬手一對一不限注德州撲克比賽中，分別戰勝4名人類選手。

關鍵字

澳烏魯魯巨石將關閉遊客爭相打卡留念引爭議

《Space Oddity》專輯50周年 Ziggy Stardust芭比亮相

美大學聯同Facebook開發人工智能玩撲克擊敗多名世界頂尖選手

最新回應

相關新聞

Facebook人工智能技術處理離世會員帳戶「身後事」

7成從業員加薪逾4% 學會指ICT行業求才若渴

美研究團隊拒公開AI寫作系統恐遭濫用製作假新聞

訂閱星島日報

聯絡我們

廣告表格及價目表