玩德州撲克的「AlphaGo」來了,擊敗它可以拿走20萬美元!

2017.01.12 by
愛范兒 ifanr
愛范兒 ifanr 查看更多文章

愛范兒連接全球創新者及消費者,跨界技術、文化、消費及創新,致力消費科技領域的產業評論、產品報導及社群連接,創造高品質的消費樂趣。

ifanr
在匹茲堡賭場,展開了一場「人腦 VS. 人工智慧」的對決,卡內基梅隆大學開發的「Libratus」人工智慧系統要與四名職業選手比拼德州撲克,究竟最後會鹿死誰手呢?

從1月11日開始,5名頂尖德州撲克選手將在匹茲堡的賭場展開爭奪,不過,其中一名選手卻不是人類。

在這項名為「人腦 VS. 人工智慧」的對決中,四名職業選手Jason Lee、Dong Kim、Daniel McAulay和Jimmy Chou 將分別與卡內基梅隆大學開發的「Libratus」人工智慧系統進行單挑。賽程為期20天,總共將對戰12萬手牌,獎金為 20萬美元。

Dong Kim 曾在 2015 年與卡內基梅隆大學的 Claudico 對戰過。
ifanr

AI與人類對決不是什麼新鮮事,但是,重點來了,本次的比拼專案的是德州撲克。

我們在下象棋或圍棋的時候,能夠看得到彼此手中的棋子、排兵佈陣等資訊,這種被稱為「完整資訊博弈」。而德州撲克則不同,每個玩家手中的底牌只有自己知曉,其他玩家是看不到的,所以是「非完整資訊」(Imperfect information)。

鑒於德州撲克獨特的規則,AI想要主宰比賽並沒有那麼容易。總之,與棋類遊戲相比,德州撲克對於AI來說更具有挑戰性,也是近來十分流行的人工智慧測試項目。

卡內基梅隆大學的Libratus採用的是一種名為「納什均衡」的對戰策略,在這一策略裡,只要其他玩家的策略保持不變,單一玩家就無法通過變換策略獲益。

Libratus要做的就是識別沒有希望的策略,從而更快地找到納什均衡點。經過反復的訓練後,Libratus已經能夠忽略那些糟糕的路徑了。

不過,Libratus並非唯一一個會玩德州撲克的AI,就在就在卡內基梅隆大學宣佈Libratus出戰的幾天前,加拿大阿爾伯特大學搶先發表了關於撲克AI的論文,表示他們的DeepStack是世界上第一個在「一對一無限注德州撲克」上擊敗了職業撲克玩家的電腦程式。

上周,著名的論文網站Arxiv出現一篇題為《 DeepStack:無限下注撲克裡的專家級人工智慧》(DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker)的論文,作者是來自加拿大Alberta大學、捷克Charles大學、布拉格捷克理工大學的研究人員。

該論文顯示,DeepStack在與33位人類選手進行的4.4萬手較量中,平均勝率為492 mbb/g,一般認為人類玩家這一資料達到50 mbb/g 就具有較大的贏面,而750mbb/g 就是對手每局都棄牌的節奏了。

值得一提的是,DeepStack玩的是無限下注類的德州撲克,玩法比有限下注要複雜得多。

然而,DeepStack雖然有先發優勢,但明顯引發的關注度不如Libratus。

卡內基梅隆大學模仿了AlphaGo的套路,賭場、機器與頂尖人類高手對決、20萬美元獎金,這顯然比DeepStack團隊一篇論文更能吸引眼球。

與此同時,一些撲克專家也對DeepStack提出了質疑,認為與其對戰的玩家中沒有頂級選手,而Libratus要面對的卻是全球排名靠前的高手。

至於20萬美元的獎金最終將被哪方收入囊中,我們還得再等一陣子。

本文授權轉載自:愛范兒

每日精選科技圈重要消息