史上最強AI!微軟Suphx突破日本麻將高端水準,功力大勝頂級人類玩家
史上最強AI!微軟Suphx突破日本麻將高端水準,功力大勝頂級人類玩家
2019.09.02 | 微軟

「那個超強AI到底是何方神聖?」今年3月起,某個謎一般的強悍AI席捲了國際日本麻將平台天鳳,時隔5個月,這位AI的真面目終於揭曉。

上週,微軟亞洲研究院正式發表麻將AI「Microsoft Suphx」(Super Phoenix),並宣佈其在日本麻將平台天鳳上,取得晉升10段的優異成果。

Microsoft Research Asia
成立於1998年的微軟亞洲研究院,是微軟公司在美國本土以外最大的研究機構,位於中國中關村科技園區,是微軟不少核心技術的發源地,也是微軟在亞洲唯二的基礎研究(另為微軟印度研究院)。
圖/ Microsoft

天鳳是日本著名的麻將網路平台,採用日本麻將規則,分為4人麻與3人麻,並擁有段位、Rating等評價制度。依照級數、段位高低,玩家可使用的桌也有所差異。

至於10段是什麼概念?目前天鳳平台上約有 33萬名玩家,其中到達10段者僅180人 。也就是說,10段代表著全體玩家最頂端的0.0054%,毫無疑問擁有人類頂尖選手層級的麻將技術。

天鳳營運商經常與企業、研究機構合作,共同開發強悍的麻將AI,甚至推出AI專用帳號。玩家可以透過AI帳號專屬的標記,清楚得知對手究竟是人還是機器。

tenhou
天鳳是國際級的日本麻將平台,擁有約33萬位用戶,也是諸多企業測試麻將AI能力的最佳平台。
圖/ 天鳳

在Suphx現身以前,由東大碩士生水上直紀開發的「爆打」、資訊科技公司多玩國(株式会社ドワンゴ)的「NAGA25」等AI都曾在這個平台上,和玩家們同桌遊戲,但 過去未曾有AI獲得過晉升10段的殊榮

Suphx於3月加入天鳳,並在3個月內與人類玩家、其他AI對戰5,000餘局後,6月以特上桌第一名的成績成功晉升10段,這是目前AI專屬帳號所能達到的最高等級,同時 Suphx的勝率也比其餘AI,甚至人類玩家更勝一籌

微軟公佈的資料顯示,目前Suphx取得的安定段位分數約為8.7分,而爆打與NAGA25則都只有6.5分上下;10段以上的人類高手則為7.5分。

決勝因素充滿未知,麻將比圍棋、德州撲克難度更高

3年前,AlphaGo大敗韓國棋王李世乭,是AI在遊戲上超越人類的一個重要里程碑,象徵了AI在訊息完全公開遊戲的制霸地位。

AlphaGo
AlphaGo與韓國棋王李世乭一役,奠定了AI在資訊完全公開遊戲的地位。

自此時開始,各個企業、研究人員開始著眼於訊息不完全公開的遊戲內容,好比說,DeepMind就放眼《星海爭霸》、OpenAI也聚焦《Dota 2》等電競遊戲。

然而,微軟卻將目光對準另一款同樣源自中國,有著上千年歷史的古老遊戲:麻將。

對於訊息不完全公開的遊戲,人類往往依靠經驗、直覺判讀,甚至有時得觀察對手的表情、語氣,好判斷究竟是否是虛張聲勢,而這些人類常用的判斷方法,都相當難以化為AI可使用的數據。

2017年時,由卡內基梅隆大學開發的AI Libratus,曾在20天擊敗4位德州撲克高手,從人類手中贏得價值177萬美元的籌碼,標誌了AI攻佔不完全訊息(資訊不完整)賽局領域的第一步。

但相對於德州撲克,麻將的不確定因素遠要來得更高。根據微軟公佈的資料,德州撲克的隱藏情報量約為10的3次方,也就是1,000種,而 麻將的隱藏情報量卻達到10的48次方 ,完全無法比擬。

microsoft suphx
微軟的資料指出,相比圍棋、西洋棋甚至是德州撲克,麻將的隱藏情報量更是龐大。

也由於麻將的難度,目前一般人能觸及的麻將AI性能大多非常弱,為了確保遊戲樂趣,會選擇讓AI得知玩家的牌。當然,Suphx絕對沒有利用這種不公平的手段,而是與一般玩家自相同起跑點競爭。

藉對戰與自學累積強悍實力,麻將AI將用於金融界

除了與眾多玩家、AI對局外,在登上天鳳以前,Suphx是透過「餵食大量麻將牌譜」的資料庫進行訓練。事實上,微軟之所以選擇與天鳳合作,後者擁有的大量公開牌譜也是重要原因之一。

且Suphx不僅麻將實力堅強, 也懂得依照情況運用策略,以保持自己的分數 。舉例來說,當它認為這局無法勝過第一名的玩家時,對局策略就可能轉向擊敗第3、4名的玩家,以免被系統扣除太多分數。

不過,一個麻將技術高強的AI,在現實中究竟能如何發揮作用,目前還很難確定。日本微軟技術長榊原彰認為,麻將AI的能力將能在金融領域發揚光大,一位優秀的操盤手,必須能夠讀懂市場脈動,而這與麻將AI所擁有的能力十分相似。

順帶一提,達到10段並未讓微軟就此滿足,目前他們正與天鳳商討,能否開放AI專屬帳號晉升天鳳位,這是達到10段最高點數才能獲得的殊榮,目前全遊戲總共只有13人達到此位階。

資料來源:Business InsiderMicrosoft

責任編輯:張庭銉

關鍵字: #微軟 #人工智慧
往下滑看下一篇文章
從產品安全到營運韌性:合勤集團揭 AI 時代資安新戰略
從產品安全到營運韌性:合勤集團揭 AI 時代資安新戰略

隨著歐盟《網路韌性法案》(CRA)正式進入倒數計時,企業面臨的資安考驗也從針對內部 IT 環境的駭客攻防戰,一路延伸到產品對外銷售與供應鏈治理的市場生存戰。

AI 正加速漏洞挖掘、自動化攻擊與供應鏈風險擴散,企業也更難只用傳統 IT 防護思維面對產品安全問題。

站在這股趨勢浪潮的最前線,合勤集團整合旗下三家子公司—黑貓資訊、兆勤科技與勤晁科技的技術量能,不僅於CYBERSEC 2026台灣資安大會展出全方位解決方案,也進一步分享如何將CRA法規遵循轉化為實務布局的寶貴經驗,透過自身轉型歷程,協助台灣企業跳脫被動合規思維,將CRA從合規壓力逐步轉化為產品治理與市場競爭力。

當CRA成為市場門票,企業該如何建立產品安全治理能力?

合勤投資控股公司資安長游政卿指出,CRA正式生效後,產品若未符合CRA 要求,將可能影響CE合規與歐盟市場銷售。更重要的是,CRA要求的不只是產品出貨當下符合規範,而是整個產品生命週期都必須被持續管理,且必須留下具可追溯性的完整紀錄。

合勤集團資安長游政卿
合勤投資控股公司資安長游政卿
圖/ 數位時代

因此,對台灣企業而言,CRA帶來的壓力不只是罰款,而是產品遭下架、召回,甚至進一步引發銷售通路中斷、品牌聲譽受損與客戶轉單等連鎖衝擊。對此,游政卿建議企業可依照CRA法規時程,兩階段建立合規能力。

在 2026 年應優先補強「通報即戰力」,亦即成立產品安全事件應變小組(PSIRT),建立漏洞通報與應變機制,確保當新漏洞出現時,企業能在第一時間做出正確判斷,包括該漏洞是否已被利用及嚴重程度、哪些產品與版本受到影響、是否達到CRA通報門檻及如何進行修補與升級。「就像汽車召回制度一樣,企業必須能快速掌握受影響的產品、版本與客戶範圍,並立即啟動應變機制。」游政卿說。

到了 2027 年,則應進一步將合規能力全面制度化與規模化。游政卿強調,企業不能再抱持「有問題再修補」的思維,而是必須從產品設計階段就導入「Security by Design(安全設計)」概念,並在產品整個生命週期中持續進行漏洞監控、更新維護與風險管理。換言之,企業真正需要建立的,不只是單一產品的資安能力,而是一套從設計、開發、測試、上市,到後續漏洞修補、客戶通知與紀錄保存,都能長期穩定運作的產品安全治理機制。

在此基礎上,黑貓資訊通過 TAF ISO/IEC 17025 認證的資安測試實驗室,可出具 ILAC MRA 國際互認報告,不僅能找出產品漏洞,還能協助企業建立具公信力的安全證明,確保產品安全與合規性。

Nebula 雲地聯防平台:讓企業從「看不見風險」到快速應變

在產品安全端,企業需要建立CRA合規能力,落實產品從設計、開發到漏洞修補的全生命週期治理;而在資訊安全端,則必須具備持續監控、快速應變與營運復原的能力,才能有效因應AI時代下愈來愈高頻、愈來愈自動化的攻擊威脅。

兆勤科技總經理蔡明見進一步說明,AI 正大幅改變資安攻擊的態樣,不僅讓攻擊成本明顯下降,攻擊速度與頻率也快速提升,攻擊目標更從過去的大型企業,逐漸轉向防禦能力相對薄弱的中小企業,尤其勒索軟體攻擊更明顯增加。許多中小企業因缺乏備援與復原能力,遭受攻擊後往往只能選擇支付贖金,進而衍生營運中斷與資料遺失等風險。

在此背景下,企業需要思考的,已不僅只是「防堵威脅」,更重要的是,當攻擊發生後,能否持續營運與快速復原。瞄準這樣的需求,兆勤透過自行研發的 Nebula雲端管理平台提升資安可視性,讓企業能夠「看見風險」,進而做好防禦、預警與應變。透過Nebula雲地整合架構,企業可將有線、無線及資安設備全面整合至單一平台進行管理。蔡明見表示,管理者不需分別學習與使用不同管理介面,即可掌握整體網路與資安狀態,大幅降低資安管理的複雜度、人力需求與技術門檻。

此外,Nebula提供圖像化儀表板與彈性報表功能,協助企業快速掌握攻擊來源、異常流量與高風險設備等資訊,進一步優化資安策略與決策效率。同時平台亦導入 AI 助手功能,讓管理者可透過自然語言查詢資安資訊,例如直接詢問「上個月前十大攻擊來源」,系統即可自動生成分析結果與視覺化報表,提升資訊取得效率。

兆勤科技總經理蔡明見
兆勤科技總經理蔡明見
圖/ 數位時代

面對 MSP(Managed Service Provider,託管服務商)發展趨勢,兆勤也持續開發更多 MSP 管理功能,包括客戶設備管理、授權管理等,協助合作夥伴更有效率地服務終端客戶、降低維運與管理負擔,進而吸引更多傳統經銷夥伴轉型為 MSP 業者,加速服務模式轉型與台灣 MSP 生態系發展。

至於勤晁科技則針對量子運算與跨域滲透威脅,提出「虛實整合防線」的新思維。防護架構由內而外拆解為三層:首先是運用邏輯防護(PQC)演算法進行加密、確保資料的長期安全性;其次是進行異常偵測、運用 AI 分析多維流量,即時發現異常行為;第三是建立物理韌性(Air Gap),以單向光纖傳輸築起不可逆的安全邊界。透過這套從邏輯、行為到物理層的縱深防禦機制,為國家級關鍵系統構築最穩固的安全韌性。

資安不只是 IT 部門的防守任務,而是攸關產品能否進入國際市場、企業能否持續營運的重要競爭力。合勤集團希望透過黑貓資訊、兆勤科技與勤晁科技的整合布局,從產品安全、資安防護到關鍵場域防禦,逐步提升企業的資安韌性,並協助企業從被動合規走向主動升級,在快速變化的全球市場中建立長期競爭優勢。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓