AlphaGo無懈可擊?柯潔第二戰中場投子認輸
AlphaGo無懈可擊?柯潔第二戰中場投子認輸
2017.05.25 | Google

在這場三番棋比賽第二局進行到下午1點37分時,柯潔主動投子認輸,台下觀眾一臉茫然,AlphaGo提前一個多小時在中盤戰勝柯潔!

比數.jpg
比賽結果。
圖/ 36氪

在這次比賽中,圍棋國手古力、張璇(曾獲得過中國冠軍)、劉菁、周睿羊擔當開局時段的解說員。古力認為,在特別難判斷的盤面上,AlphaGo比我們要思考地更加準確,也就是說從一步看未來幾十步的「本事」。

從開局來看,柯潔想把時間多用在對佈局的策略方面,而且在前十手時打的一直非常不錯,盤面很穩,而且贏面很大,甚至預料到AlphaGo多步棋的下子位置。而反觀AlphaGo,其表現跟人類無異,每一步下的都很平常,甚至很多步都被古力預測到。

但是我們需要清楚,在前天進行的第一場比賽時,柯潔的勝率其實也是非常高的,但越往後,AlphaGo的勝率就逐漸慢慢提高了。

比較有意思的是,從一開局柯潔二手點了三三後,AlphaGo又在左下角下了「三三」。

一開始比賽的賽時沒有被拉開,對弈雙方的時間差也一直維持在十幾分鐘左右。但隨著戰局的推進,柯潔扯頭髮的次數越來越多(頭髮越來越亂),臉部的表情也越來越焦慮。

最終,讓所有人都沒有想到的是,開局2個多小時後,局面出現反轉,柯潔變得力不從心,然後突然在下午1點37分主動投子認輸,AlphaGo在中盤執黑子贏得勝利!隨後進行了復盤。

在整個比賽過程中,古力曾著重分析了AlphaGo的厲害之處:

在判斷大局的方面真的非常厲害,也就是在所謂的「虛著」方面更勝一籌。你看那些稀疏的地方我可能真的判斷不好。

簡單來說,就是在棋子比較密布的某一區塊上面,我們誰能猜到AlphaGo的落子結果;但在盤面比較虛的地方,例如棋子稀疏的下方,我們根本無法猜到。而AlphaGo就是在這種情況下,不知不覺地積累優勢。

AlphaGo對柯潔.png
右上角是密集處。而在下方稀疏的地方,虛著的盤面很難判斷。
圖/ 36氪

其實,早在AlphaGo與柯潔未開賽前,我們曾經提出一個腦洞大開的問題:AlphaGo會不會故意輸給柯潔?

這個命題可以設定為存在兩種情況:

根據柯潔的現場表現,譬如AlphaGo是否真的可以透過識別他的手速、手部動作、面部表情甚至情緒來決定是否輸給柯潔。

AlphaGo的運算能力已經強大到不僅單純追求「贏」,而是控制勝率的差距。譬如以微弱的優勢打敗柯潔,或者以半目之差輸給柯潔。

第一個猜測被DeepMind創辦人Demis以一個玩笑否認了:

這個建議太好了,看來我們以後也應該為AlphaGo安裝一些傳感器與攝影鏡頭。你要知道,AlphaGo一定是會有弱點的。而柯潔據說也透過分析AlphaGo掌握了一些它的套路,兩位選手是勢均力敵的。

而第二個猜測,的確是DeepMind持續提升AlphaGo能力的一個方向,但從目前來說,AlphaGo還做不到。

在在昨天的人工智慧閉門大會上,DeepMind首席科學家Davis Silver已經非常清晰地解釋了這個新一代AlphaGo的過人之處:

第2代「深度強化學習系統」AlphaGo Fan(共4代)共有12層卷積神經網絡,而第4代AlphaGo(也就是與柯潔比賽的這一代)通過進行「自我學習」(監督學習與強化學習)已經訓練出了40層神經網絡(由策略網絡與神經網絡組成)。

在整個學習過程中,系統要對棋局進行圖像掃描,分成無數個小塊依次進行處理,最終構成整個全局觀。具體來說,它可以近乎準確地判斷棋盤上現有的棋子能給周圍區域帶來多大的影響力。

這個「全局觀」,就是AlphaGo與人類最不一樣的地方,也是古力在解說時特意強調的AlphaGo具備的一個能力:

策略網絡,就是讓AlphaGo先自己跟自己比,下個幾萬場,目的就是要「走對子」,選擇最好的一步走,判斷哪個策略最有效。

而在這個步驟結束後,繼而形成價值網絡,用來負責估算勝率。 「策略網絡」能夠對所有落子位置進行概率分佈,然後再將這些估算出的信息投入到蒙特卡羅搜索樹中,推算出勝率最高的一些算法。

換句話說,就是每走出一步,價值網絡就是通過這樣的函數來預測未來的輸贏,而不是靜態地去考慮這步棋。

兩者一前一後,就形成了AlphaGo的殺手鐧——「在最後結果為『贏』的前提下,去選擇每一步最可行的路徑」。

這也能解釋為何AlphaGo在去年與李世石三番棋的第二局比賽中,狗的第37子被稱為「牽一發而動全身」的一步棋。在賽后复盤後,人類棋手才發現這步棋完全決定了後面50步棋的下法。

照這樣來看,層數越來越多的神經網絡決定了AlphaGo學習的深度正在越來越大,這就相當於AlphaGo不管是在思考每一步策略,還是在判斷勝率的精準度上都有了很大的提高。

如果要故意輸給柯潔,不僅需要AlphaGo的自我學習能力,還需要獲得柯潔這位棋手足夠多的數據,因為獲得固定的勝率需要他去「揣摩」柯潔的直覺。

從理論上來說,如果AlphaGo能通過自我學習來掌握柯潔足夠多的數據,是有可能控制勝率的(機率會更高)。

棋局.jpg
現場。
圖/ 36氪

但是這個決定三番棋勝局的關鍵第二場比賽,柯潔的主動投子認輸,讓我們再次見識到了AlphaGo的厲害之處。

本文授權轉載自:36 氪

關鍵字: #AlphaGo
往下滑看下一篇文章
2025年總統科學獎〉沒有前人就自己開路!「高熵合金之父」葉均蔚院士,引領全球材料新革命
2025年總統科學獎〉沒有前人就自己開路!「高熵合金之父」葉均蔚院士,引領全球材料新革命

想像一下,人類數千年來對物質世界的理解,突然被一個大膽構想徹底顛覆,會是什麼樣子?

當傳統材料學界仍謹守1~2種主元素為基底的定律時,2025年總統科學獎得主,國立清華大學材料科學工程學系特聘研究講座教授、中央研究院院士葉均蔚院士,卻逆向思考,開創能讓數十種元素混合的「高熵合金」領域,不僅為元素週期表注入嶄新生命力,更點燃全球半導體、智慧機械、綠能科技、國防與生醫等領域的無限創新火花。

「潛水」8年,釀出材料革命

葉院士透露,自古以來,要想構成「合金」,都由單一或少量元素構成,但1995年,他在驅車前往臺北的路上,腦中靈光乍現,迸發出讓多種元素混合成合金的想法。

有意思的是,葉院士很清楚,「高熵合金」這項突破性構想,將會徹底顛覆材料學的根基。因此,為了鞏固臺灣的領導地位,1995至2003年間,他刻意沉潛、默默研究,不發表任何相關論文,「這是我的經營管理策略!」他認真道。

葉院士於頒獎典禮發表研究之路的心聲點滴。
葉院士於頒獎典禮發表研究之路的心聲點滴。
圖/ 數位時代

因此儘管8年寒窗苦讀無人知,甚至曾有計畫審查委員直言,若讓高熵合金的計畫通過,會鬧出「國際笑話」,葉院士仍憑藉著對高熵效應的堅定信念,逐步累積實驗數據與理論心得,最終於2004年,一口氣發表5篇高熵材料論文,為高熵合金新材料命名、定義和建立理論基礎,之後平均每年發表10篇研究,並陸續提出高熵效應、晶格扭曲效應、緩慢擴散效應、雞尾酒效應等核心效應,對材料科學理論做出重大貢獻。

這股「論文風暴」,不僅讓《Nature》在2016年發布專題報導,確立了高熵合金領域的價值,以及確認臺灣做為發源地的地位,還成功引發全球專家學者的重視與跟進,也讓葉院士成為「高熵合金之父」。

在為臺灣奠定高熵合金領導地位之餘,葉院士還期望將這股力量向下傳承,因此在清華大學成立全球首個高熵材料研發中心,由他擔任主任。中心匯集了來自全臺各大學逾60位跨校、跨領域的頂尖教授,組成材料界的「夢幻隊」,一同探討高熵學理,開發高功能材料,每年還開設相關課程,培育近百名具備傳統與高熵「全材料」研發能力的專業人才,為學界、業界提供源源不絕的活水。

更重要的是,葉院士很早就知道,學術研究的價值不應只停留在論文發表。事實上,他在從事教職之初,便開始擔任業界顧問,深入現場解決問題,這反過來讓他的研究,更加貼近現場。

2021年,他透過清大授權高熵材料科技的3千萬元授權金,如今,在資本市場已增值8倍,達到2.4億元;他也擁有逾50項專利,其中,超過22項為高熵材料發明專利授權,「學者不能只在『象牙塔』中做研究,要積極與產業互動,將所學貢獻於實用,尤其現今臺灣製造業面臨轉型挑戰,學術界的創新非常關鍵。」

看著葉院士現今擁有的非凡成就,多數人可能以為他背景優渥,其實,他出生偏鄉、從未出國留學、進修。來自宜蘭南澳的他,成長過程中資源相對匱乏,但這反而養成他從小「凡事自己動手做」的習慣,「這種獨立解決問題、親身實踐的精神,就是我在科學研究上,不斷突破的基石。」

葉院士全家於2025總統科學獎頒獎現場溫馨合影。
葉院士全家於頒獎現場溫馨合影。
圖/ 數位時代

不曾出國留學、進修,也能做出世界級的突破

葉院士從學士、碩士一路念到博士,是標準的「清華大學材料科學工程寶寶」。在那個「去去去去國外」、留學盛行的年代,他選擇做個異類,深耕臺灣,「對國家做出貢獻比個人發展更重要!而且我相信,就算在臺灣,也能憑藉我們的智慧、能力,做出世界級創新。」

葉院士建議,年輕學者、莘莘學子們應心存善念,並秉持著求甚解、動手做的態度,多元、快樂學習,「強大的企圖心,能創造價值;與人為善,則能聚集眾力,共同實現宏大目標。」

臺灣「高熵合金之父」葉院士,賴總統親自頒發「2025年總統科學獎」 殊榮。
臺灣「高熵合金之父」葉院士,賴總統親自頒發「2025年總統科學獎」 殊榮。
圖/ 數位時代

問「高熵合金之父」接下來還有什麼目標?他笑稱,自己自大學二年級起,便懷抱著「飛碟夢」,而要實現夢想,需要室溫超導、極耐高溫等前所未有的材料,他仍在兢兢業業努力中。飛碟夢看似遙遠,卻是前進的燃料,向來「說到做到」的葉院士,用對未來的無限想像,持續為材料科學鋪設一條通往新世界的道路,也為臺灣留下珍貴的創新資產。

葉均蔚 院士
專長:高熵合金及相關材料、製造工程等
現職:國立清華大學材料科學工程學系特聘研究講座教授
成就:開創「高熵合金」領域,徹底顛覆傳統金屬材料設計思維,為臺灣在高階製造、綠能技術及核融合能源領域奠下堅實根基

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓