AlphaGo無懈可擊?柯潔第二戰中場投子認輸
AlphaGo無懈可擊?柯潔第二戰中場投子認輸
2017.05.25 | Google

在這場三番棋比賽第二局進行到下午1點37分時,柯潔主動投子認輸,台下觀眾一臉茫然,AlphaGo提前一個多小時在中盤戰勝柯潔!

比數.jpg
比賽結果。
圖/ 36氪

在這次比賽中,圍棋國手古力、張璇(曾獲得過中國冠軍)、劉菁、周睿羊擔當開局時段的解說員。古力認為,在特別難判斷的盤面上,AlphaGo比我們要思考地更加準確,也就是說從一步看未來幾十步的「本事」。

從開局來看,柯潔想把時間多用在對佈局的策略方面,而且在前十手時打的一直非常不錯,盤面很穩,而且贏面很大,甚至預料到AlphaGo多步棋的下子位置。而反觀AlphaGo,其表現跟人類無異,每一步下的都很平常,甚至很多步都被古力預測到。

但是我們需要清楚,在前天進行的第一場比賽時,柯潔的勝率其實也是非常高的,但越往後,AlphaGo的勝率就逐漸慢慢提高了。

比較有意思的是,從一開局柯潔二手點了三三後,AlphaGo又在左下角下了「三三」。

一開始比賽的賽時沒有被拉開,對弈雙方的時間差也一直維持在十幾分鐘左右。但隨著戰局的推進,柯潔扯頭髮的次數越來越多(頭髮越來越亂),臉部的表情也越來越焦慮。

最終,讓所有人都沒有想到的是,開局2個多小時後,局面出現反轉,柯潔變得力不從心,然後突然在下午1點37分主動投子認輸,AlphaGo在中盤執黑子贏得勝利!隨後進行了復盤。

在整個比賽過程中,古力曾著重分析了AlphaGo的厲害之處:

在判斷大局的方面真的非常厲害,也就是在所謂的「虛著」方面更勝一籌。你看那些稀疏的地方我可能真的判斷不好。

簡單來說,就是在棋子比較密布的某一區塊上面,我們誰能猜到AlphaGo的落子結果;但在盤面比較虛的地方,例如棋子稀疏的下方,我們根本無法猜到。而AlphaGo就是在這種情況下,不知不覺地積累優勢。

AlphaGo對柯潔.png
右上角是密集處。而在下方稀疏的地方,虛著的盤面很難判斷。
圖/ 36氪

其實,早在AlphaGo與柯潔未開賽前,我們曾經提出一個腦洞大開的問題:AlphaGo會不會故意輸給柯潔?

這個命題可以設定為存在兩種情況:

根據柯潔的現場表現,譬如AlphaGo是否真的可以透過識別他的手速、手部動作、面部表情甚至情緒來決定是否輸給柯潔。

AlphaGo的運算能力已經強大到不僅單純追求「贏」,而是控制勝率的差距。譬如以微弱的優勢打敗柯潔,或者以半目之差輸給柯潔。

第一個猜測被DeepMind創辦人Demis以一個玩笑否認了:

這個建議太好了,看來我們以後也應該為AlphaGo安裝一些傳感器與攝影鏡頭。你要知道,AlphaGo一定是會有弱點的。而柯潔據說也透過分析AlphaGo掌握了一些它的套路,兩位選手是勢均力敵的。

而第二個猜測,的確是DeepMind持續提升AlphaGo能力的一個方向,但從目前來說,AlphaGo還做不到。

在在昨天的人工智慧閉門大會上,DeepMind首席科學家Davis Silver已經非常清晰地解釋了這個新一代AlphaGo的過人之處:

第2代「深度強化學習系統」AlphaGo Fan(共4代)共有12層卷積神經網絡,而第4代AlphaGo(也就是與柯潔比賽的這一代)通過進行「自我學習」(監督學習與強化學習)已經訓練出了40層神經網絡(由策略網絡與神經網絡組成)。

在整個學習過程中,系統要對棋局進行圖像掃描,分成無數個小塊依次進行處理,最終構成整個全局觀。具體來說,它可以近乎準確地判斷棋盤上現有的棋子能給周圍區域帶來多大的影響力。

這個「全局觀」,就是AlphaGo與人類最不一樣的地方,也是古力在解說時特意強調的AlphaGo具備的一個能力:

策略網絡,就是讓AlphaGo先自己跟自己比,下個幾萬場,目的就是要「走對子」,選擇最好的一步走,判斷哪個策略最有效。

而在這個步驟結束後,繼而形成價值網絡,用來負責估算勝率。 「策略網絡」能夠對所有落子位置進行概率分佈,然後再將這些估算出的信息投入到蒙特卡羅搜索樹中,推算出勝率最高的一些算法。

換句話說,就是每走出一步,價值網絡就是通過這樣的函數來預測未來的輸贏,而不是靜態地去考慮這步棋。

兩者一前一後,就形成了AlphaGo的殺手鐧——「在最後結果為『贏』的前提下,去選擇每一步最可行的路徑」。

這也能解釋為何AlphaGo在去年與李世石三番棋的第二局比賽中,狗的第37子被稱為「牽一發而動全身」的一步棋。在賽后复盤後,人類棋手才發現這步棋完全決定了後面50步棋的下法。

照這樣來看,層數越來越多的神經網絡決定了AlphaGo學習的深度正在越來越大,這就相當於AlphaGo不管是在思考每一步策略,還是在判斷勝率的精準度上都有了很大的提高。

如果要故意輸給柯潔,不僅需要AlphaGo的自我學習能力,還需要獲得柯潔這位棋手足夠多的數據,因為獲得固定的勝率需要他去「揣摩」柯潔的直覺。

從理論上來說,如果AlphaGo能通過自我學習來掌握柯潔足夠多的數據,是有可能控制勝率的(機率會更高)。

棋局.jpg
現場。
圖/ 36氪

但是這個決定三番棋勝局的關鍵第二場比賽,柯潔的主動投子認輸,讓我們再次見識到了AlphaGo的厲害之處。

本文授權轉載自:36 氪

關鍵字: #AlphaGo
往下滑看下一篇文章
從 Raise Day 出發,方睿科技如何打造商用地產的 AI 企業服務生態系?
從 Raise Day 出發,方睿科技如何打造商用地產的 AI 企業服務生態系?

AI 與數據正快速落地至各行各業,從製造、金融、電信、醫療到零售,應用速度不斷加快。但在每年交易規模至少新台幣 1900 億元的商用地產領域,卻長期受到數據破碎且不透明的限制,只能仰賴人力蒐集資訊,再憑直覺和經驗去解讀資訊、做出決策,使 AI 潛在價值難以真正發揮。為回應產業轉型的核心痛點,方睿科技首度舉辦「商用地產生態系年會 2026 Raise Day」,以開放式平台為核心,串聯專業地產服務商、空間相關企業服務商、產業專業人士等多元角色,勾勒出 B2B 企業服務生態系的全貌,希望能透過科技促進數據流動,為商用地產企業協作模式開啟新的可能性。

方睿科技
方睿科技首度舉辦 2026 Raise Day,以開放式平台為核心串聯多元角色,推動商用地產邁向產業共好的新階段。
圖/ 數位時代

方睿科技雙軌策略,讓 AI 成為商用地產的決策引擎

方睿科技創辦人暨執行長吳健宇指出,在 AI 時代,人應該專注於「最有價值」的工作;然而在商用地產業中,專業人士卻有約 70% 的時間耗費在資料蒐集與整理上,真正用於判斷與決策的時間僅約 10%。方睿科技希望翻轉這樣的時間分配,讓人力從低價值的資料處理中解放,將更多心力投入在判斷、溝通與決策等創造價值的商業活動。

方睿科技
方睿科技創辦人暨執行長 吳健宇
圖/ 數位時代

為此,方睿科技提出兩條實踐路徑。第一條是建構出具備完整性、易用性與進化性的商用地產智慧平台,運用 AI 技術,將過去產業中破碎、非結構化的資料,重塑為可被運算、可驗證的標準化數據,並結合圖表與互動式介面,讓使用者能夠快速得到完整市場資訊,實現「用戶即專家」的目標。

第二條則是推動生態系聯盟,將不動產視為企業服務的核心載體,串聯設計、家具、搬遷、清潔等多元服務夥伴,使空間不再只是靜態標的,而是承載案例、服務與數據回饋的生態系節點。透過生態系夥伴累積的實務資料與服務紀錄,平台得以發展「資料即推薦」模式,推動商用地產從單點交易,邁向可擴張的 B2B 服務網絡。

獨創「資料飛輪」機制,實現用戶即專家目標

在 AI 模型日益普及的當下,真正的競爭關鍵已不在模型本身,而是能否有效率地收集資料、提高資料品質,並將其與實際決策流程緊密結合。為此,方睿科技獨家設計出一個由「資料收集、資料精煉、專家把關、決策反饋」組成的資料飛輪,回應商用地產長期面臨的資料破碎與決策效率低落問題,成為方睿科技實踐願景的第一條路徑。

方睿科技技術長郭彥良進一步說明,資料飛輪機制的運作架構。首先在資料收集階段,必須系統性蒐集公開資料、內部檔案與報告,並透過 AI 協作將圖片等非結構化資訊轉換為可用的結構化數據。接著進入資料精煉,透過資料清洗與實體對齊,將原始資訊從單純的可閱讀升級為可比較、可推論的決策依據。第三步專家把關,則引入不動產專家進行校正與產業判讀,補上模型難以理解的規則與慣例,確保關鍵數據的正確性。最後的決策反饋階段,藉由收集使用者提問與行為,檢視現有資料是否足夠精準,再回到專家校正與補齊流程,使整個系統能隨使用頻率提升而持續進化。

在資料飛輪的運作基礎上,方睿科技正積極研發商用地產智慧平台 PickPeak。郭彥良表示,PickPeak 並非單純的物件搜尋工具,而是結合深度資料與 AI 的決策輔助平台。使用者可透過自然語言互動,提出人數、預算、區位、產業屬性等多重條件,再由系統動態生成可比較、可驗證的選址方案,真正將 AI 從「回答問題的工具」,轉化為「陪伴決策的數位專家」。

方睿科技
方睿科技技術長 郭彥良
圖/ 數位時代

創新 Data to win 模式,讓 AI 深入商用地產各階段決策流程

不過,單靠數據整合與 AI 應用仍不足以支撐產業全面升級,因此,方睿科技提出的第二條路就是,推動產業生態系聯盟,整合商用地產市場上不同角色的數據,讓 AI 能夠真正成為商用地產決策時的智慧引擎。

方睿科技不動產知識創新中心總監曾凡綱指出,目前在企業、房東或物業主與各類服務供應商之間,缺乏有效的整合機制,導致企業在選址與空間規劃過程中,難以快速找到真正合適的服務與解決方案,形成明顯的產業斷點。

為解決這些斷點,方睿科技提出「Data to win」模式,以資料取代傳統「Pay to win(付費買廣告)」思維,讓真正具備經驗與實績的服務夥伴,在適當的決策節點被看見。

曾凡綱說明,在廣告投放效益越來越低的情況下,企業服務商面臨的問題已不只是「如何曝光」,而是「如何在對的地方被看見」,這將是未來的市場勝出指標;而 Data to win 正好可以協助企業服務商建立此能力,方睿科技將生態系夥伴所擁有的案例、服務紀錄與產業知識等資料,經過去識別化與結構化處理後,再嵌入企業決策流程中,讓推薦不再來自廣告投放,而是真實、可被驗證的使用經驗,透過這樣的機制,不僅提升企業決策的準確度,也能同步放大生態系夥伴在合作中的實質價值。

舉例來說,方睿科技整合辦公傢俱夥伴 Backbone 班朋實業長期累積的辦公室規劃案例與平面圖資料,讓企業在選址階段,就能同步評估空間規劃方案,加速決策流程。又如,整合出行服務夥伴 USPACE 悠勢科技的服務資料,並呈現在地圖上,協助企業評估辦公據點的交通便利性,優化員工日常通勤與出行體驗。此外,平台也可整合大樓的 ESG 認證、公共設施與服務層資訊,協助企業快速篩選符合需求的辦公大樓,提升進駐媒合效率。

方睿科技
方睿科技不動產知識創新中心總監 曾凡綱
圖/ 數位時代

「Raise Day 只是這場變革的起點。」吳健宇強調,方睿科技已經透過投資與合夥模式,將布局延伸至專業地產服務與空間經營領域,至今旗下已有商用不動產仲介、顧問與估價等專業服務的宇豐睿星,以及聚焦商用地產代銷市場的希睿創新置業。透過直接參與第一線實務運作,方睿得以更深入理解產業真實痛點,讓科技不只是工具,而能真正回應實際決策與服務需求。

此外,方睿科技未來也將持續擴大「商用地產 x 企業服務生態系」聯盟,目前包括 Backbone、USPACE、IKEA For Business、潔客幫等企業服務夥伴已率先加入;接下來,方睿科技將邀請更多擁有關鍵數據與專業能力的企業服務商加入,讓數據在安全、可控的前提下流動,進一步釋放商用地產在選址、營運與企業服務等全生命週期中的結構性價值,為產業轉型啟動下一個關鍵階段。

方睿科技
右起方睿科技共同創辦人暨營運長陳致瑋、USPACE悠勢科技共同創辦人暨執行長宋捷仁 、Backbone班朋實業創辦人暨執行長廖家葳,透過企業服務生態系合作共同為產業啟動下一個關鍵階段。
圖/ 數位時代

方睿科技官網: https://www.funraise.com.tw

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓