為何AI「棋靈王」橫掃中國、韓國頂尖棋士?不怕死,反而讓它所向無敵!

2018.11.02 by
數位書選
AFP
一名出現在網路的神祕棋士所向披靡,在圍棋界掀起一陣熱議!答案揭曉,原來他是Google DeepMind開發的AI圍棋軟體,中國棋王柯潔、韓國頂尖棋士李世乭都是他手下敗將。人類下圍棋百年以來的進化,為何敵不過AI發展的數十載光陰?

本文摘自《棋士與AI:AlphaGo開啓的未來》,大塊文化出版

看得見的世界,就那麼1公尺,也就是伸手可及的部分,而碰觸不到的地方,是深不見底的黑暗世界,下棋這個東西,其實就是暗中摸索;但就算看不見前方,我們仍然可以憑藉經驗,推測出一些狀況,我們稱其為感覺或大局觀。

然而,就算是身經百戰的職業棋士,也有被恐懼感所擄獲、無法信任自身感覺的時候。因為大步前進必然得踏入前方的黑暗,是否就在看得見的範圍內走一小步呢?這是對局者在每一手的選擇時必會面臨的誘惑。因為每人都必有數不清礙於魯莽前進而受傷的經驗。決定一局輸贏的要素裡最重要的就是──是否敗給自己的恐懼感,而做出低於自己實力許多的選擇。

AI沒有「恐懼感」,更能100%發揮實力

AlphaGo並非無所不知,但AlphaGo的計算能力比人類更高,如果人類視線所及的範圍是1公尺,AlphaGo可說是3公尺。AlphaGo就算輸了也不會受到打擊,對於「看不見」地方,它會安心地交由深層學習的「感覺」來處理;因此AlphaGo總是能夠完全發揮自己的實力。

與李世乭對戰的第三局,AlphaGo所下的白1(圖36),這一手導致AlphaGo明顯優勢,是決定系列勝負的名手,而且幾乎沒有人預料到這一手。雖然這一手不像「刺」那麼驚世駭俗,但這是人類不容易認真去想的著點。

大塊文化

大部分的人對白1這手棋的認識都不夠深入,因此選擇這手棋,除了直覺,還需要勇氣。就算白1浮現在腦海的候補名單上,會認真考慮這手棋的棋士是很少的。相較於此,一旦AlphaGo的候補名單中出現白1,AlphaGo對待這手棋的態度與其他選項相同,不會像人類一樣,會覺得「我不習慣這個下法」。換句話說,比起人類需要克服心理障礙,AlphaGo少了一個門檻,比較能夠順利地做出正確判斷。

關於人類在棋盤上感到恐懼的現象,還有另一個「大交換」。「大交換」指的是為了取得某個地方的利益,而在他方做犧牲,這般的棋局狀況變化。 比方說市長選舉,在野黨擊敗執政黨取得勝利,卻失去眾議院的席次,這就是「大交換」;重點是「大幅改變現狀」,若兩邊都是連任,同樣是一勝一敗,但不成為交換。

因為人類的目光看得不夠遠,覺得「大交換」前的盤面平靜無波,導致我們對棋局變化賦予「大交換」的特徵;「大交換」出自人類的主觀認定,對於AlphaGo而言,只是理所當然的進行,不用大驚小怪。

人類所以會有恐懼感,是為了在關鍵時刻保住自身性命;雖然我說了一堆下棋時,恐懼感會帶來負面效果,都是以和AlphaGo比較為前提。人類的能力有限,所以,恐懼感對人類來說,是恰到好處的情緒反應,也是人類不可或缺的重要本能。最近有「捨棄恐懼感可以讓人類成長」的說法,乍聽之下似乎能讓人類更加進步;但正因為你我身為人類,才能擁有AI所缺乏的「恐懼感」,因此我們不必將恐懼感視為敵人,最好馴服它,讓它為自己服務。

AlphaGo的勝利,反映出圍棋技術進步瓶頸

傑米斯.哈薩比斯在圍棋高峰會上表示「AlphaGo會成為人類的哈伯望遠鏡」。 「AI將帶領我們看到更多前所未見的事物,人類將因此變得更有智慧,也會變得更加幸福。」在其他相關的訪談中,我們都可以看到這個主旨。

讓視野更寬廣、更高更遠,我並不否定人類至今以此方向來追求進步;累積「知識」,讓人類得以不斷提升高度,成就豐功偉業的人往往會說「我只是站在巨人的肩膀上而已」,這番話與其說是謙遜的表現,不如說是發自真心的感嘆。

圍棋是有明顯的好棋和壞棋的遊戲的同時,相關知識又能不斷的累積下去,就如同建造房屋一般,圍棋的技術水準也在不斷提升;許多人想當然耳地認為圍棋必是如此。但事實並非這般,日本在350年前,有位名為「本因坊道策」的棋士。他與秀策同被稱為棋聖。從道策的時代開始,人們孜孜不倦地投入超乎想像的心力鑽研棋藝,但時至今日,也沒人敢說自己超越了道策,這絕非誇大其詞的說法。

或許有人會問:「難道在這350年當中,職業棋士都沒有進步嗎?」我常回答「比起道策的時代,布局的方法的確有些進步」。但是AlphaGo從序盤就採取和已往不同想法的布局,並且戰勝人類。雖然從道策的時代開始,圍棋的布局持續改變,但看到AI的下法,我們很難判斷人類布局的改變是不是進步。對於350年前的日本棋士而言,道策想必就是他們的哈伯望遠鏡吧!道策的智慧以棋譜的形式流傳下來,但不管我們如何學習他的棋譜,也還無法站到他的肩膀上。

比起知識傳承,下棋更重「感覺」

比起知識的累積,圍棋為「感覺」所涵蓋的領域,實在太大了!AlphaGo告訴我們最重要的就是這一點;外表可見的形式能透過知識傳承下來,但是抽象的「感覺」卻與個人的身體條件等有關,原則上只是本人的專利,無法傳承。

不只是圍棋,知識只是人類的表象,人類真正的大本營是不容易傳達的內在感覺;在AI出現之前,表象的知識可以作為人類的象徵,人類社會也認同這一點。能輕易汲取各種知識的AI點醒了我們,「感覺」的部分才是人性的本質所在。

下棋就是需要這般多如牛毛的小作業以至於鳥瞰全局的大局觀等,是各種能力配合的遊戲。人類的計算力、集中力,連感知能力,都與身體能力脫不了關係,這些能力和個人的「感覺」相同,無法傳承給他人,連本人要積蓄這些能力都非易事。

AlphaGo如同哈伯望遠鏡般,確實讓我們看到前所未見的景色,但是人類能不能到達那片美景所在之處?是否真想住到那一邊?則是另一個層次的問題,不能混為一談。人類有自己固有的身體與感覺,一味地追求AI,想擁有AI的能力的話,不僅違背人性,也未必對人類有好處吧?

「看見某件事」不等於「去做某件事」;累積知識固然讓人開心,但跟感到「幸福」是另一回事。看到哈伯望遠鏡傳送的影像,我也為之稱奇,但我不曾動過「想去那裡看看」的念頭,更沒想要住在那裡。

AI所帶來的嶄新局勢,或許是一個讓人類重新檢視自身的機會。通常人們回顧自己多在挫折、失敗時,老實說不怎麼讓人開心;與其檢視自己,尋求其他更有趣的事物才是人之常情,就像書架上伸手就拿得到的書,因為隨時可以閱讀,反而始終沒有打開;「看得見」的安心感會讓你覺得「隨時可以做」,「隨時可以做」的事,有時會覺得「已經做過了」。但我們所剩的時間已經不多了,當人類想回首好好檢視自己的時候,卻發現自己已經不在那裡!這是我現在最擔心的事情。

每日精選科技圈重要消息