[AI洞見]人機協同賦能未來:機器棋手背後的人腦實力

2018.03.05 by
洪小文
洪小文 查看更多文章

現任微軟全球資深副總裁,微軟亞太研發集團主席,兼微軟亞洲研究院院長,全面負責推動微軟在亞太地區的科研及產品開發戰略,以及與中國及亞太地區學術界的合作。

[AI洞見]人機協同賦能未來:機器棋手背後的人腦實力
kc look via Shutterstock
儘管機器在圍棋人機大戰中取得了勝利,但其演算法卻是由人開發出來的,在我看來,這更能彰顯人腦而非電腦的智慧。

編者按:
電腦領域的熱點總是在不斷更替,從大資料到雲端計算再到人工智慧,在這些熱點的背後是專家學者們在這些領域一點一滴聚沙成塔的技術突破。關於人工智慧,我們見證了近年來它從默默無聞到熾手可熱的過程。繼去年《我們需要什麼樣的機器人》之後,微軟全球資深副總裁,微軟亞太研發集團主席兼微軟亞洲研究院院長洪小文再次撰文,與我們進一步分享他對人工智慧的見解與洞察,歸納起來就是《HI+AI:人機協同賦能未來》。在這個系列的三篇文章裡,洪小文博士將與讀者交流AlphaGo戰勝李世石這一標誌性事件背後的意義,深入淺出地探討人類智慧與人工智慧的區分與聯繫,以及我們應當如何看待人類與人工智慧的關係。

《機器棋手背後的人腦實力》是《HI+AI:人機協同賦能未來》三篇系列文章的上篇。在本文中,洪小文博士從AlphaGo戰勝職業九段棋手李世乭說起,分析了這一事件背後所展示的人腦不可替代的優勢。

從國際象棋,中國象棋到圍棋,在所有不依賴運氣而只考較實力的智力遊戲領域,機器在與人類的對決中已展現出極為顯著的優勢。

在贏了與世界圍棋冠軍,職業九段棋手李世石的比賽之後,可以預計,AlphaGo無需多長時間便能橫掃整個圍棋世界。而當它戰勝了所有可能與它匹敵的人類頂尖棋手後,它便會將「世界圍棋第一高手」的榮耀保持到永久──除非又出現另一位元演算法更先進的機器棋手。

弈棋,這曾在過去無數個世代裡為人類所自矜和讚詠的智力神話就這樣被冷冰冰的機器打破,難怪很多朋友會自然延伸出機器越來越聰明的結論。的確,從人工智慧技術發展的角度看,AlphaGo不啻為一座里程碑。和上個世紀末因擊敗人類國際象棋王者卡斯帕羅夫而名噪一時的「深藍」不同──當年,「深藍」的勝利可以主要歸因於其運算速度足夠快,且演算法也得到了改進,但AlphaGo能創下紀錄並不意味著其硬體能力已強大到可以窮舉三尺棋局上的所有組合。

窮舉法簡單說就是列出達成某個目標的所有可能性,並對每一種可能性都進行驗證,進而確定通往結果的步驟是否可行。事實上,在AlphaGo這個圍棋程式誕生前,靠窮舉法下圍棋基本是緣木求魚,因為需要計算的可能性實在太多,靠現在的電腦還難以完成。讓AlphaGo有別於「傳統」的電腦弈棋機器的兩根技能支柱,分別在於深度增強學習(Deep Reinforcement Learning)和自我對局(self-play)。在策略網路(Policy Network)與價值網路(Value Network)的訓練下,AlphaGo不再遵循從儲存的海量棋譜中搜索最佳應手的路數,而是能夠自行生成對對手棋路的模擬,模擬及得失風險評估。

機器棋手帶來的啟示

機器棋手確實為我們這些人工智慧相關技術的研究者帶來了很多啟示。

第一,這種圍棋程式的自我博弈模式是否可以推及到別的領域──讓圖像識別系統生成無限圖像(如人臉)來類比,讓語音辨識系統生成各種嘈雜環境下的語音來鍛煉辨別力,讓即時翻譯程式生成語法無誤的例句乃至長文並譯解為別種語言⋯⋯類似模式若能在其他人工智慧研究的旁支得以推及,將有可能大大推動這一領域的學術進展和應用變現。

第二,儘管機器在圍棋人機大戰中取得了勝利,但其演算法卻是由人開發出來的,在我看來,這更能彰顯人腦而非電腦的智慧。資訊科技發展至今,無論從記憶還是運算能力看,人腦都再沒可能贏電腦──就像比拼加減乘除和開根號,永遠都是電腦快過人腦,但後者強於前者的地方在於,是人類發明了加減乘除和開根號的演算法。下圍棋又何嘗不是這樣?人也是在掌握了演算法規律的前提下,將「思考」的能力賦予了機器。

AlphaGo的背後是雲,是無數台電腦,若單論計算資源與能力,它遠遠超過它的對手李世石,但人類棋手卻能在這樣的背景下與機器一競高下,顯然更了不起。再說,人腦還是某種意義上的清潔,低能耗系統──人類下圍棋時動腦思考所消耗的能量與同一時間機器棋手所耗費的電能相比,全然不是一個量級。也就是說,有一些特定的事,如果由人來做,顯然比依賴電腦來得更簡單,更經濟,因而也就更智慧。

第三,即便是承認機器下圍棋的技藝已然比人類更強,但這並不意味著機器也能理解圍棋(以及國際象棋,中國象棋等)蘊含的文化和哲學之美,不意味著機器能在對弈的過程中感受到那種唯有人才能體會的快樂與激情。

在中國,圍棋自古便被視為一種君子之技,怡情之藝,相傳「堯造圍棋以教子丹朱」,而後世之所以有那麼多人嗜下圍棋,所為的絕不僅僅是在咫尺之枰與黑白疆域間捭闔爭勝,而更多的是借圍棋來體悟世間至道,生存哲理。再回想阿城先生的小說《棋王》,主角王一生因能癡於棋,故能極於棋──故事的高潮是他以一敵九,大獲全勝,但背後的思想卻是「待在棋裡」,與世無爭,是「夫唯不爭,故天下莫能與之爭」的道與禪。這境界是機器永遠都不可能理解的。事實上,今天的人工智慧能夠辨認貓和狗,卻不理解,也就是說只能做到某件事,而不是理解某件事,不理解為什麼是這樣。

還有個有趣的問題:在人類的圍棋堡壘被攻陷後,有沒有哪些智力遊戲是機器始終無法做到百戰百勝的?當然有。

我們將有助於益智的棋牌類遊戲分為以下三種:第一種是機器用窮舉法便可以所向無敵的遊戲,譬如五子棋,其博弈樹複雜度沒那麼高,幾乎每一步都有最佳演算法。第二種是不太容易用窮舉法來保證勝利的遊戲,國際象棋,中國象棋和圍棋便是典型──如果延續窮舉法的思路去「硬啃」,即便窮盡全世界10億台電腦的計算能力,要徹底推算出棋枰上每一步落子的全部可能性也要花費1017到10140年。

洪小文

第三種遊戲除了和運算能力有關,還引入了運氣元素,以至於運算能力的強弱不能完全決定勝負結果,例如麻將,德州撲克,橋牌等。玩這類遊戲,人機對決是勝負難料--雖然假設玩無數局下來,勝率一定是機器更高,但機器無法保證自己每局必勝。畢竟,說到記牌,算牌,人腦固然弱於電腦,而且電腦還可以根據無數過往牌局來推測打哪張牌的贏率較大,但在無法看到其他對手底牌且不能通過察言觀色,注意對手的小動作等方式來作出判斷的情況下,電腦無法精確評估出勝算,也就不可能連戰連贏。也正是由於存在著運氣的元素,麻將等遊戲的趣味性才大大增加──即便對手的頭腦更好,技藝更高,也還是有人願意加入戰局一試運氣。

小結一下我對機器棋手的看法,那就是,在人類開發的演算法的加持下,機器棋手取得了勝利,但這恰恰證明了人腦的強大與優越。

本文由微軟授權轉載自微軟亞洲研究院新聞中心

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長至少800字,請附上個人100字內簡介,文章若採用將經編輯潤飾,如需改標會與您討論。

(觀點文章呈現多元意見,不代表《數位時代》的立場。)

每日精選科技圈重要消息