[AI洞見]以科學的方式赤裸裸解剖AI——人的智慧在哪裡?

2018.01.05 by
洪小文
洪小文 查看更多文章

現任微軟全球資深副總裁,微軟亞太研發集團主席,兼微軟亞洲研究院院長,全面負責推動微軟在亞太地區的科研及產品開發戰略,以及與中國及亞太地區學術界的合作。

Sergey Tarasov via Shutterstock
人類的智慧應該是一個金字塔的結構。金字塔的最底層叫計算和記憶,我們中國一直覺得這屬於智慧、智慧的部分。我們常常說一個人神機妙算,過目不忘。事實上,所謂的圖靈機,馮諾伊曼的架構,電腦裡面最重要的,最基本就是CPU與記憶體,一個管計算,一個管存儲。

人類的智慧應該是一個金字塔的結構。

金字塔的最底層叫計算和記憶,我們中國一直覺得這屬於智慧、智慧的部分。我們常常說一個人神機妙算,過目不忘。事實上,所謂的圖靈機,馮諾伊曼的架構,電腦裡面最重要的,最基本就是CPU與記憶體,一個管計算,一個管存儲。

我記得我人生中受到的最大一次打擊是在我小學一年級的時候,跟算盤有關。當時選一些比較聰明的小孩去訓練珠算,我沒有被選上。老師安慰我說,你體弱多病,就算了,為此我還非常鬱悶。我當時覺得算盤打得好的人是神童。可是,今天沒有人會浪費時間去學計算,也沒有人認為會計算有什麼了不起——珠算和電腦(甚至計算機)相比是以卵擊石。

說到記憶體,我不知道多少人記得家裡的電話號碼,我是不記得。所以這有兩層意義,一是說,算東西和記東西不要跟機器比;第二,我們覺得這是雕蟲小技。

1.模式識別,不要和機器比,是在浪費你的生命

更高一層是感知,也就是可以聽懂話,可以認識東西。

我一直是做模式識別的,其實從學問來講,尤其是我們這代人,我覺得認真來說,深度神經網路(DNN)最了不起的一件事情,很可能在很大的程度把模式識別給解了。解的意思是說,當有很多的資料,很大的計算量,我可以不做假設,讓它用最好的模式去學,而且不用給它額外的知識,甚至用原始資料就行。它是不是解了AI,可以打一個大問號;但是它很大程度把統計的模式識別,模式分類,模式匹配給解了。我承認這個DNN是蠻了不起的。

再談一下AlphaGo,我覺得AlphaGo最了不起的是把下棋變成了一個模式識別。如果是模式識別,理論上人其實是做不過機器的。道理其實非常簡單,我舉另外一個例子:比如假設有500個人在做壞事,我們把他們的照片拿給你看,你的工作就是每天在海關看這500個人有沒有進來。別說500個人了,50個陌生人要把他們記下來都不可能。而機器卻可以硬把它強記下來。

人下棋很大程度上不是在做原始的模式識別。人在棋裡面要找到一個路,因為人不可能記那麼多模式。人必須要歸納出一些原則性或者演算法的東西。人做原始的模式識別是做不過電腦的,所以說難怪AlphaGo打贏了,AlphaGo打贏其實根本不證明AI有什麼了不起。

AlphaGo基本做模式識別,而DNN基本上解決了模式識別。所以,如果是模式識別,也不要和機器比,是在浪費你的生命。

2.DNN是一個黑箱,但是黑箱很強大

接下來談一下黑箱、白箱的認知。DNN以及模式識別基本上是黑箱,有輸入進去,然後給出輸出。


黑箱有黑箱的好處,黑箱不全是壞事。有一本書叫做《沒有偏見的思考》,強調黑箱的好處是不會有偏見。人做決定會偏見,而我們人如果能夠跳出來用黑箱思考,這個社會就會變得更好。其實這個道理我們中國人也都知道,鄧小平說黑貓白貓,會抓老鼠就是好貓,這基本上就是黑箱的想法。

黑箱可以解決什麼,但不能說明為什麼。另外,黑箱沒有辦法連結(chaining),就是說沒有辦法做一些推理。因為黑箱要做推理,唯一的可能就是某一個黑箱的輸出,是下一個的輸入,否則沒有辦法做推理。今天的DNN是一個黑箱,但是黑箱很強大。

我們都有一個叫做回饋環路(feedback loop)(的東西)。我們人類的行為都可以用這個來表示,比如做科學實驗,改變一些東西,收集一些資料,然後做分析,決定下一步怎麼做;做產品也是這樣,我們今天叫互聯網反覆運算,要很快地反覆運算,看客戶的回饋。

物聯網有兩個部分,一塊是感測器,一塊是執行器(Actuator)。感測器是感知自然界;執行器是操作自然界。如果是閉環,就可以收集大量的資料,做成一個黑箱,雖然它很複雜,舉個例子叫做「可預測的維護」(Predictive Maintenance):以前電梯壞了,打電話給電梯公司,電梯公司可能隔兩三天派人來,查看下,然後回去分析,隔幾個禮拜,拿來零件換一下,電梯可能一兩個禮拜都不能用。現在,在電梯上裝各種感測器,然後收集資料。這時候,如果看到資料某個樣子(預兆需要維護),就可先派人去維修。電梯是非常複雜的,有各種因素,但是我們可以用這個方法,把它變成一個閉環,變成一個黑箱來處理。

所以AI為什麼在工業界那麼紅火?電梯維護是一個例子。這個例子可以引申到任何地方,比如油管檢測,人的身體的監測。前幾年的穿戴式非常紅火。如果感測器真的很準確,測到身體的任何一樣生物信號,那很了不得。就拿癌細胞來講,將來有可能在癌細胞超過一個臨界值之後,就知道馬上要去醫院,有利於早期治療。其實今天大家講AI,資料非常重要,今天的AI沒有資料是活不下去的。第二個要有很大的計算,我們叫雲,缺一不可。

3.看到露出的部分,你在腦補其它地方

我們剛剛談的AI,其實是一種認知:我們不僅知道電梯快出問題了,還知道需要怎麼樣的修理。也就是說我知道,我有認知,所以的確電腦今天做了認知的一些東西,但不是全部。

John Seale是一個哲學家,他提出了一個叫做中國房間的論題(Chinese room)(編者按:作者提出假設有一台鎖在房間中的機器可以完全無障礙的與隔壁房間裡面的會講中文的人交流,人無法判別交談物件是人還是機器,即便如此,也並不能代表機器能「理解」這樣的交談)。他提到了圖靈測試:如果這個房間裡面可以出一個像人一樣的回答,我們就說這個機器通過圖靈測試,跟人的智慧就是一樣。

其實中國房間所講的就和我們今天的翻譯是一樣的。今天的翻譯就是查表,然後做回歸。你給機器一張紙,機器也不知道是什麼字,一對照是這樣的(字詞)組合,就給出這樣的組合,沒有理解在裡面。其實AI有兩種,一個叫強人工智慧,一個叫弱人工智慧,弱人工智慧就是模擬,是根本不瞭解,強人工智慧是真的瞭解。

不過,這裡可能會有人挑戰我:如果機器通過了圖靈測試,那就可以的呀。我們學語音的,有一個概念叫做雞尾酒效應。我們平常去參加雞尾酒會,一個很小的空間裡面很多人在講話,有人講中文,有人講英文。不過,站在你旁邊的一個人,即使大部分的話你都沒聽到,還可以交流,為什麼?通常我們站在一個人旁邊,大家也都相互認識,知道他的背景,所以即使聽到幾個音,也會猜得八九不離十。

今天沒有一個AI可以做到這點,但是人為什麼可以做到?人不是真正聽到他講的每句話,人不是把信號處理過才知道。人使用的就是之前談到的「產生並測試」(generate and test)。如果是一個陌生人,你大概是沒有辦法的;但如果是一位朋友,因為有關於這個人的所有知識,講幾個音,大概猜猜就可以知道了。我們做認知,甚至感知的時候,都用了其他的知識,事實上視覺也是一樣。假設有一隻大象,你只要看到任何一個露出的部分,就可以知道它是一個大象,你在腦補其它的地方。你腦中閃過好幾個假設,這就叫做產生(generate),然後測試,然後你就知道大概是這個意思。

今天機器翻譯的東西,怎麼可能做到這些?就算要做,也要回到最原始的知識表示,還有常識推理,今天這些都沒有人談了。什麼叫常識?就好像有一個人吞了一個蘋果,用常識也可以知道,一個人不可能吞一個蘋果,這個叫做強AI,真的用理解去做事情。

人的認知事實上是白盒子,在裡面要做因果分析。因果分析是非常複雜的,要回答為什麼,而不只回答是什麼,更不要說很多事情都是開放的系統。產品就是一個開放的系統,到底下一個產品該放哪些特性,本身就是一個開放的系統,可以用AI去自動化嗎?不可能。還是要人的智慧加機器的智慧。

當然,我還是要用大數據的分析,給一些線索,來決定人來做什麼。或者投資也不太可能被AI取代,因為每一個投資方案都不一樣。拿微軟做一個例子,我們要考慮要不要買領英,這種很大的事情一輩子就做一次,你不可能去讓一個機器做,因為這次搜集的資料不一定下次還有用。產品也是,做一個錯誤的產品,不知道要花多少時間去改正它。這種一輩子隻做一次的決定,一定是人的智慧和人工智慧一起做。

4.愛因斯坦提出引力波,不要說大數據,是無數據

演算法的定義是通過一步步的操作來解決問題。什麼叫創造力?就是你能夠產生一個新的演算法,去解一個未解的問題,或者更好的去解一個已解的問題,這就叫做創造力。

就這樣的定義來講,我覺得在數學上,推理上很多東西,都是創造力。比如說很有名的高斯,他小時候很聰明,常常去找數學老師問問題。數學老師覺得他很煩,有一天說,你從1加到N,數學老師想他怎麼也得花半個小時。結果高斯幾分鐘就有了答案,創造了一個新的公式。這顯然是一個演算法。我講這個例子有一個特殊的原因,我們之前說人和電腦比計算沒有可比性。假設N是一個很大的數,電腦從1加到N,而人用高斯發明出的公式,誰會最早算出答案?還是電腦。

如果你同意這個的話,那我們來談一下AlphaGo。李世石,柯潔其實非常可憐。下棋包含兩件事情,一件是演算法,另外要去算才有答案。所以李世石和柯潔,下棋的演算法來自他們自己,算也要自己去算;可AlphaGo的演算法來自於人,來自於一個團隊,有幾萬台機器在雲那邊去算。

如果今天人用比較好的演算法,還和機器有得一拼的話,你會覺得誰的演算法比較好?肯定是人的演算法大概比較好,因為機器的算力比人高那麼多。所以AlphaGo打敗人,對AI來說不算什麼,根本和創造力一點關係都沒有。更何況,我覺得其實象棋也好、圍棋也好,被他們這樣一做,就跟珠算一樣,從此沒有人認為這是有智慧的東西,也沒有人會把時間浪費在這裡。

科學發展,肯定是新的演算法,事實上新演算法,充滿了每一個地方。比如說今天的計程車,該派哪一個車去;或者說快遞公司在送快遞的時候,我們說旅行中的銷售員問題(Travelling Salesman Problem),先送這裡還是先送那裡,怎麼去優化,這全都是演算法。甚至於有些演算法不是那麼明顯的,比如說教書,我們常常有這種經驗,有一個東西你覺得最好的教法是這樣,但是你這麼教,有的學生可能就不能接受,有時候你換一個角度去教,他就可以接受,演算法改變了一個人從不懂到懂得。

2016年美國大選,英國脫歐,我知道可能投某一方是對的,但是我這個票就是投不下去。很多時候我知道你是對的,同時我也願意接受,甚至把票願意投給你,或者叫做同理心等等,這個其實跟演算法是有關聯的,至於怎麼變成演算法,我還在思考。

最後提一下,創造力絕對不是一個大數據的問題,絕對是一個小資料的問題。

我舉一個例子,去年的引力波是愛因斯坦在100多年前提出來的一個假設。當年不要說大數據,我覺得是無數據,因為100年以後我們用最新的設備勉勉強強測到有一點那個影子。他當時怎麼想到這個東西的?肯定不是大數據。如果有大數據以後,我說有引力波,我相信一個小學生也可以做出來。所以,沒有資料怎麼產生創造力,我不認為有人知道。

大家在比AI跟人的時候,不要忘記兩點,一點今天所有的AI的演算法全部來自於人,都是人寫出來的。如果有人說我今天能寫一個程式,自己產生一個程式或者新的演算法,去解一個新的問題,這兩者是不一樣。

我寫一個程式,面對我知道的問題,能夠做出解決方案,這就像下棋,加強學習就是這個例子。可如果我寫出一個程式,能夠解決一個新的問題,我都不知道這個新的問題是什麼,這個新問題對照一個解法,這是沒有的事。實際上GPS(一般求解器),我們沒有,我當然希望有一天有,但實在沒有。

大家再看一下腦神經學和認知心理學,但至少大部分人相信,我們人的左腦、右腦所處理的事情不太一樣。所以似乎電腦只是一個左腦,而我們的創造力大部分在右腦。右腦加左腦,其實本來就是一個大膽假設、小心求證的過程,所以我覺得AI和HI要結合在一起,更不要說電腦是我們發明出來的。

5.人的缺點反而説明了我們的創造力

智慧,我實在不知道怎麼定義,我也覺得我沒有資格去定義。因為我不能定義,我只能講我自己到目前為止,我瞭解的東西跟智慧有關的,就是《倚天屠龍記》張三豐教張無忌太極劍法的故事。第一次張無忌說,太師傅,我這次記得了七成;太師傅說,很好,有進步;第二次張三豐又舞了一次,張無忌說,太師傅,這次我只看懂了一半,張三豐說很好;第三次張無忌說,太師傅,我完全不記得了,張三豐說,你融會貫通了。

我們在看看意識和想法。有一個鏡子測試( Mirror Self Recognition Test,MSR),我的理解是這樣的:如果在你的額頭上貼一個便利貼,你馬上知道這不是屬於我們的一部分,就把它拿掉,這是一個惡作劇——就是我能不能知道這個東西是我的一部分。我的理解,首先大部分的動物是不通過的,我們喜歡的狗跟貓基本上沒通過,大部分的猴子也沒通過,但是好像猴子經過一些訓練以後是可以通過的。據我所知,海豚、金魚是通過的。

但是這個有爭議,有人會說,它其實知道這不是它的一部分,只是它不覺得麻煩,所以沒有拿掉。但我想自我意識不是每個動物都有的。

另外一個是思想和身體之間的關係,笛卡爾說我思故我在。有一派是純粹的唯物派,所以思想就是你的軟體,硬體就是腦,要研究腦。有另外一派覺得不是,至少還有一個脊椎,思想和身體是一體的。我自己本人比較傾向於這一派。因為人有時候疼痛或者感覺,事實上是會影響我們的思維的。如果說只有腦的話,把身體拿走,其他地方的感官不影響思維,是不是這麼簡單呢?

如果就是一個軟體跟硬體的關係,那軟體來自於哪裡?有一本書,是認知心理學的書,它也做一些腦神經的東西,一個叫Gelernter的教授寫的一本書,叫Tide of Mind: Uncovering the Spectrum of Consciousness。他把一個人的頭腦大概分成兩個週期,一個叫High spectrum,就是通常我們起床喝一杯咖啡,我們意志力很集中的時候,可以做計算,做推理,做邏輯,做很精確的東西。Low spectrum就是我們累了,打哈欠了,做白日夢,甚至於就睡著了。意志力不集中,這時候你計算或者記憶就會失誤,就會算錯。這時候我們可以接觸到深層的記憶,但絕對不充分也不必要。似乎這些東西跟創造力有點關係。我這裡舉了一個例子,貝多芬做第九交響曲的時候,他是全聾了,我們絕對不能說他是High spectrum。甚至於有一個化學家發現苯環結構的時候,他說他在睡覺的時候夢到一條蛇,自己咬到自己的尾巴,形成了六角形。

人其實不是在意志力集中去想問題的時候有高的創造力,通常是在意志力沒有那麼集中,創造力比較高。不過,雖然想法很重要,但也要小心求證。中國也好、西方也好,很多詩人、很多作家常常喝得酩酊大醉,的確是意志力不集中,但創造力就出來了。

但是我覺得很好玩的一點是,我覺得人的缺點反而説明了我們的創造力。什麼意思呢?就是人意志力不集中,經常會算錯。但有人說這個簡單,讓電腦每十題故意算錯一題,我保證這樣的電腦也沒有創造力。

但是人的這種缺點似乎説明了我們的創造力,這是一個很好玩的事情:因為人不完美,人的記憶會錯,人會算錯,但是我們在有缺點的時候,我們會創造出很好的東西。

智慧,我們一般人認為人年紀越大,是比較有可能有大智慧。人年紀越大,我們的腦是退化的,有一天會死去,可是智慧來了,我覺得這可能是人性。

文章轉載自微信公眾號知識份子。

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長至少800字,請附上個人100字內簡介,文章若採用將經編輯潤飾,如需改標會與您討論。

(觀點文章呈現多元意見,不代表《數位時代》的立場。)

每日精選科技圈重要消息