本文摘自:《人工智慧來了》,天下文化出版
2016年3月,似乎人人都在談人工智慧。
AlphaGo與李世乭的一盤棋,將普通人一下子帶入科技最前沿。圍棋人機大戰剛剛塵埃落定,「人類是不是要被機器毀滅了?」之類的話題,就超出科幻迷的圈子,在普通人群中流行開來。每天,我都能在各種場合聽見人們談論人工智慧,哪怕是在街頭的咖啡館裡,也能聽到「深度學習」這樣的專業字眼。
大大小小的人工智慧「論壇」或「年會」,如雨後春筍般在北京、上海、廣州、深圳、杭州等地湧現出來。學術界的人工智慧大師們,在各種會議、商業活動和科普活動中奔波忙碌,馬不停蹄。
一邊是專業的科研機構、高科技公司在談論人工智慧;另一邊,銀行、保險、能源、家電等傳統行業廠商,也都忙不迭地把「AI」或「AI+」的標籤貼在自己身上。至於創投領域,就更是熱火朝天,包括創新工場在內,每家高科技投資機構,都盯緊了人工智慧領域的新創公司。這種火熱場面,和整個投資圈在2016年遇冷的大背景,可說迥然不同。
然而,大家千萬不要忘了,這並不是人機對弈第一次激起公眾的熱情。1997年,IBM深藍戰勝卡斯帕洛夫的那天,全球科技愛好者奔相走告的場景,絲毫不比今天人們對AlphaGo的吹捧遜色多少。再往前看,1962年,IBM的亞瑟.薩繆爾開發的西洋跳棋程式,就戰勝過一位盲人跳棋高 手,那時的報紙也在吹捧人工智慧,公眾也一樣對智慧型機器的未來充滿好奇。
從1960年代、1990年代再到今天,從西洋跳棋、國際象棋,再到圍棋、三盤棋,總共歷經三次人工智慧在公眾中的熱潮。為什麼處在風口浪尖的,偏偏都是人機對弈?為什麼會下棋的電腦程式如此風光?
縱觀人工智慧發展史,人機對弈只是人工智慧在公眾心中地位起起落落的一個縮影。對於人工智慧的技術研發者而言,選擇人機對弈作為演算法的突破口,一方面是因為棋類遊戲代表著一大類典型、有清晰定義和規則、容易評估效果的智慧問題;另一方面,也是因為具備一定複雜性的棋類遊戲,通常會被公眾視為人類智慧的代表,一旦突破了人機對弈演算法,也就意味著突破了公眾對人工智慧這項新技術的接受門檻。
的確,每次人機大戰及電腦勝出的結果,都在公眾視野中激起萬千波瀾。可是,回過頭來想一想,人類對電腦在棋類專案上勝出的心理承受力,又是何等的脆弱和可笑?跳棋程式甫一成熟,公眾便驚呼「智慧型機器威脅論」,但沒過幾年,習慣了電腦會下簡單棋類的公眾,又會轉而挑釁道:「下個跳棋,有什麼了不起的?有本事去下複雜無比的國際象棋試試?」IBM 深藍剛戰勝卡斯帕洛夫時,全世界關心科技發展的公眾,都在為人類未來的命運擔憂。沒過幾年,國際象棋和中國象棋程式,就變成了再普通不過的電腦應用,在大多數人的心目中,「下個象棋,算什麼智慧?有本事去下奧妙無窮的圍棋試試?」
網上流傳著一幅有關「人工智慧發展成熟度曲線」的插畫,展現出人們在此前兩次人工智慧熱潮中,從被人工智慧在某些領域的驚豔表現震撼,到逐漸認識當時的人工智慧還有各種局限,以至於產生巨大心理落差的有趣過程。
與其說這是人類的心理落差,倒不如說,這是電腦是否擁有智慧的判定標準被不斷提升。從會下跳棋就算擁有智慧,到會下象棋才算擁有智慧,再到會下圍棋才算擁有智慧,到底有沒有客觀的評價尺度?到底要給電腦設定怎樣的門檻,才能正式發給它一張具有「人類智慧」的鑒定證書?今天,我們認為AlphaGo是人工智慧了,那麼三年後?五年後呢?
在AlphaGo出現之前,人們至少喊過兩次「人類要被機器毀滅了!」,1960年代前後算一次,1980 年到1990年代前後也算一次。在前兩次的人工智慧熱潮中,每一次都釋放人類關於未來的瑰麗想像力,每一次都讓許多人熱血沸騰。很不幸地,兩次熱潮分別歷經十數年的喧囂之後,無一例外迅速跌入谷底,在漫長寒冬中蟄伏起來。
1998年,我來到北京創立微軟亞洲研究院的時候,正值當時人工智慧的熱潮開始消退,人們對熱潮中隨處可見的盲目情緒心有餘悸,很多人甚至不願再用「人工智慧」這個詞彙,來指代相關的研發領域。在學術圈子裡,一度有很多人覺得,凡是叫「人工智慧」的,都是那些被過分誇大,其實並不管用的技術。結果,我們為微軟亞洲研究院設定科研方向的時候,就經常主動回避「人工智慧」這個字眼,選用「機器視覺」、「自然語言理解」、「語音辨識」、「知識挖掘」之類,側重具體應用領域的術語。
只是因為人工智慧的表現,和普通人的期望存有差距, 我們這些研究人工智慧的人,就羞於提及「人工智慧」,這真是一件尷尬的事。那麼,今天這次的人工智慧熱潮,又會如何發展呢?第三次的人工智慧熱潮,在本質上有何不同? 幾年後的我們,是否還會像前兩次那樣,不但忘卻曾有的興奮,還憤然表示人工智慧都是騙子?學術界、投資界、商業界乃至普羅大眾,還會像此前兩次那樣,在熱鬧一陣子之後,就歸於沉寂,甚至跌落冰點嗎?
今天的人工智慧,是「有用」的人工智慧
我覺得,和前兩次的AI熱潮相比,這一次人工智慧復興的最大特點,就是AI在多個相關領域,表現出可被普通人認可的性能或效率,因此被成熟的商業模式接受,開始在產業界發揮出真正的價值。
從心理學來說,人們接受了一件新事物,就像人們感受到一種外界刺激一樣,是有一個心理閾值的。外界刺激——例如聲、光、電——的強度太小的話,人們根本不會有任何 感覺。只有當外界刺激的強度,超過個人能夠感知的最小刺激量,人們才有「聽到聲音」、「看見東西」之類的明確感受。 這個能夠引起人們感知反應的最小刺激量,在心理學上稱為「絕對閾值」(absolute threshold)。
人工智慧技術的發展正是如此,在此還是以圖像識別為例,在人工智慧發展的早期,如果一個電腦程式宣稱可以識別出圖片中的人臉,但識別準確率只有五成左右,那普通人只會把這個程式看作一個玩具,絕不會認為它擁有智慧。隨著技術進 步,當人臉識別演算法的識別準確率,提高到80%、甚至接近90%的時候,研究者當然知道,儘管取得這樣的進步十分不易,但這種結果其實還是很難被普通人接受,因為每五個人臉就會認錯一個,明顯無法在實際生活中運用。
人們也許會說這個程式挺聰明的,但絕對不會認為這個 程式已經聰明到可以替代人類的眼睛。只有當電腦在人臉識別上的準確率,非常接近、甚至超過普通人的水準,安防系統才會用電腦來取代人類保全,完成身分甄別的工作。也就是說,對於人臉識別這個應用,接近或超過普通人的水準,才是我們關心的「絕對閾值」。
所以,當我們說「人工智慧來了」,其實是說,人工智慧或深度學習真的可以解決實際問題了。在機器視覺、語音辨識、資料探勘、自動駕駛等應用場景,人工智慧接連突破了人們可以接受的心理閾值,而且首次在產業層面「落地」,創造並發揮出真正的價值。
人工智慧之所以能有今天的成就,深度學習技術厥功至偉。谷歌最傑出的工程師傑夫.迪恩(Jeff Dean)曾說:「我認為,在過去五年,最重大的突破應該是對深度學習的使用。這項技術目前已經成功被應用到許許多多的場景中,從語音辨識、圖像識別,再到語言理解。有意思的是,我們目前還沒有看到,有什麼是深度學習做不了的。希望在未來,我們能夠看到更多更有影響力的技術。」
所以,關於第三次人工智慧熱潮,我的看法是:
前兩次人工智慧熱潮是學術研究主導的,這次人工智慧熱潮是現實商業需求主導的。
前兩次人工智慧熱潮多是市場宣傳層面的,這次人工智慧熱潮是商業模式層面的。
前兩次人工智慧熱潮多是學術界在勸說,遊說政府和投資人投錢,這次人工智慧熱潮多是投資人主動向熱點領域的學術專案和創業專案投錢。
前兩次人工智慧熱潮更多是提出問題,這次人工智慧熱潮更多是解決問題。
到底這一次的人工智慧熱潮,是不是處於技術成熟度曲線的成熟上升期,能不能保持長期持續成長的勢頭,是不是會像此前的人工智慧熱潮那樣,有跌入低谷的風險?我想,經過前述分析後,大家應該會有自己的判斷。