Facebook的AI入門課!用三段動畫講解人工智慧如何運作

2016.12.06 by
張庭瑜
截圖自Facebook AI說明影片
Facebook在部落格上發布三段淺顯易懂的影片,替大家上一堂AI入門課,希望告訴大家「AI並非魔法,而是嚴謹的科學。」

語音助理、智慧家電、購物推薦⋯⋯ 人工智慧替我們的生活中帶來便利,但卻也讓不少人擔心人工智慧發展到最後,是否會產生自主行為,形成電影中機器挑戰人類的情節。

在圖像辨識、語言翻譯和動態時報排序等都用到大量人工智慧的Facebook,希望破除這個迷思。Facebook的AI研究部門負責人Yann LeCun認為,多數的害怕來自於不理解,「我們希望告訴人們AI並非魔法,而是嚴謹的科學。」因此在部落格上發布三段淺顯易懂的影片,替大家上一堂AI入門課。

人工智慧比人類厲害的地方:辨識出大量數據中的模式

大部分的人工智慧系統由人工神經網路和程式碼構成,模擬大腦神經元的運作方式,並像人類和動物一樣,可以透過修改神經元的連接方式,從經驗中學習。

其中,人工智慧特別擅長辨識出大量數據中的模式,這是人類較不擅長的,此外,還可用於學習翻譯、簡單的邏輯推理,甚至是系統性地產生新想法。

什麼是機器學習演算法?

用來訓練人工智慧的機器學習演算法,實際上如何運作?

他們將人工智慧比喻成一台機器,若最終希望能讓它辨識出「汽車」和「狗」的不同,必須先提供大量汽車和狗的照片,讓機器練習回答,並在每次的回答中調整解題過程。最終,就算出現過去沒看過的圖片,也能找出是否有共同點而辨識出物體。

過去,傳統演算法只能重複性的一一比對資料庫,比對到類似圖片才能歸納出答案,而常聽到的機器學習演算法,則可在比對的過程中「訓練」機器的辨識能力,大量減少所需時間和運算效能。

看過影片後,就可以了解機器學習的過程其實真的很「數學」。

對電腦而言,圖片由一組數字矩陣組成,這些數字分別代表不同像素的亮度。舉例來說,想要分辨字母「C」和「D」,首先計算出代表C和D的數字矩陣,再乘以「權重」,若數字加總後大於零,可判斷是C,反之則為D。而機器學習演算法,就是在辨識圖片的過程中不斷依照C和D的圖像特性,調整權重。

影片中說明,演算法會同時考量C和D的數字矩陣,最終可調整成只對C有反應且為正的權重、只對D有反應且為負的權重。因此,只要知道加總結果大於或小於零,就可以知道數字矩陣代表的字母。

有利於辨識局部圖像的深度學習法:卷積神經網路

不過,就算學會如何辨識不同物體,只要物體出現在圖片中的尺寸、露出部位和角度只要有些不同,就可能讓機器誤以為是完全不同的東西。

這時候便會用上深度學習結構「卷積神經網路(convolutional neural network,ConvNet)」,在第一層會先抓出物體的局部影像,例如輪胎的輪子,或人的眼睛,且讓這些局部影像重複出現在不同影像圖層的不同位置;第二階段則可將第一層的影像組合起來,例如整張臉、機翼等,最後可組合成完整的一輛車、一架飛機、一個人等。透過這樣的分層分析,可簡化機器辨識複雜圖像的步驟。該技術也可應用於自駕車、語音辨識及翻譯。

三種AI學習方法

Facebook指出,目前人工智慧學習方法大致分三種。

首先是透過輸入大量資料並給予獎勵回饋的「強化學習」,教機器下棋就是其中一種,不過缺點是,就算只是學一個簡單任務也需要大量數據和練習。

而最常用於訓練神經網路的「監督式學習」,就像爸媽用繪本教小朋友物體名稱,當我們提供機器汽車的圖片,會告訴他正確答案是汽車,演算法可以從這過程中學到汽車的特性。

最後一種是「無監督式學習」,亦稱為「預測型學習」。大多數人類和動物最初都是以這種方式學習,透過觀察以及和這個世界互動,便能學到基本知識,例如這世界是三維的、物體不會突然消失等。但目前人工智慧尚未發展到這種學習階段,這也是限制人工智慧進展的因素之一。

想成為AI人才,先學好數學

Facebook建議,如果未來想以AI作為工作,數學和物理絕對是必修課,微積分、線性代數、機率和統計,盡可能修越多越好。此外,電腦科學、工程、經濟、神經科學等科目,對研發人工智慧也有幫助。

不過令人意外的是,文章中特別提到哲學的重要性,因為其對理解和學習任何知識都有幫助。這也呼應到Facebook近來被批評其動態時報推播假新聞影響美國大選結果,在每種機器學習應用的背後,最終還是得回歸到「人」。

資料來源:FacebookTechCrunch

每日精選科技圈重要消息