[AI洞見]以科學的方式赤裸裸地剖析AI---從寒冬到復興
[AI洞見]以科學的方式赤裸裸地剖析AI---從寒冬到復興
2017.12.28 | 微軟

談AI的歷史,需要談談很有名的AI寒冬。第一次AI寒冬是在1975年左右。1956年,在達特茅斯會議之後,包括很多國家政府,美國國家科學基金會、軍方,大家滿懷希望投了很多錢。但是到1975年以後發生了幾件事情,讓AI進入了寒冬。

1975年的第一次AI寒冬

第一件事是,因為AI只能解決Toy domain(擺弄玩具一樣的簡單任務)。那個時候做語音,只有10個詞彙;下象棋,大概是20個詞彙;做視覺的人,都不能辨認出一個椅子。

第二件事情,1956年美國打越戰,還有石油危機,所以經濟也不是那麼好;還有一個很有名的英國學者Lighthill,說AI就是在浪費錢,AI的研究經費也因此遭到大幅削減(註:在1973年出版的「人工智慧:一般性的考察」的報告,俗稱Lighthill報告中稱「迄今該領域沒有哪個部分做出的發現產生了像之前承諾的那樣的重要影響」。英國政府隨後停止了對三所大學Edinburgh, Sussex和Essex的AI研究資助)。

到1980年開始,有些公司如IBM開始做一些專家系統,可以說也是有限的應用。儘管有一些缺點,但還是可以做一些事情,據說有十個億的產出。因此,AI也就開始回春。我也是這個時候開始進入AI,所以也蠻幸運的。

我是80年代去美國CMU(卡內基梅隆大學)的。我記得當時日本很有錢,到處在美國買樓、建實驗室,所以當時日本提出了一個第五代電腦系統計畫(5th generation computer Systems,FGCS)。當時還有公司專門做 Lisp Machines(通過硬體支援為了有效運行Lisp程式語言而設計的通用電腦)。就有點像今天DNA紅,大家都在做DNA晶片,那時候大家都在做Lisp Machines,Thinking ( Connection ) Machines,然後神經網路也剛開始發芽。

1990年中,AI又第二次遇冷

不過,到1990年中,AI又第二次遇冷,為什麼會這樣?因為第五代計畫失敗,Lisp Machines和Thinking ( Connection ) Machines都做不出來;而神經網路,雖然有意思,但並沒有比其他一些統計的方法做得好,反而用的資源還更多,所以大家覺得也沒什麼希望了,於是AI又進入第二個冬天。

差不多在冬天這個時刻,統計的方法,使用資料的方法出現了。

AI在1990年以前都是用所謂的研究人腦的方式來做;而我們有太多理由來相信人腦不是靠大資料的。比如,給一個小孩子看狗和貓,看幾隻他就可以辨認了。可用今天的方法,要給電腦看幾十萬、幾百萬隻狗跟貓的圖片,它才能辨認是狗還是貓。

用大資料這種方法,就在第一次AI寒冬和第二次AI寒冬之間開始萌芽。雖然AI是一批電腦科學家搞出來的,但事實上有跟AI極其相關的一門叫模式識別。模式識別一直以來都有工程師在做,從1940年代統計學家就在做模式識別。

我們這代人學電腦就知道兩個人,一個人叫傅京孫(K. S. Fu),另外一個人叫竇祖烈(Julius T. Tou)。如果AI選出60個人的名人堂,裡面會有一個叫傅京孫,那是大牛。傅京孫嚴格上來講他不算AI,但是可以包括進來,因為他也做模式識別。

模式識別裡面也有兩派,一派叫統計模式識別(Statistical Pattern Recognition),一派叫做句法模式識別(Syntactic Pattern Recognition)。80年代的時候,句法是很紅的,統計人無人問津,後來1990年以後大家都用統計。

我們做語音的人很清楚,後來引入了隱瑪律可夫模型(Hidden Markov Model),都是統計的方法,到今天還是很有用。尤其是在華爾街,做金融投資,做股票,很多都是做時間序列(time series data),而隱瑪律可夫模型這個東西是很強大的。甚至可以說,統計的方法是我們做語音的人(發展起來的)。

而且早在1980年,我們做語音的人就講出這句話「There is no data like more data(沒有什麼樣的資料比得上更多的資料)」。從現在的角度來看,這是非常前瞻性的,而且就是大資料的概念。我們那個時代的資料量無法和現在相比,但我們已經看出來了資料的重要。而且IBM在這方面是了不起的,他們一個做語音的經理有次說,每次我們加一倍的資料,準確率就往上升;我們每炒掉一個語言學家,準確率也上去。

決策樹也是第一個被語音研究者所使用。然後就是貝葉斯網路(Bayesian Network),幾年前紅得不得了,當然現在都是用深度學習網路(deep neural network, DNN,在輸入和輸出之間有多個隱含層的人工神經網路)了。我為什麼要提這些東西?今天我覺得很多人上AI的課,可能75%、80%都會講DNN,其實AI還是有其它東西的。

今天要教AI也是非常困難的。我還特別看了一下最近的AI教科書,像吳恩達等人的。他們學術界教AI,還會教這些東西,但是如果去一般或者大多數公司,全部都是在講DNN。我覺得現在找不到一本好的AI教科書,因為早期的書統計沒有講,或者沒有講DNN。

我也看了下加州大學伯克利分校的Stuart J. Russell 跟Peter Norvig寫的教科書(Artificial Intelligence: A Modern Approach),裡面DNN提了一點。可能現在也不好寫AI,因為AI提了這麼多東西,人家說根本沒用,不像DNN的確很有用。

我稍微解釋一下DNN和一般統計方法的差別。統計的方法一定要有一個模型,但是模型一定是要有假設。而你的假設多半都是錯的,只能逼近這個模型。資料不夠的時候,一定要有一定的分佈。當資料夠了,DNN的好處是完全靠資料(就可以),當然也需要很大的計算量。所以DNN的確有它的優點。

以前我們用統計的方法做,還要做特徵提取,用很多方法相當於做了一個簡易的知識表示;現在用DNN連特徵提取都不用做了,只用原初資料進去就解決了。所以現在講AI不好講的原因是,DNN講少了也不對,講多了的話,說實在的,全是DNN也有問題。

神經網路的起伏

最早的神經網路叫感知器(Perceptron),跟第一個寒冬有關。因為一開始的感知器沒有隱含層(hidden layer),也沒有啟動函數(activation function),結果Marvin Minsky和Seymour Papert這兩位就寫了一本書《感知器》說,感知器連異或(XOR)都做不出來。那麼,做感知器還有什麼用?所以基本上就把整個神經網路第一代的進展扼殺了。

剖析AI1.PNG
感知器連最簡單的邏輯運算「異或」都無法做到,某種程度上導致了AI的寒冬
圖/ 洪小文

其實後來人們發現誤會了,其實書並沒有說的那麼強,不過的確造成了很大的影響。一直到1980年,做認知心理學的人,代表性的如Rumelhart和才復興了AI。

Geoffrey Hinton早期是做認知心理學的。Geoffrey Hinton先在UCSB(加利福尼亞大學聖巴巴拉分校),後來到了CMU。Rumelhart, Hinton and McClelland 復興了多層的感知器,加了隱含層以及back-propagation 演算法,這個時候神經網路就復興了。而且神經網路只要加上隱含層,事實上,只要加一層,再加上啟動函數,就可以類比,甚至還有人證明可以類比任意的函數,所以神經網路一下子就變的紅了。卷積神經網路(Convolutional NN,CNN)那時候就開始出來了,然後是遞迴神經網路(Recurrent neural network,RNN)。

因為如果要處理過往的歷史,有存儲, 就需要回溯。用於語音和自然語言處理的時間延遲的神經網路(Time-Delayed NN,TDNN) 也都有了。

不過,那時候資料不夠多。資料不夠多就很容易以偏概全。第二個因素是,計算的資源不夠,所以隱含層也加不了太多。這樣,神經網路雖然大家都很有興趣,也能夠解決問題,但是卻有更簡單的統計方法,如支持向量機(Support vector machine,SVM),能夠做到一樣或者略好。所以在1990年代就有了AI的第二次冬天,直到DNN的出現才又復甦。

AI的復甦

AI的復甦,可能要從1997年開始說起。1997年,深藍打敗了國際象棋冠軍Garry Kasparov。這裡我要提一下一個人叫許峰雄。他當時在CMU做一個當時叫做深思(deep thought)的項目,基本上架構都有了。結果,IBM非常聰明。他們到CMU參觀,看到許峰雄這個組。然後也沒花多少錢,最多兩百萬,就買下了這個組,讓這些人到IBM做事。IBM當時就看到,在五年之內就可以打敗世界冠軍,其實真正的貢獻都是在CMU做的。

許峰雄後來也離開了IBM,加入了我們,一直做到退休。AI復甦的實際上才剛開始。有人說這個也沒有幫助到AI復甦,因為深藍可以打敗國際象棋的冠軍,也不是演算法特別了不起,而是因為他們做了一個特殊晶片可以算得很快。當然,AlphGo也算得很快,算得很快永遠是非常重要的。

到了2011年,IBM做了一個問題回答機器叫華生(Watson),打敗了Jeopardy遊戲的冠軍。Jeopardy這個遊戲其實也很無聊,有一點像記憶的遊戲:問一個常識的問題,給四個選項。其實華生打敗人也沒什麼了不起的。

到2012年,AI的復甦就已非常明顯。機器學習和大資料採擷變成了主流,幾乎所有的研究都要用,雖然還不叫AI。事實上很長一段時間,包括我們做語音和圖像,對外都不講AI。因為AI這個名字那時變得有點名聲不好。人們一說起AI,就是不起作用。第二次AI寒冬的時候,只要聽說某個人是做AI,那就認為他做不成。其實機器學習是AI的一支。

剖析AI2.PNG
從左至右:Yann LeCun,Geoff Hinton, Yoshua Bengio, 吳恩達
圖/ 洪小文

現在回到深度學習,有三個人物對深度學習做出了很大貢獻。第一位,Geoffrey Hinton。這個人非常了不起。了不起之處在於當沒有人在乎神經網路的時候,他還在孜孜不倦的做這個東西。第二個做CNN的人物是Yann LeCun。

他也是做CNN一輩子,在AI冬天的時候繼續做,所以今天很多CNN該怎麼用來自於Yann LeCun。另外一個叫做Yoshua Bengio。所以,現在還有人在排中國十大AI領軍人物,我覺得很搞笑。我覺得誰在外面講AI,或者搞個公司,他們和科學家是兩回事,科學家是在別人以為冬天的時候還在做。

所以今天講到DNN、講到AI,沒有前人的種樹,就沒有後人的乘涼。這61年的發展,這些辛苦耕耘的人,大家需要記住這些人。今天在檯面上講AI的人都是收成果實的人,講自己對AI有什麼貢獻,我覺得就太過了。

還有一個跟AI有關的,大家記得Xbox幾年前有一個叫Kinect,可以在玩遊戲的時候用這個東西,我覺得這是第一個發佈的主流的動作和語音感知設備。當然之後就有2011年蘋果的Siri,2012年Google語音辨識的產品,以及微軟2013年產品,這些都是AI的復甦。直到2016年,AlphaGo打敗了李世石,打敗了柯傑,AI就徹底復甦了。

今天的AI

DNN、DNN還是DNN。

我不是有意要貶低DNN的重要性,但如果說DNN代表了所有的智慧也言過其實。DNN絕對非常有用,比如機器視覺,會有CNN;自然語言或者語音的,就有RNN,長短時記憶(Long Short-Term Memory,LSTM)。電腦視覺裡面有一個圖片集imageNet。我們很榮幸在幾乎兩年前,微軟在該圖片集上辨認物體可以跟人做得一樣好,甚至超過人。

語音也是一樣,微軟在差不多一年前,在Switchboard,在任意的一個任務裡面也超過了人類。機器翻譯我相信大家都常用,可能是每天用。甚至看起來好像有創造性的東西也出現了,比如小冰可以寫詩。我也看到很多電腦畫出來的畫,電腦做出來的音樂,都表現的好像也有創造力一樣。

不過,雖然AI很紅,機器學習,大資料大家都聽過,特別是做學問的人還聽過大資料採擷,那麼這三者有多大的差別?我常說這三個東西不完全一樣,但是今天這三個的重複性可能超過90%。所以到底是AI紅,還是大資料紅呢?還是機器學習紅呢?我覺得有那麼重要嗎?

文章轉載自微信公眾號知識份子。

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長至少800字,請附上個人100字內簡介,文章若採用將經編輯潤飾,如需改標會與您討論。

(觀點文章呈現多元意見,不代表《數位時代》的立場。)

往下滑看下一篇文章
保育類食蟹獴回來了! 晶睿通訊「安全地圖」賦能南投種瓜溪重開機
保育類食蟹獴回來了! 晶睿通訊「安全地圖」賦能南投種瓜溪重開機
晶睿通訊
晶睿通訊安防解決方案成功捕捉到保育類動物食蟹獴在種瓜溪旁覓食的珍貴影像。
圖/ 晶睿通訊

「當許多地區為防洪而大肆築牆時,我們反其道而行,用減法思維打造全台第一個還野於溪,承洪韌性更佳的生態廊道。」中興大學生命科學系許秋容與Peter Chesson教授,娓娓道來這個位於南投縣國姓鄉種瓜溪的溪望故事,在拆除長近兩百公尺、高四公尺的防洪牆後,逐漸恢復原有生態樣貌。晶睿通訊舉辦第五屆「安全地圖」永續活動,聚焦守護生物多樣性,攜手中興大學社會責任(University Social Responsibility, USR) 「環境韌性與永續」團隊,發起「復育種瓜溪 生態安全地圖」任務,在種瓜溪為動植物構築家園,並導入安防解決方案監測生態,成功捕捉到保育類動物食蟹獴覓食的珍貴影像,期盼更多生物到此定居,讓安全成為人與自然共生的連結。

晶睿通訊
中興大學許秋容教授推動復野工程,讓種瓜溪從水泥建設掙脫,復育生態。
圖/ 晶睿通訊

「還地於溪」 復育種瓜溪的願景

2004年受颱風侵襲後,種瓜溪為防洪而築高牆、設固床工,但也形成阻隔和破壞生態系。多年來,護牆出現裂隙、基腳淘空和固床工鋼筋外露,反成安全隱憂。2018 年,許秋容與Peter 教授入住溪畔農舍,倡議用減法思維,以拆牆「還地於溪」方式兼顧防洪與保育,經過努力奔走,最終2023年促成台灣首宗由居民發起的溪流復育工程。目前由中興大學許教授等人所組成的USR團隊持續進行生態監測研究與棲地維護,晶睿通訊則透過「安全地圖」活動,投入技術與人力,共同守護這條重生的溪流。

晶睿通訊
晶睿通訊為種瓜溪導入安防解決方案,守護動植物與棲地生態。
圖/ 晶睿通訊

以行動實踐關懷 安防科技讓人與自然共好

晶睿通訊總經理廖禎祺表示:「公司以『關懷』作為品牌催化劑,在2010年智利礦災時,我們的攝影機深入礦坑,記錄受困礦工的生命跡象,將畫面傳給救援團隊,為這場奇蹟營救盡一份心力。在澳洲維多利亞公園,我們運用 AI 解決方案,觀測菲利普港灣的海豹棲地,掌握漁線、繩索等潛在威脅。這次『安全地圖』活動,晶睿通訊攜手中興大學USR團隊,將關懷、守護社會安全的初心,轉化為對溪流生態系與野生動植物保育的投入,讓科技成為人與自然共好的基礎設施。」

晶睿通訊
晶睿通訊同仁齊力打造生態池,現迎來澤蛙、蜻蜓、划蝽等動物入住。
圖/ 晶睿通訊

築起安全棲息的家園 讓自然重回生機

在中興大學 USR 團隊引導下,晶睿通訊安防小隊觀察種瓜溪水生昆蟲、原生植物,理解溪流復育拆除水泥護岸前、後對生物的影響。隨後以分組形式,一邊打造小型生態池,並以竹筒為艾氏樹蛙搭建新家;一邊則是整地並清除外來入侵種包括含羞草、香澤蘭和象草等,栽種葦草蘭、野牡丹、金銀花、紫珠、臺灣山桂花和月橘等台灣原生植物,以穩定水土和復育濱溪植被。

連續5年參與「安全地圖」活動的工程師Ben表示:「能親手參與復育工作、為自然盡一份力,是身為晶睿人的驕傲。」首度參加的影像設計師Abbie說:「加入『安全地圖』活動,我看見安防科技能為永續帶來更多正向影響,期待未來將這些現場經驗融入設計工作,讓影像更具溫度與說服力。」

晶睿通訊
晶睿通訊邀請DATAYOO悠由數據加入活動,提供種瓜溪生態研究的數據基礎。
圖/ 晶睿通訊

晶睿通訊與DATAYOO悠由數據合作 大數據掌握溪流復育

晶睿通訊發言人暨企業品牌永續室處長謝邦彥指出:「『安全地圖』活動從鄰里社區、教養院、學校、歷史聚落,到種瓜溪,累積上百人次的公司員工一起健檢各場域、提出安全解決方案。透過這些實踐,我們將「安全」的定義從單純守護人,延伸至守護動植物與棲地,看見了安全的多元面向。未來,我們將持續號召產業跨界合作,以安防專業為基石,更廣泛地擴大社會影響力,創造更具包容性的安全價值與樣貌。」

晶睿通訊
晶睿通訊員工落實永續行動,與許秋容教授(前排右1)和Peter教授(前排右5)一起合作。
圖/ 晶睿通訊

今年晶睿通訊也邀請以AI大數據推動精準農業的合作夥伴DATAYOO悠由數據,加入行動,透過其FarmiSpace PRO監測服務,使用AI作物監測系統,透過衛星光譜資料運算出的各項作物指數進行分析,提供中興大學USR團隊進行種瓜溪生態研究的數據基礎、以科學化方式掌握自然復育方向,讓科技成為助力。

晶睿通訊
晶睿通訊員工分組種植台灣原生植物,以及清除外來入侵種。
圖/ 晶睿通訊

此次棲地復育行動已有初步成效,晶睿通訊員工打造的生態池,很快地吸引澤蛙、蜻蜓、划蝽和龍蝨等生物入住。許秋容教授表示:「企業主動提案,並願意帶著公司同事親身參與,是實踐復育行動最具力量的表現。透過晶睿通訊的安防專業與志工投入,以及AI解決方案帶來長期生態監測,讓我們加速復原種瓜溪的生態系,讓更多人看見人與自然的共好。」

晶睿通訊
晶睿通訊員工協助復育種瓜溪,已收穫初步成果。
圖/ 晶睿通訊

【關於晶睿通訊VIVOTEK】

晶睿通訊在2000年於台灣成立,2011年在台灣證交所上市(股票代號:3454),陸續與全球夥伴建立策略聯盟,成功攜手逾100個國家、超過200家授權經銷商合作,且於美國、日本、荷蘭、印度、墨西哥等地設有子公司或辦公室。晶睿通訊擁有20多年經驗,以深耕影像及音訊的領先技術能力而廣受市場認可,聚焦台灣研發、生產、製造基礎,致力發展IP攝影機、影像管理軟體、雲端安防服務,更將人工智能、邊緣運算等廣泛應用於服務內容。2017年,加入全球電源管理解決方案領導品牌台達集團,成為樓宇自動化業務安全與智能的核心事業之一。自從2021年進行品牌銳變後,朝向更安全、更智慧、更永續的品牌前進,更於今年發起「MAKE TOMORROW EASIER, TODAY!」宣傳活動,期望深植品牌口號「We Get The Picture」,致力成為全球最值得信賴的安防品牌。更多信息,請見官網 https://www.vivotek.com/

晶睿通訊
圖/ 晶睿通訊

【關於中興大學USR團隊】

中興大學USR團隊「環境韌性與永續——生態復育森川里共榮」成立於2024年,是延續由成員所發起臺灣第一次的溪流復育 (南投國姓的種瓜溪),以培養人才、支持偏鄉、生態復育及推廣啟發為目標 ; 對應SDGs 6、11和15。連續3年外來種移除吳郭魚從75%降至0和持續增加的生物多樣性顯示「溪流復野 (River Rewilding) 」的價值和生態系的韌性、年度到訪超過1300人次及公司企業參與的加入在在顯現溪流復育的強大生命力和看見未來的「溪望」。更多訊息請見團隊粉專https://reurl.cc/zKZjAQ

晶睿通訊
圖/ 晶睿通訊

【關於DATAYOO悠由數據】

DATAYOO 悠由數據是一家專注於智慧農業創新的AI數據分析公司,以「用AI賦能農業」為使命。公司擁有超過六項全球專利,能精準運算各類土地相關資訊,協助農企業與政府在作物精準操作、水分管理、作物辨識與產量預測等方面提升效率與決策品質。旗艦產品FarmiSpace是一款AI衛星作物監測系統,不需安裝感測器就可立即透過太空衛星和作物演算法,了解作物生長狀態,協助農企業快速精準判斷施作決策,提升產量和收益。更多資訊請見官網https://datayoo.com.tw/

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓