人工智慧到底在幹嘛?

2017.01.12 by
蕭瑟寡人
蕭瑟寡人 查看更多文章

費德智庫共同創辦人暨專欄作家。沒事看書充飢、有閒寫文聊聊時事。現專注於教育科技、社會企業、科技創業與創業輔導。

人工智慧到底在幹嘛?
Ex Machina
當人工智慧從技術名詞成了行銷名詞,意義難免生變,在選擇如何投資和參與人工智慧產業之前,不如先來深入了解人工智慧產業的各種虛實面向,以及在其越炒越熱之際,謹慎預防未來可能產生的產業泡沫化。

人工智慧產業,隨著近年科技業的炒作而成了媒體的新寵兒。然而,當技術名詞成了行銷名詞,詞意上難免生變。

就如同「雲端計算」(Cloud Computing)成為噱頭詞時,雲端從原本平台(Platform)和架構(Infrastructure)資源的共用與分租概念,變成了包山包海、只要是需要上網的應用程式都被冠上了「雲端」二字。就連單純的伺服器平台商、電子商務平台、內容平台等早在「Web 1.0」年代就司空見慣的產品與商業模式,也新瓶裝老酒、被冠上「雲端」二字再度行銷。

如今,人工智慧產業也有同樣的情況。因此在選擇如何投資和參與人工智慧產業之前,容許我們先抽絲剝繭,深入了解人工智慧產業的各種虛實面向。

人工智慧簡史

人工智慧最早可以追溯到百年、甚至千年以前的知識學(哲學的一門)。古今中外各哲學家對於人類與動物的智慧都有高度的興趣,如笛卡兒(Descartes)就相信人類與動物最大的差別在於人類的智慧是極具創造力和認知能力的,而動物智慧則是單純的「自動化機器」(Automaton),沒有情感、沒有理性推理能力、沒有創意,也無法跟人做智慧性的溝通。(當然,這些早期的理論早已被近代科學推翻)

到了十八世紀,第一波工業革命接近尾聲,以蒸汽機等外燃機帶動的生產線工業使得人們開始感受到機器取代人力的憂慮。然而,當時的工業化機械尚未有穩健的「人工智慧」理論基礎。

現代的人工智慧理論應該要從二十世紀初期的計算學開始,代表人物包含哥德爾(Kurt Gödel)與圖靈(Alan Turing)。但一點值得注意的就是當時計算學家所設計出的「智慧」理論,實際上是用於量化系統化工作。以圖靈設計的圖靈機器(Turing Machine,自動化機器的一種)為例,其理論靈感來自於工業生產線,並且以在捆捆紙帶上打洞來進行自動化計算工作。對於二十世紀初的計算學家而言,「人工智慧」只是一種能夠將計算工作自動化的理論,並沒有跟人類的各種智慧面向作深度的理論連結。同期,心理學家透過行為心理學(Behaviorism)來探討人類的智慧,而哲學家(尤其是知識學家)則透過科學驗證、實證論、唯實論等探討人類智慧,可惜當時(1960年代以前)這些理論並沒有與計算學。

基本上在1960年代以前,業界討論的人工智慧只是今日的資訊科學(Computer Science)。

而在1960年代,學術界發生了很重要的變革,那就是認知科學革命(Cognitive Revolution)。簡單而言,認知科學革命認為人與動物的行為背後有更深層的感官、知識、專注力等認知層面,因此不能純粹從行為資料上去形容智慧。此變革,使得資訊科學、心理學、哲學、統計學等學術領域開始合併,產生了現代人工智慧的基礎。

1970年代開始,一些學者與業界人士開始利用認知心理學的知識模型與邏輯學來設計所謂的專家系統(Expert Systems),這類系統講究資料之間與概念之間的關係,讓機器(電腦)可以進行人類一般的深層語義推理。打個比方,人類知道大象有四隻腳,而若一隻大象跛了腳,那這隻大象必定行動不便。在九零年代以前,人工智慧理論多注重於設計這類擁有深度語義知識的系統。

在學術界,若提到「人工智慧」(Artificial Intelligence),大家聯想到的就是1970年代主流的「傳統人工智慧」。

到了1990年代,許多人工智慧學者和業界人士發現傳統人工智慧的系統太過於複雜且古板(無法容許誤差),無法用來設計實用的大型商用系統。因此,往後,越來越多學者與業界人士開始投入利用統計學模型來模擬人類決策的機器學習(Machine Learning)。

往後20多年,由於電腦計算能力大增、電腦硬體價格低廉,彈性且能容許誤差的機器學習方法幾乎全盤取代傳統人工智慧,成為今天的技術主流。

人工智慧今天與未來面向

傳統人工智慧方法講究探討人類的知識、推理以及感官結構, 目的在於創造人類一般的「通用人工智慧」(Artificial General Intelligence) ,可以透過知識彙整和推理學習全新的知識、全新的語言,甚至全新的推理方式。

當人工智慧產業為了實用性考量而改以機器學習為理論基礎時,我們整體產業已決定用精準度和實用性去取代人工智慧的科學性。

今日人稱「人工智慧」的機器學習,跟傳統人工智慧方法有幾種根本性差異:首先,機器學習方法需要大量的資料;第二,這些資料的採集、篩選以及處理,都仰賴良好的變數選擇(Variable Selection);第三,機器學習方法的輸入以及輸出結果之間的關係是建立於統計關係,而非邏輯與語義關係;第四,機器學習方法的結果的意義來自於設計者賦予的意義,而非模型結構本身。

打個比方,現在業界常常炒作的「深度學習」(Deep Learning),就是很典型的機器學習方法。簡單而言,深度學習的理論基礎很單純,基本上就是「人工神經網路」,用許多可以處理輸入的資訊處理單位(學術上稱神經元Perceptron)來組成一網路,然後再用多層網路來做出理想的統計分布。故此,深度學習需要的資料量可能是目前所有機器學習方法最大的;第二,在進行深度學習之間,設計者必須先定義和選擇合適的變數來做學習;第三,神經元、網路的輸出結果的標準在於統計分布符合設計者的期許,並沒有天生的邏輯或與語言上的意義;第四,深度學習的方法本身並非專注於教育、自然語言、機器人、工業4.0等領域,其實用上的意義是由設計者定義的。

事實而言,最近十年來人工智慧產業的突破都要歸功於機器學習。 但是,許多關於人工智慧可能將發展成擁有自由意識的終結者之輿論,基本上都不會成真。因為不單單是現今機器學習方法與人類智慧的純理論研究漸行漸遠,關於自由意識、情感、自我等觀念,仍停留在哲學與心理學的純理論階段,目前不但學術界與業界沒有工程化的趨向,說穿了也沒有這方面的興趣。

突飛猛進的人工智慧產業別

說了這麼多,讓我們來討論一下那些人工智慧面向是真的突飛猛進,而且有長期的技術資本。

自然語言處理

長久以來,人類的語言處理對於電腦來說是一大難題。資訊工業早期仍使用以標準文法(Regular grammar)、上下文無關文法(Context-free grammar)等計算機理論來處理自然語言,而事實顯示,人類的語言比處理電腦字元複雜許多。

經過數十年的研究演進,自然語言相關技術可粗略分為幾大類:詞法學(Morphology)探討單字的詞性與其他變化、句法分析(Syntactic Parsing)探討文法結構、語義學(Semantics)探討句中的各類隱性意涵,以及篇章分析(Discourse Analysis)探討整篇文章的大義以及整體意涵。若是自動化對話系統,還有所謂的對話管理(Dialogue Management)。

透過各類機器學習方法,自然語言的各類領域都有長足的進步。最明顯的例子應該就是現代主要搜尋引擎(Google、Bing)能夠相當精準地從問句中判斷使用者所需的資訊,從維基百科上的簡介、到世界銀行上的統計資料、到計算方程式,都可以在不點選任何搜尋結果的情況下取得。

目前自然語言技術仍以詞法學與句法分析為基礎,並涉及小部分的語義學。在未來相信自然語言處理在語義、篇章分析以及情緒分析等領域會有更明顯的進步。

電腦視覺

電腦視覺簡單而言就是從任何影像資料中找到有意義的抽象知識。近幾年拜雲端計算帶來的巨大運算能力提升,使得越來越多電腦視覺應用得以利用深度學習去從做更精準的多層次辨識。所謂多層次辨識意思就是從像素中先去找小的特徵(Feature),然後再從小的特徵集合中去尋找更大的特徵,用多層次的特徵辨識去得到更精準的輸出結果。打個比方,早期的機器學習方法可能會將人的一張臉歸類為一特徵進行辨識,但隨著今天的資料量和運算能力提升,利用多層次辨識,我們可以透過先從像素中尋找眼睛、鼻子、嘴巴、毛髮等特徵,再從這些特徵組合去辨識圖像中是否有人臉、狗或是其他動物。

這部分的技術在未來幾年也可望會有長足的進步。

工業最佳化

各類工業最佳化是自古以來就不斷精進的技藝,但過去各類最佳化因受限於資料採集,因此在從原物料、製造、物流、人事管理、零售等各類變數去進行最佳化時,無法快速因應情況變化進行調整,更難以進行預測去防止問題發生。

如今拜工業物聯網所賜,小至單節點之溫度、電壓、濕氣等偵測器,大至單廠房製造量、生產鏈之日產量的掃描驗收,都可以快速取得並進行處理彙整。過去要掌握如此多變數,並彙整每秒、每分、每時、每日、每月的資料所需要的人力太大,成本上難以達成。

今天由於資料採集與彙整成本低廉,工業用人工智慧除了過去的線性最佳化模型以外,更可以利用機器學習進行時間性的變數預測,讓許多工業可以在各類大小變數變化時進行預測性的生產鏈調整(比如說天然氣能源公司可以透過天氣預測和天然氣產量來預測未來一個禮拜的精煉、物流和儲存計畫)。

過去時間序列(Time Series)相關機器學習方法所需之資料量與計算時間過大,今天這些障礙都以慢慢解決。因此,工業用相關人工智慧可望在未來幾年內如虎添翼。

人工智慧產業應預防的泡沫

講了一些目前快速發展的人工智慧領域後,也不得不提一些掛羊頭賣狗肉的人工智慧應用泡沫。先前稍微討論過人工智慧的發展簡史,至此我們也能了解當「人工智慧」成了噱頭詞以後,有多少簡單、過時的電子化產品,被假冒成人工智慧產品來販賣。

而第一已過熱的就是許多以「能感受人類情感」的伴隨機器人。許多此類產品包括看護機器人PepperNao機器人以及互動玩具Cozmo,都利用「了解情感」作為行銷台詞,但事實上,這些機器人所謂的「情感」只不過是先設定好的一些程式反應。反觀人類與動物的情感,是建立於某種自我與客觀的互動上。真正的情感不但能夠喚起記憶、改變知識存取的方式,甚至能夠改變一人對於自我和客觀事物的認知。不管從哲學、科學還是工程的角度看來, 這些產品完全沒有「情感」的理論基礎,其制式化的互動模式連人工智慧都稱不上。

Humans

而第二有過熱傾向的就是現在被稱作「聊天機器人」(Chat bot)的潮流。當像x.ai這類的聊天機器人新創公司成功籌資後,有許多新創團隊也跟風一頭栽了進去,連Facebook、Slack等平台都開放聊天機器人整合。而事實上,絕大多數的聊天機器人完全沒有稱得上人工智慧的技術基礎。若從自然語言技術的對話管理系統來看,目前多數的聊天機器人(包括亞馬遜Alexa以及Google在內),其實只是很單純的關鍵字比對並執行對應程序,並沒有進行任何有深度的對話管理。像是有x.ai技術程度的聊天機器人的新創公司其實並不多,而目前太多濫竽充數的聊天機器人,對於真正致力於研發對話管理和自然語言技術的公司的形象造成很大的傷害。

最後一過熱的人工智慧產業別恐怕要屬智慧家電與智慧城市。當然,智慧家電與智慧城市本身自然有非常重要的人工智慧應用,比如說可以利用廣大的家用和公共設備的能耗、壽命資料來進行機器學習,用此幫助家庭和城市汰換舊設備並調效新設備組合。但是,智慧家電與智慧城市發展至今,已經有太多過氣的網路監視器、網路麥克風,甚至電子票券系統商都跳出來講自己在研發智慧家電和智慧城市應用。所謂智慧家電與智慧城市的原意,讓基本的硬體與網路連結喧賓奪主,未來創業家與投資人應適度調整角度,將資本與資源重新導入家用與公共建設相關的機器學習方法應用。

其實產品並不一定要有人工智慧才實用,但是當太多沒有人工智慧成分的產品假冒人工智慧籌資、曝光,最後可能造成原本應該投資人工智慧技術的資本和資源被導入過氣產業,最後導致產業泡沫化,讓往後的人工智慧公司籌資、雇員徒增煩擾。

此說法並非空穴來風,美國2008年開始的學習科技泡沫即是最大警示。2008年開始,美國經濟蕭條,因此許多創投隨著歐巴馬政府的補助政策開始投資教育科技產業。然而,往後七八年的時間,過多創業資金與資源流入了線上影音學習平台、免費課程管理工具以及字卡(Flashcard)題庫等許多新瓶裝老酒、沒有科學和技術基礎的新創團隊,造成大批投資人被套牢至今尚未解套。結果2014後,許多有實力整合線上與實體學習科技的優質新創公司,卻因為創投和私募基金大幅退出學習科技市場而碰上籌資困難。如今,美國教育科技新創投資已轉向管理工具、資料分析、溝通工具等項目,而投資人因為過去投資劣質標的之舊傷未痊癒,學習科技產業至今在美國仍一片萎靡。

同樣的戲碼,極有可能在各人工智慧產業別上演。因此在探討「人工智慧新創」的產品與技術之同時,不得不謹慎,一定要做好基本的學術和產業研究後再進入。

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長800至1000字,兩天內會回覆是否採用,文章會經編輯潤飾,如需改標會與您討論。

每日精選科技圈重要消息