2016年度挑戰完成！馬克·佐克伯公開100小時打造的AI管家「賈維斯」|數位時代 BusinessNext

2016年度挑戰完成！馬克·佐克伯公開100小時打造的AI管家「賈維斯」

馬克·佐克伯今年給自己的挑戰是，在家裡開發出一個人工智慧管家，如同《鋼鐵人》電影中的「賈維斯」。現在佐克柏的「賈維斯」已經能利用口語及文字訊息溝通，操控家中的燈光、空調、音樂和保全了。

Facebook創辦人馬克·佐克伯（Mark Zuckerberg）今日發表一篇網誌，公布2016年自我挑戰的成果。

我2016年的個人挑戰是，建造一套簡單的人工智慧管家--像《鋼鐵人》裡的「賈維斯」（Jarvis）。

100多小時打造「賈維斯」

佐克伯稱今年花了大約一百多個小時，利用閒暇時間，開發了「賈維斯」系統，現在已經建立好簡單的AI，可透過手機、電腦與「賈維斯」溝通，操控家中的電器、音樂及保全。「賈維斯」能用文字訊息或口語溝通聲控開關燈、依個人喜好播放音樂、自動辨識門口的訪客並發表通知、觀察女兒在家的動態，並在起床時自動播放中文課程等。

「賈維斯」智慧管家使用的人工智慧技術，包括自然語言處理、語音識別、物體及臉部辨識以及強化學習，以Python、PHP、Objective C語言編寫。

佐克伯於網誌中表示，原本預期透過這項挑戰，學習AI技術與工具，但過程中同時也更了解家庭自動化的概況，及親身接觸Facebook工程師使用的各種內部技術工具。文中他也分別就家庭系統連接、自然語言處理、視覺辨識、訊息機器人等方面，提出一些實作心得、目前限制與未來趨勢。

家庭物聯網目前的困難

佐克柏文章中提到，實作時由於不同設備系統都使用不同語言與協定，要先寫程式處理，才能著手建構AI。此外，目前多數電器也還沒有連網。要使「賈維斯」這樣的智慧管家能多方應用，需要更多設備連接，業界也需要開發通用的API與標準，使設備間能相互通訊。

自然語言的複雜性

佐克柏讓「賈維斯」理解自然口語有兩步驟，首先要讓AI能以文字訊息進行溝通；接著利用語音轉文字技術，就能直接用語音溝通。

不過，人類語言其實相當複雜。除了利用關鍵字理解指令，佐克柏很快發現，AI還需進一步學習同義詞才能理解（如「家人房」（family room）和「客廳」（living room）兩個詞，在佐克柏家是指同樣的空間）。

對任何AI來說，環境脈絡線索也很重要。同樣一句「開燈」或「打開我的辦公室的空調」，由佐克柏或由太太Priscilla Chan說出口，可能是指完全不同的空間。

自然語言在播放音樂方面也很複雜，因為系統要處理大量關鍵字，指令範圍也更大。佐克柏舉了個有趣的例子：同樣是「play X」（「播放X」）的指令，「play someone like you」、「play someone like Adele」、「play Adele」，看似微小的差異，意思卻完全不同，分別是播放Adele的「someone like you」這首歌、請系統建議與Adele類似的音樂、以及建立一個Adele的歌曲列表來播放。透過正反饋系統，AI能夠學習區別差異。

此外，佐克柏也提到，雖然語音識別系統近來已改進，但仍然不足以理解多人對話的語音。語音識別依賴聽與預測，所以結構化的語音仍比非結構化的對話更容易理解。

視覺與臉部辨識的應用

佐克柏在自家門口安裝數架攝影機，並建立簡單的伺服器，進行人臉偵測與辨識處理。識別身分後，會檢查列表，確認是不是預期的訪客，決定是否放行，並通知佐克柏。

電腦視覺也可以拿來判斷女兒何時醒來，就可以開始播放音樂或華語課程；也可以判斷人正在屋內何處，AI就能正確回應像「開燈」這樣缺乏環境線索的指令。AI系統擁有的線索資訊越多，整體就越聰明。從佐克柏的心得看來，視覺辨識對於提供語言表面的指令之外的環境線索相當有幫助。

文字訊息使用得比預期多

為了能從任何地方透過手機與「賈維斯」進行溝通，佐克柏利用自家的Messenger架構（messenger.com/platform），開發賈維斯對話機器人，發送文字或語音，就會立即轉發到伺服器處理、執行命令。

出乎佐克柏意料的是，相較於語音，使用文字訊息溝通的情況比預期多得多，主因是簡訊比較不會干擾旁人，「賈維斯」傳來的訊息也可以等想看時再看。

佐克柏提到，喜歡文字通訊大於語音通訊的偏好，符合在Messenger與WhatsApp觀察到的狀況，全世界的文字訊息比語音通訊量增長更快。未來AI產品不能僅專注於語音，還需要私人訊息介面。利用像Messenger的平台，也比從頭開發新的應用軟體更好。佐克柏的經驗認為，我們未來都會與像「賈維斯」這樣的機器人溝通。

「我們的內部工具跟基礎建設做得很棒！」

佐克伯看來相當自豪於Facebook軟體基礎工程和內部工具，並強調今年透過自己親身開發AI的經驗發現，Facebook程式碼資料庫組織極有條理、容易搜尋，無論是臉部識別、語音識別、對話機器人框架或iOS開發，以及各種開源資源工具，都使「賈維斯」的開發節省非常多時間，也逐一羅列Facebook所提供的各種資源。

佐克伯考慮過開放「賈維斯」的程式碼，只是目前系統緊密綁定到自己的家庭、電器和網路配置，若將來建立更抽象一層的家庭自動化功能，也許就會釋出。

重點在於「教會AI自己學習新東西」

雖然這項挑戰將進入尾聲，佐克伯表示將會繼續改進「賈維斯」。佐克伯也提到，他的長遠目標是摸索如何教導人工智慧自行學習新技能，而不是必須教它執行特定任務。若多花一年時間在這個挑戰上，他會更聚焦在學習「學習」是如何運作的。他提到：

某種程度上，人工智慧比我們想的更近、也更遠。AI越來越接近能做到比多數人預期的更強大的事：駕駛汽車、治療疾病、發現行星、理解媒體。這些都將對世界產生巨大影響，但我們仍在找尋真正的智慧是什麼。

自然語言、臉部識別、語音識別等，其實都是相同的模式辨識技術的變體，也就是向電腦展示許多例子，以使其能準確識別，不過這些都還是專門用來解決特定問題，而不是通用的人工智慧系統。我們仍不清楚「學習」是如何運作的，以及如何建立一個可以自行學習新技能的系統。

今天佐克伯也接受媒體FastCompany獨家採訪，並公布一小段「賈維斯」智慧管家的影片。

佐克伯也宣布將在幾週內，分享他下一年度的個人挑戰。

所以，「賈維斯」的聲音聽起來怎麼樣？

可能有人還記得，前一陣子佐克伯在Facebook上問大家：賈維斯的聲音該用誰的好呢？還因此「釣出」飾演東尼·史塔克（賈維斯的主人）小羅勃·道尼（Robert Downey Jr.）來留言！因此佐克伯今天還賣了一個關子，表示明天他將會釋出賈維斯的影片，到時候大家就會知道賈維斯的聲音會是誰的了。

2016/12/21更新：佐克伯釋出賈維斯的影片，我們也知道是哪兩個人幫賈維斯配音了 XD

資料來源：馬克·佐克伯的Facebook、FastCompany

有溫度的 AI 服務，成為企業競爭力的新關鍵

宏華國際資深技術顧問李宗遠指出，對企業、尤其是服務業而言，客服的價值早已不只是接聽電話或回覆訊息，而是建立顧客信任、優化服務體驗的重要平台。透過客服，企業不僅能維持對外溝通的一致性與完整性，也能延伸服務時間與服務範圍，進而即時掌握顧客需求，有效承接每一次商機。

然而，過去要打造全天候客服，企業往往需要投入大量人力與管理成本。如今，AI大幅降低了建置與維運成本，24 小時服務不再是大企業的專利。透過 AI 客服代理人，即使是資源有限的中小企業，也能在不額外增加人力的前提下，快速建立客服機制，提供更貼心、更有溫度的服務，而這也將成為未來服務業的重要競爭力。

以餐飲業為例，消費者有聚餐需求時，通常會透過網路訂位系統同時向多家餐廳預約，等到接近用餐日時，再做出最終選擇。此時，餐飲業者若能在網路訂位流程中整合 AI 客服代理人，主動提供完整且貼心的一條龍服務，例如：推薦適合餐點、提醒停車資訊、確認特殊飲食需求，甚至提前規劃包廂與慶生活動等，讓顧客到店前就有好的服務體驗，自然有機會打動顧客的心、成為最終選擇。

李宗遠認為，AI 的價值不只是提升效率，更在於協助企業打造更有溫度的服務，這不僅有助於降低臨時取消率、提升訂單轉換率與顧客黏著度，更能建立差異化競爭優勢，讓 AI 從工具真正成為企業夥伴。

AI 客服下一階段，比的不是技術，而是誰更懂服務場景

然而，AI 要打造有溫度的服務，關鍵不在於採用了哪些技術，而是 AI 能否真正理解不同產業的服務場景與顧客需求。為此，宏華將多年來服務不同產業、不同場景所累積的第一線經驗，轉化為開發 AI 客服代理人的重要基礎，讓 AI 不只是回答問題，更能理解企業的服務流程，以及客戶的情緒與潛在需求，提供更貼近人性的互動體驗。

李宗遠認為，宏華 AI 客服代理人可以為企業帶來三項價值。第一項是將原本仰賴人工處理的流程自動化。AI 客服代理人不僅能線上服務客戶，完成訂位、預約、報修等流程，還能自動執行後續作業，例如：生成維修派工單，並通知師傅前往服務。

第二項則是優化顧客體驗。AI 客服代理人以多模態 AI 作為核心，可以進行語音、文字與影像的互動，因此，顧客透過電話、LINE、社群平台、網站或實體門市等留下的互動記錄，都能整合至同一平台，避免在服務過程中產生斷點。

第三項是延長服務時間與擴大服務範圍，承接更多商機。AI 客服代理人支援國語、台語、英語 24 小時應答，無論顧客在任何時間、透過何種管道聯絡，甚至使用外語，都能獲得即時回覆。

十多年客服經驗，如何成為宏華 AI 的護城河？

當 AI 客服的技術能力逐漸成熟，真正難以複製的，不是模型，而是背後累積的服務經驗，而這正是宏華最大的競爭力。

宏華國際新事業處協理曾世忠指出，宏華國際深耕客服領域超過十年，累積全台數一數二的服務量能與顧客互動經驗。從客服、門市到到府服務，這些第一線服務經驗，不僅讓團隊更理解真實客服情境，也更熟悉不同產業的服務流程與需求，成為 AI 客服代理人得以持續優化的關鍵。

這些第一線經驗讓宏華非常清楚顧客互動過程中的各種變數，包括臨時修改需求、跳躍式提問、說話帶有情緒等。曾世忠表示，真實世界的客服互動很少按照既定腳本進行，許多AI在面對顧客突然改變想法或偏離原本的對話流程時，容易陷入重複問答或無法理解語意的困境，進而影響使用體驗。
也正因此，宏華訓練的不只是 AI 的智商（知識理解、順暢對話），更重視服務情商（情緖分析），讓 AI 能理解對話情境、顧客情緒與需求變化，可以「秒問秒答、邊聽邊想」，而非只是依照固定腳本機械式回應。

除了理解真實客服互動情境外，長期服務不同產業客戶的經驗，也讓宏華更了解各產業面臨的服務情境與需求差異，並將這些產業 Know-how 模組化，發展出餐飲、技術服務、專業服務等產品包，企業只要完成需求完成設定，便能快速導入，大幅降低建置時間與試錯成本。

「AI Agent 的價值不只是協助企業服務客戶，更將成為企業營運的重要基礎設施。」曾世忠認為，未來，AI Agent 除了協助企業回應外部客戶需求，也將進一步應用於員工服務、人資諮詢等內部場景，成為串聯企業內外部溝通的重要角色。而宏華國際也將持續投入相關技術發展，協助企業在 AI 時代建立更穩定、更具韌性的營運能力。