化身鋼鐵人打造賈維斯?——佐克伯的尷尬與AI的真實進展
化身鋼鐵人打造賈維斯?——佐克伯的尷尬與AI的真實進展
2016.12.26 | Facebook

近來佐克伯向記者公開演示了它2016的作品,一個類似Jarvis的人工智慧助手,從記者的描述來看,這人工智慧助手大部分時候還比較不錯,但在語音互動環節則不太理想,對此騰訊科技做瞭如下報導:

佐克伯還建立了響應語音指令的系統,並通過定制iOS應用控制。但這部分展示不太理想,他重複了四次指令才讓系統弄明白:天黑前不要開燈。佐克伯略顯尷尬地說:「喔,這應該是它最失敗的表現了!」。不過,Jarvis播放音樂的展示還算成功。佐克伯下令:「給我們放段音樂吧!」幾秒鐘後,大衛·庫塔(David Guetta)的《Would I Lie to You》 開始透過客廳音響響起來。他說了兩次「把音量調高」後,系統照做無誤。最後,他同樣說了兩次才讓系統停止播放。

這非常有意思,因為從新聞來看「天黑前不要開燈」和「把音量調高」的失誤顯然都不是命令理解(語義)上有問題,否則你說八百遍Jarvis該不好使還是不好使。如果不是語義的問題,那顯然就會和各大公司所宣稱的已經被解決的問題:語音識別有關。

標準環境解決≠真實效果好

關於語音識別的精度今年官方的報導一般是這樣的:

11月21日到23日,搜狗、百度和科大訊飛三家公司接連召開了三場發布會向外界展示了自己在語音識別和機器翻譯等方面的最新進展。值得注意的是,這三家公司幾乎在同一時段宣布了各自中文語音識別準確率達到了97%。

類似的報導也會發生在微軟等的身上,我們假設Facebook做的不是太差,水平也與此類似達到97%的準確率。 97%的具體含義是100個單詞上只有3個錯誤(刪除、被替換、被插入),那麼問題就來了,如果真實環境裡真的達到了這個精度,那麼佐克伯的演示絕對不應該是上面這個樣子。

那問題出在那裡?

關鍵問題並不復雜,佐克伯用手機當做家庭裡的終端,這樣距離稍微一遠,環境稍微嘈雜一點,那再好的手機也沒辦法幫Jarvis聽清楚你在說什麼。手機本身是設計給近場用的,手機上的語音識別基本也是給近場優化過的,怎麼也不能彌補遠場上帶來的不適應。

佐克伯對此非常坦誠,他在自己的專頁這麼寫道:

In the case of Jarvis, training an AI that you'll talk to at close range is also different from training a system you'll talk to from all the way across the room, like Echo. These systems are more specialized than it appears, and that implies we are further off from having general systems than it might seem.

(原文點。)

上面這段英文簡單來講就是說語音識別更多時候是專門場景下好用,想做一個萬能的版本仍然還很遙遠。語音識別只能做限定場景的最佳。

但事實上佐克伯仍然只認識到了部分問題,因為單純靠改善語音識別比如做一個匹配遠場的版本也還根本解決不了他遇到的問題(上面說的重複指示幾次系統才起作用問題)。我們可以注意到開始播放音樂之後,報導中提到的兩條命令都需要重複兩次,這很可能是音樂自身對語音識別形成了干擾,這種情形下單純的優化語音識別(不管遠場還是近場)是解決不了問題的。

佐克伯接下來的路

如果佐克伯不放棄這事,而是持續對此進行改善,那下面會發生什麼?他可能會掉到坑裡。他用了150小時做到上面那程度,但很可能再花1500小時,效果並沒有實質性改善。

佐克伯如果要優化效果,那麼基本方法有下面幾類:

一種可能是佐克伯覺得真實場景下的信號優化(聲學、硬體等)也沒什麼,找幾個人做做就完了,如果這麼想Facebook可能會自己組建個硬體、聲學團隊來做Echo Dot那樣的終端。但這麼做很可能短期就不會有下次演示了。因為讓語音識別匹配前端聲學信號是容易的,但反過來讓牽涉硬體和物理的聲學來適應語音識別則基本會做掛。而在網路公司裡通常後端偏演算法的勢力會大,所以很容易走到前面那條路上去(這事情中國至少做掛了兩批人了)。中國的大公司很容易走上這條路,但從分工習慣來看,國外公司更願意在技術棧上卡住特定位置,非自己核心的部分會更願意開放給其它人,所以佐克伯這麼幹的可能性不高,除非他覺得自己也得搞Amazon Echo那種產品了。

一種可能是佐克伯和深度學習科學家思路一致,認為所有東西都可以通過深度學習在雲端演算法層面來解決。這種思路下,就會透過深度學習來做降噪等信號層面的工作,用算法挑戰各種物理層面的問題。如果走上這條路,那估計短期也不會有下次演示了,因為他碰到的問題並非單純的降噪問題,迴聲抵消、Beamforming、降噪、聲源定向這些東西是關聯在一起的,指望深度學習短期突破這些問題更像科研上的一種設想而非工程上的一種實踐。 「設想」是說可以成為一種探索的思路,但結果完全沒譜,高度不確定,相當於把不確定性引入產品開發之中。

一種可能是佐克伯走下一步的時候想的很清楚,知道自己這類公司的能力邊界,因此把這部分開放出去,讓專業的人做專業的事。物理的事情歸物理,演算法的事情歸演算法,這樣的話就會滿世界找聲學和遠場語音識別供貨商,但這反倒是最快的一種方式。

不知道佐克伯具體會走那條路。

打破原子與比特的邊界

佐克伯這件事情事實上也提供了一個跳出來看AI的機會。

下圖是Jarvish的系統架構圖:

一般來講,從產品體驗上可以看出技術水平,從架構圖則可以看出來認知上的差異。

根據上圖,顯然的在佐克伯這裡Jarvish被理解成了一個命令控制型的系統,但感知這環節被忽略了,儘管佐克伯自己在文章裡也提到感知上下文是非常關鍵的一個環節(Understanding context is important for any AI.)

這種理解在網路企業那裡很可能非常有代表性,但問題就在於感知恰恰是打造一個初級的Jarvis這樣的系統時最難的環節。因為感知總是要打穿原子和比特的邊界。 Language Processing、Speech Recognition、Face Recognition總是立刻可用的,只受限於演算法的發展程度和數據,但感知部分不是這樣,不單要算法行,器件、生產都要行才能有好的結果。比如說麥克風陣列,你算法再好但MEMS麥克風不給力,那你一樣抓瞎。如果要說的短板的話,在深度學習突破後,感知這一環節才是真的不足。

這就涉及到這次AI突破的一個深層次問題:這次的AI起於深度學習的突破,但真要想創造價值並不能停步在深度學習本身。關鍵原因就在於其AI創造價值的鏈條比較長,必須打破軟硬的邊界,補全整個鏈條,價值才會體現出來。幾乎我們所有能想到的大機會都是這樣,語音互動(需要打穿聲學和識別邊界),自動駕駛(打穿計算機視覺、雷達、機械控制的邊界)等。這部分難度通常是被忽略了,似乎是有幾個深度學習專家問題就可以搞定一切問題。後者不是不行,但要限定在特定類別的事情上,比如圖普科技做的鑑黃等。正是同時做好軟硬這部分在拉長投資-回報的周期。投資和創業如果對此沒有自己的判斷,那準備的耐心可能就不夠。

小結

近來和AI各方面的人(創業者、投資人、科學家、媒體)接觸下來,發現大家基本都在思考這樣兩個問題:

第一,本次AI浪潮會不會和前兩次一樣很快冷下來?

第二,落地點到底在那裡,究竟還要多久?

對於第一個問題到現在為止還沒碰到任何一個人認為這次AI浪潮會冷到前兩次那樣。對於第二個問題,大的落地點上大家基本也已經達成了共識(語音互動、AR、自動駕駛等),爭議最大的就是啟動期究竟還要持續多久這一點。從兩個維度來判斷,這個時間更可能是在3年左右,一是產品經過兩個週期的優化會更加成熟;一個是計算能力、基礎設施到那個時候也會變的足夠強大和便利(過去3年Training速度提高了60倍,比摩爾定律還快。Intel則正在推出集成度更高的伺服器)。

本文授權轉載自:36 氪

往下滑看下一篇文章
LINE Biz-Solutions Awards 2025揭獎,以數據驅動AI行銷創作樹立產業新典範
LINE Biz-Solutions Awards 2025揭獎,以數據驅動AI行銷創作樹立產業新典範

因應消費者時間與行為日趨碎片化,單點廣告曝光或活動互動難以驅動長期影響力,必須從跨產品、跨通路甚至是跨服務的整合式生態圈服務著手,才能在日趨分散的消費者旅程中保持存在感、提升互動率,而這也是越來越多品牌會以 LINE 官方帳號為基礎,透過 LINE Biz-Solutions 為工具,透過整合數據洞察、創意內容、顧客關係管理與線上線下通路,打造一致且持續的品牌互動,讓品牌能在不同場景中累積信任感,與客戶建立更具深度與黏性的長期關係,形塑與持續累積品牌資產。

LINE Biz-Solutions Awards邁入第三屆,數據驅動的創新行銷活動蔚為風潮

LINE 做為全台滲透率最高的即時通訊與社群平台,不僅提供消費者多元服務,更透過 LINE Biz-Solutions 協助品牌、代理與行銷技術服務供應商所需工具與服務,以生態圈的概念優化顧客關係。為表彰具顧客價值與商業成果的創新案例,LINE 自 2023 年起與數位時代共同舉辦 LINE Biz-Solutions Awards ,為品牌得主與技術夥伴開啟專屬資源與合作機會,打造行銷實力之外的成長動能,以及對接更大的生態圈與未來商機。

「台灣的 LINE 官方帳號已超過 300 萬個,每年都有許多企業透過 LINE 進行數位行銷與顧客互動,期望能透過LINE Biz-Solutions Awards給予肯定,讓大家可以持續在 LINE 上面有更多多元的創作,激發不一樣的火花;同時,提供得獎者更多資源與回饋,形成良性循環。」LINE 台灣企業解決方案事業群總經理王俞蓉如是說道。

Line Biz-Solutions
LINE 台灣企業解決方案事業群總經理王俞蓉
圖/ 數位時代

LINE Biz-Solutions Awards於今(2025)年邁入第三屆,不僅評審陣容持續擴大,參賽作品亦較2024年增長44%,進一步細六大獎項的參獎作品可發現:中小企業與政府單位的參賽作品件數創新高,其次,最佳資料整合運用獎的參賽作品數量跟成長率皆居冠,顯示台灣品牌與行銷團隊將數據整合視為創新行銷變革與顧客互動的基礎,為AI驅動的自動化個人精準行銷做最佳準備。

這樣的趨勢也呼應麥肯錫在《Unlocking the next frontier of personalized marketing》報告中的觀點–深度數據整合與分析,是發揮AI驅動個人化行銷成效與提升投資報酬率的關鍵指標。決賽評審主席–台灣奧美集團顧客體驗董事總經理郭育滋表示:「今年入圍決選的 30 件作品中,許多團隊都透過兼具深度與廣度的數據整合機制,創造出超乎預期的成果:更好優化顧客體驗與營運表現。」

Line Biz-Solutions
台灣奧美集團顧客體驗董事總經理郭育滋
圖/ 數位時代

以LINE加速創新變革,16組獲獎產品演繹數位行銷新典範

LINE Biz-Solutions Awards 2025的參賽作品風格多元、創意豐富,評審在一次次被驚艷的同時,也面臨艱難抉擇,許多獎項的入圍作品分數相差無幾,使得今年的角逐比往年更加激烈。
其中,抱走最佳資料整合應用獎金獎的是「恆隆行《零售65》One hengstyle ‧ 創新整合,引領美好生活」,藉由統一的 LINE 官方帳號,成功整合旗下多個品牌、涵蓋 70 個服務帳號的售前、售後與內容數據,有效突破跨部門數據藩籬,為消費者提供更一致且卓越的服務。獲得最佳資料整合應用獎銀獎殊榮的是「信義房屋 LINE 找屋平台」,透過 LINE UID 與內部數據資料的整合,打造低摩擦及具個人化的有感使用體驗。

榮獲最佳OMO行銷獎金獎的是「DECATHLON 想動就動,結伴玩到底」,以 LINE 的多元功能讓消費者可以在冬天進行實體運動,進而改善淡季業績挑戰;取得最佳OMO行銷獎銀獎的作品是「WBCQ LINE數位應援神隊友」,透過 LINE 的多元工具與服務,讓所有場外球迷也可以集結串聯與時時應援。

「黑松時光地圖」則拿下最佳創意內容運用獎金獎,透過插畫呈現百年品牌的經典意象,並以 LINE 創造跨世代消費者的共感;至於銀獎則是由「The North Face北面山地節」獲得,該專案透過LINE鼓勵消費者闖關與集滿徽章,成功鼓勵更多消費者走向山林並保存難忘回憶。

最佳創新科技運用獎金獎作品是「永慶AI特助 - AI 智慧互動,有問必答」,透過將AI技術融入 LINE 官方帳號的方式,不僅滿足消費者找屋旅程中的所有需求,更讓消費者用自然語「發問」就能獲得房屋資訊。獲得最佳創新科技運用獎銀獎的是「Cancell 醫病遠距照護零距離」,透過 LINE Biz-Solutions 串聯 C 端病患跟 B 端醫護人員,讓遠距醫療照護沒有距離。

一舉奪得最佳在地行銷獎金獎的是「山上寄來的果物巡禮邀請函」,以LINE串聯果農與消費者,以精準行銷強化傳統果農的銷售效率。獲得最佳在地行銷獎銀獎殊榮的作品是「【彰化旅行+】布丁地圖」,透過 LINE 的互動、遊戲屬性、吸引消費者先到線上探索、再到線下商店打卡集章完成真實體驗,成功推廣彰化。

最佳 ESG 貢獻獎金獎則由「揚生旺來 LINE〈21天自癒幸福指南〉」獲得,該專案透過 LINE 平台降低高齡族群的進入門檻,讓其願意使用陪伴內容服務,持續驗證數位工具確實可提升高齡人口身心靈健康。最佳 ESG 貢獻獎銀獎作品則是由「山海圳國家綠道-AI山林嚮導」獲得,經典展示以AI 與數位工具深入探索當地、有利實現數位永續旅遊體驗。

4000px_20251125_LINE_0379.jpg
圖/ LINE Biz-Solutions

至於最佳應用突破獎金獎、最佳產業應用賞金獎則是由 LINE 提名推薦獲獎者。其中,最佳應用突破獎金獎是由中國信託商業銀行榮獲,中國信託 LINE 官方帳號是金融產業目標好友數最多且留存率最高的銀行帳號,不僅以聯名貼圖活動提升好友數、以中信卡50周年整合行銷活動擴大與深化品牌印象,更透過 LINE Biz-Solutions 為新的品牌理念推出『挺你所想 擊出1+1』一系列完整線上串線下的互動體驗。

最佳產業應用賞金獎的得獎者有國泰世華銀行、和德昌股份有限公司(麥當勞)與台灣萊雅。其中,國泰世華銀行不僅積極擴展 LINE 官方帳號的好友數、透過 LINE 成效型廣告(LINE LAP)全方位宣傳 CUBE App 與防詐識別機制、藉由直播與內容策展持續深化內容互動、推出綁定服務提供880萬 LINE 官方帳號好友個人化金融服務通知,更透過 LINE 官方帳號發送線下演唱會的限定票根,成功觸及更多消費者、深得歌迷喜愛。

麥當勞則是持續深化跟 LINE 官方帳號好友的互動,例如搭配端午立蛋、香芋派鐵粉知識王、搖搖薯條薯守到底等節慶話題推廣商品,以及透過影音、直播、早安圖等多元內容提升 LINE 官方帳號的豐富度與使用體驗;此外,亦透過Desktop半月方案與Desktop社群廣告與運動直播等多元廣告合作模式提升觸及率、樹立產業標竿。

台灣萊雅則是以LINE為核心,串接觸及、互動、導購等環節,發揮品牌生態圈最大效益。例如,透過LINE 成效型廣告(LAP)平台將情人節、母親節、618等節慶檔期等資訊精準推送給關鍵客群,藉此擴大觸及率、提升曝光與互動成效。以及藉由LINE LIVE 直播,讓代言人與粉絲進行即時互動、舉辦專家講座提升民眾衛教觀念,成功拉升品牌LINE官方帳號的點擊率與好友活躍度。

AI驅動持續創新,引領數位行銷新風潮

回顧本屆得獎作品,可以清楚看到,品牌主與代理商不僅從多個面向探詢LINE Biz-Solutions的無限應用可能,也積極透過更深且廣的數據整合優化顧客消費旅程,以及優化AI驅動個人精準行銷效益。決賽評審團成員之一的數位時代事業部總經理兼總編輯王志仁表示:「本屆作品的AI技術應用比例增加,相信將在之後成為數位行銷新常態,期待可以有更多AI Agent應用,創造更多元的創意、資料整合與科技應用。」

Line Biz-Solutions
數位時代事業部總經理兼總編輯王志仁
圖/ 數位時代

展望未來,LINE 除加速優化 LINE Biz-Solutions 的各項服務,也會透過「LINE Biz-Solutions Awards」持續表揚具代表性的行銷創意,期待 2026 年度活動再次激發產業創新能量,帶動示範效應,協助企業強化行銷戰力,為台灣數位行銷注入更多動能。

「LINE Biz-Solutions Awards 2025」得獎名單

2025 LINE Biz-Solutions Awards
https://line-biz-solutions-awards.landpress.line.me/winner2025/

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓