AI界「老前輩」Siri,現在卻看不到ChatGPT的車尾燈?蘋果究竟在堅持什麼?
AI界「老前輩」Siri,現在卻看不到ChatGPT的車尾燈?蘋果究竟在堅持什麼?

微軟投資OpenAI,推出新Bing,Google 推出Bard,Adobe 推出了FireFly,亞馬遜推出Amazon Titan,隨著ChatGPT 的走紅,矽谷大公司的AI 工具或者助手,瞬間都迸發了出來。

Github 的Copilot 功能
Github 的Copilot 功能
圖/ ifanr

只有地處加州一隅的蘋果,在外界看來,彷彿是一個沒有被AI 打擾的世界。

沉默

經歷AI 的瘋狂三月後,大小公司前赴後繼的切入AIGC 領域,他們都會標上Beta 測試版,以及需要經歷一個waitlist 的階段。他們最終可能會出錯,也可能會答非所問,甚至也可能引發一次輿論高峰,但矽谷和我們仍然樂此不疲的參與其中。

相對來說,蘋果對AIGC 始終保持沉默,高管、員工都沒有對外發表過蘋果對其真實看法。

蘋果一向很注重維護自己的形象和公司品牌,他們很少對外公佈不成熟的產品或者技術。因此,這也說明,對於新技術為何蘋果總是比別的公司廠商慢一拍。蘋果盡量會避免新技術運用到產品中時,出現水土不服的現象。

目前AIGC 行業的產品,大多還是圍繞著網頁對話框,殺手級應用目前還處於空白階段。

對於專注在產品上的蘋果不予置評,其實也說得通。

不過,根據the information 那裡獲得的消息來看,蘋果的工程師正在醞釀把LLM 大語言模型與Siri 結合,推出更聰明的Siri,並順理成章的運用到明年的iOS 當中。

就像2011 年那樣,蘋果首次公佈智慧助手Siri,並與iPhone 4s 一同上市,成為當年iPhone 的一個重大功能性升級。

高調

以現在的眼光來看,蘋果在晶片上加入了神經引擎,將SoC 晶片稱之為「仿生」,將各種人工智慧模型、算法運用到拍照、生物識別、書寫等方面。

這對於使用體驗的大幅優化和提升,往往很難讓人留意,蘋果對於AI 的運用相當低調。

但在2011 年,Siri 是作為蘋果最高調的人工智慧技術亮相。

Scott Forstall
Scott Forstall
圖/ ifanr

直到現在我依然記得, Scott Forstall 在介紹Siri 時表示,Siri 能夠理解自然語言,不需要用戶記住特定的格式和語法,也可以根據用戶的使用習慣進行訂製。

後續上線的宣傳片裡,Siri 也真正的成為了一個永遠正確響應回應,以及頗具智慧頗具人味兒的手機內置助手。只是,Siri 在2011 年後,其技術迭代彷彿被停滯。十幾年過去,它仍然還遵循著2011 年的「天真」回答。

當人們不斷被其他公司的更先進的語音助手刷新認知的時候,Siri 就顯得有些笨拙,和過於可愛了。
尤其是Siri 目前已經覆蓋到蘋果幾乎所有的設備,iPhone、iPad、Mac 甚至是AirPods,Siri 略顯老成的處理和回答方式,就更顯得它有些落伍。

甚至蘋果內部也對Siri 失望,蘋果開發XR 設備的團隊,就不太想在XR 設備上用Siri 控制設備和功能,理由就是它不夠聰明。為此,XR 設備的負責人Mike Rockwell 也曾考慮找個備用方案以替換掉Siri 的語音控制,不過最終並沒有成功。

傳聞中的蘋果XR 頭戴式設備,仍然會與蘋果其他設備類似,可以用Siri 進行簡單的控制,當然,如果你想的話,也可以跟它進行簡單的對話。

攀爬

發布Siri,被認為是智慧手機歷史上的一個轉折。在Siri 之後,幾乎所有的智慧手機廠商都會為其產品推出一個類似的智慧助手,以免落伍。

而對於蘋果,2010 年花費了2 億美元收購了Siri Inc.,並在一年後把Siri 整合到iPhone 裡。在此之後,蘋果也組建了一個Siri 智慧助手團隊,不過在2011 年發布至2018 年期間,Siri 團隊陷入了迷茫,內部管理和大方向也出現了一些爭論。

蘋果的解決方案是「請高人」,2018 年從Google 挖來了John Giannandrea,成為蘋果負責人工智慧和機器學習戰略的高級副總裁。此前他在Google 負責搜尋業務和人工智慧,幾乎可以算是Google 人工智慧領域的資深專家。有了John Giannandrea 的加入,蘋果想依靠他的經驗,逐步改善Siri 的現狀,幫助Siri 趕上競爭對手。

John Giannandrea 也為Siri 團隊帶來了類似Google 的工作氛圍,並面對蘋果高管需要Siri 立竿見影的變化時,他會用「爬山」這個過程來解釋如何解決AI 人工智慧領域面臨的難題。對於Siri,或者說蘋果的人工智慧策略,需要有一個長遠的目標,期間每次微小的優化、改動,都會隨著時間的推移逐步累積,馬虎不得。

換句話說,John Giannandrea 認為蘋果在人工智慧領域底子太薄,不能急於求成。

John Giannandrea
John Giannandrea。
圖/ ifanr

並且,他也說服了蘋果高層,暫時應該著重在團隊建設中,留下相關人才,並給他們更多的自由,去研究發展自己感興趣的方向。
最重要的是,John Giannandrea 顯著提升了人工智慧團隊的薪資水準,達到了行業水準。

三板斧下來,蘋果人工智慧團隊得到了增強,引入了許多前Google 人工智慧專家,並用1.5 億美元收購了機器學習初創公司Laserlike。

其三位創辦人Srinivasan Venkatachary、Steven Baker 和Anand Shukla,後期也成為Siri 團隊,蘋果LLM 領域和搜尋領域的專家。

引入Laserlike 的目的,其實就是為了提升Siri 的搜尋能力,而Venkatachary 也順理成章的成為蘋果搜尋團隊的負責人。
2019 年,蘋果就在Siri 中加入了通過網路資訊來回答用戶的提問。Siri 的功能性正在逐步補全和增強。

不過,這些改變更像是「曇花一現」。

蘋果人工智慧團隊內部有著相當多的項目,有可以將Siri 移植到iPhone 當中的BlackBird 項目,也有SiriX 這種慶祝Siri 十週年的項目。

但除了內部的競爭外,蘋果高層對於人工智慧大方向的決策過於緩慢,以及對於LLMs 這種新技術的運用過於保守。

waitlist
圖/ ifanr

2022 年秋季,Srinivasan Venkatachary、Steven Baker 和Anand Shukla 也離開了蘋果,去了Google。
有意思的是,Google CEO Sundar Pichai 親自招募了這個三人團隊,同時Tim Cook 也做了挽留。

但他們認為Google 是一個適合研究LLM 的公司,並且也會被快速的運用到產品當中。

如今他們正在Google 研究如何降低大語言模型的培訓訓練成本以及如何提升準確性。

不僅是Laserlike 團隊,Giannandrea 親自招募的其他專家和團隊也大都離開了蘋果,理由也是因蘋果好像不太重視人工智慧方向的研究。
在John Giannandrea 到來後,在攀爬人工智慧領域這座山峰的過程裡,或許是與公司戰略大方向的不同,讓蘋果人工智慧陷入了掙扎之中。

掙扎

隱私保護,是蘋果近來所遵循的一個公司級戰略。
在此面前,一切都要讓步,絕不妥協。

John Giannandrea 加入蘋果,他的目標很明確,就是通過優化蘋果對用戶數據的使用,訓練算法讓Siri 變得更聰明。

因為,在Google、亞馬遜這些公司內,通過收集分析用戶數據,改善產品算法模型,是一件很常規的事情。
也由於有這個過程,會讓算法更智慧,AI 也變得更聰明。

蘋果此前也會不記ID 的收集Siri 與用戶的對話數據,但做得併不專業,也沒有利用這些數據對Siri 進行改進。
隨著John Giannandrea 的到來,蘋果找了許多外包公司來收集相關數據,並最終通過一個流程對Siri 進行優化。

但2019 年,《衛報》曝光蘋果外包團隊在未經同意的情況下收聽用戶與Siri 的對話,而引起了軒然大波,尤其是一向以注重隱私的蘋果。

為此,蘋果最終用全職員工取代了外包商,並且修改了內部流程和政策,普通員工幾乎很難聽到Siri 的對話錄音。
如此的規定也讓人工智慧團隊更難實時優化和按時迭代,也算是造成目前Siri 顯得很古典的原因之一。

「他們所做的事情的缺點將變得越來越明顯,」華盛頓大學計算機科學教授、機器學習書籍《大師算法(The Master Algorithm)》的作者Pedro Domingos 就認為「他們將不得不挖掘更多的私人數據,以便與其他人更具競爭力。」

TIM COOK
圖/ 蘋果

並且對於Siri 的一些經常衝上熱蒐奇怪的回答,也會引起Tim Cook 的注意。他更會經常越過流程,直接要求Siri 團隊修改「尷尬」的回答。因為隱私保護而減少數據收集,以及避免尷尬回答,進行人工修正,蘋果十分注重自己的公司形象。因此,即便現在蘋果有龐大的資金和資源,許多前蘋果人工智慧團隊成員也認為蘋果很難會很快的去部署基於LLM 的Siri。

另外,蘋果也在Siri 內設定了許多規則,像是詢問iPhone 售價,會優先導流到蘋果官網,而非是直接給出答案。蘋果並非是一個技術優先公司,他們一切的服務、技術都是為產品服務,也就是能賣出去更多的iPhone、iPad、Mac。

因此,在很長一段時間內,設計團隊有著相當大的話語權,他們認為產品就應該做到100% 完美。這種追求也延續到了Siri 人工智慧團隊,但作為一個算法來說,不可能100% 精確,出錯在所難免,出錯才能更好的去優化相關模型。

他們之間追求的不同,也讓人工智慧團隊的工作變得很有壓力。在Giannandrea 的周旋下,軟件設計團隊不得不為Siri 添加了一個按鈕,方便用戶回饋回答是否準確。

無論是為了堅持隱私,還是工作流程問題,亦或是為了做出100% 完美產品,Siri 的人工智慧團隊正在經歷著一系列的掙扎,就像被捆住了雙手與Google、亞馬遜等大公司在人工智慧領域競爭。

未知

這個「未知」,其實可以指代許多。

蘋果人工智慧團隊對於Siri 推出了許多改進方案,像是Siri X、BlackBird、Pegasus 等等項目。

apple ai
圖/ ifanr

雖然項目的一些成員離開,但這些項目最終都接近完成,隨時可以替換或者優化到現在的Siri 當中。
不過,就如同John Giannandrea 所提倡的,一個人工智慧模型,其實是一個相當複雜的工程,牽一發而動全身。盲目的修改和替換,可能會引起不可預知的問題。

另外,與亞馬遜的Alexa 或谷歌的Assistant 等其他語音助手相比,Siri 的回答在很大程度上依賴於人類參與。也就說,Siri 的數據庫有許多人為的限制和干預,經過十幾年的修改調整,讓這個數據庫變得複雜冗長。

而且,這也與目前LLM 大語言模型的數據庫工作方式有所不同,它並不能簡單的加一個API 接口就能夠順利的運行起ChatGPT 和擁有類似的功能。

蘋果現在所要決定的就是,想要一個Smart Siri,到底是推倒重來,還是逐層優化。

另外,誰都不否認,蘋果公司的盈利、現金流以及龐大的資源調動能力。並且,也有著晶片、終端等等硬件資源和知識儲備。

當蘋果下定決心全身心投入AIGC 領域,它可以訓練複雜的大語言模型,做出自己的生成式AI。但蘋果還要決定是否需要「重複造輪子」,還是把眼光、資源投入到如何將AIGC 運用到終端,嵌入到生態當中。畢竟那些支持ChatGPT 等複雜服務的LLM 目前仍在雲端運行,運用到終端生態裡,還尚屬空白。

在人事調動上,蘋果目前更注重於視覺識別的專家,相對來說,也把重心放在了適合XR 虛擬現實領域。對於蘋果來說,AIGC 行業的技術爆炸,還不到一年,如何運用到蘋果產品當中,也還在一個很初步的嘗試當中。

siri
圖/ ifanr

而蘋果已經準備多年,打算取代iPhone 成為下一個大趨勢的XR 虛擬現實設備,或許才是蘋果當下最該關心,以及著力去發展的產品。

至於把Siri 變成Smart Siri,還是變成Siri Copilot,不妨讓John Giannandrea 所帶領的AI 團隊再爬一會兒山吧。

延伸閱讀:ChatGPT一出世,Siri、Alexa沒戲唱了?微軟執行長:語音助理笨得像石頭

本文授權轉載自:愛范兒 ifanr

責任編輯:傅珮晴、錢玉紘

關鍵字: #Apple蘋果 #Siri
往下滑看下一篇文章
影音體驗成行動網路新戰場!Opensignal 揭台灣大哥大奪「雙料冠軍」,連網穩定撐起高負載影音與 AI 協作
影音體驗成行動網路新戰場!Opensignal 揭台灣大哥大奪「雙料冠軍」,連網穩定撐起高負載影音與 AI 協作

現代人手機不離手,通勤時滑短影音、午休追串流影劇、下午開視訊會議,網路影音應用成為工作與生活的普遍情境。然而,一旦畫面卡頓、畫質不穩,或聲畫不同步,使用體驗立刻打折,甚至影響工作效率與專業判斷。

也因此,網路品質不再只是「快不快」的問題,更關乎能否在高使用量的日常情境下,維持穩定、連續的表現;對此,第三方評測也採用更貼近使用者情境的方式衡量網路體感。而 Opensignal 最新報告指出,台灣大哥大在影音體驗相關項目是業界唯一同時拿下「影音體驗」與「5G 影音體驗」雙項獎項的電信商,其中,關鍵的差異是什麼?

為何「影音體驗」是網路品質的關鍵指標?

愈來愈多消費者入手旗艦機,追求的不只是硬體規格,還有流暢的 AI 應用與多工協作。然而,無論是視訊即時翻譯或雲端會議,這些高階功能都有一個共同前提:網路必須穩定。一旦網路品質不佳導致畫質下降或音畫不同步,旗艦級的 AI 功能將形同虛設。

這也意味著,檢驗網路價值的標準已經改變。如今,不能只看單點測速的瞬間峰值,更重要的是高負載情境下的耐力表現。因此,比起單點測速,影音體驗會是更完整的測試標準,直接挑戰了網路在室內深處、移動途中或人潮聚集時的網路實力;而唯有在長時間串流下依然不卡頓、不降畫質,才稱得上是高品質的連線。

換言之,隱身在硬體背後的電信商,才是發揮旗艦機性能的關鍵;唯有透過最佳網路品質,才能讓手中的旗艦機既是規格領先、也是體驗領先。

唯一影音體驗雙料冠軍,Opensignal 權威認證的有感體驗

雖然相較於測速數據,影音體驗更貼近日常使用,但也更難量化。對此,國際權威認證 Opensignal 的「影音體驗分數」,依循 ITU 國際標準,透過真實用戶裝置在行動網路上進行影音串流的實測數據,觀察不同電信網路在實際使用情境下的表現。

簡單來說,評測聚焦三項核心指標:影片載入時間、播放期間的卡頓率,以及畫質(解析度)是否能穩定維持。使用者從開始播放到持續觀看的整體品質,分數以 0–100 呈現,分數愈高,代表在三項指標的表現愈佳。相較於單點測速,這類評測更能呈現長時間、高使用量下的網路品質。

人流情境不降速.jpg
圖/ 數位時代

而在今年最新公布的 Opensignal 評測中,台灣大哥大獲得「影音體驗」獎項唯一雙料冠軍。其中,「整體影音體驗」為全台獨得第一名,「5G 影音體驗」則與遠傳並列第一。

之所以能在影音體驗拔得頭籌,關鍵在於台灣大哥大目前是全台唯一整合 3.5GHz 頻段 60MHz 與 40MHz、形成 100MHz 總頻寬的電信業者,亦是現階段全台最大 5G 黃金頻寬配置。頻寬愈寬,代表單位時間內可傳輸的資料量愈大;在大量使用者同時進行影音串流、視訊互動的狀態下,更能維持穩定傳輸、減少壅塞發生機率。

台灣大獲權威認證,NRCA技術撐起穩定基礎

除了頻寬帶來的流量優勢,台灣大哥大也採用「NRCA 高低頻整合技術」,也就是透過高低頻協作,讓 3.5GHz 負責高速傳輸、700MHz 補強覆蓋與室內連線,改善室內深處與移動情境的訊號落差,提升連線連續性。

同時,為了讓住家、通勤動線、商圈與觀光熱點等高使用場域維持穩定表現,台灣大哥大已在全台超過213個住宅、觀光及商圈熱點完成 100MHz 布建,提升人流密集區的網路覆蓋率。

5G高速(小).jpg
圖/ dreamstime

值得注意的是,在今年的 Opensignal 評比中,台灣大哥大還拿下了「5G 語音體驗」與「網路可用率」兩項第 1 名,累計獲得 4 項獎項。這意味著不僅具備影音體驗優勢,在語音互動與連線率等關乎用戶日常應用的基礎指標,皆有亮眼成績。

尤其,隨著影音與即時互動成為新世代的工作常態,網路品質的重要性只會持續上升。無論是遠距協作所仰賴的視訊與畫面共享即時同步,內容創作對直播與即時上傳連續性的要求,或是 AI 視訊互動、即時翻譯與會議摘要等新應用,都高度依賴低延遲與穩定的資料傳輸。網路品質因此不再只是連線條件,更是支撐內容生產、協作效率與新應用落地的基礎能力,甚至直接牽動競爭力。

而台灣大哥大經 Opensignal 認證、於多項關鍵指標領先業界,不僅將成為 AI 時代的重要後盾,也讓使用者能更充分發揮高階手機的效能,把「快、穩、滑順」落實在每天的工作與生活中。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓