過去幾年裡,能夠提供算力的GPU(圖形處理器)幾乎吸引了科技界對AI基礎設施的全部目光。但近期AMD、英特爾都在財報會議上透露,CPU(中央處理器)業務的成長超乎他們的預期。隨著邁入AI代理時代、對愈來愈複雜的任務,AI需要的不再只是運算能力,更需要拆解任務、安排流程、調度工具,使擅長這些能力的CPU再次回到了舞台上。
根據《華爾街日報》報導,半導體IP龍頭Arm(安謀)就在近日的發表會上,端出一款為AI而生的全新CPU晶片。「人們認為CPU已經過時了。」執行長哈斯(Rene Haas)向觀眾表示,「隨著AI技術快速發展,我們需要愈來愈多CPU,大量的CPU。」
AI代理時代來臨,為何CPU重新受到重視?
關鍵一:AI運作模式出現根本改變
過去的AI主要以聊天機器人為代表,其運作邏輯相對單純:使用者輸入問題,由CPU進行基本處理後交由GPU完成推理,再將結果回傳。這種一個口令一個動作的互動模式,計算重心集中在GPU。
但到了代理AI時代,任務往往更為複雜,會被拆解為多個子任務,由多個代理同時執行,過程中可能會不斷呼叫工具、查詢資料庫撰寫與執行程式,甚至進行多輪自我反思與修正。這些涉及任務安排、資源調度與系統互動的工作,幾乎全落在CPU身上。
喬治亞理工學院和英特爾發表的一份研究指出,在這類AI代理工作負載中,CPU甚至可能占據整體延遲的過半比例,成為真正影響效率的關鍵環節。
關鍵二:算力需求從講求爆發力轉為耐久賽
另外,聊天機器人的運算需求雖然龐大,但多集中於短時間內完成的推理或訓練任務。相較之下,AI代理需要長時間作業,甚至同時啟動多個任務流程。以前可能是一個偶爾呼叫AI,要求解答幾個問題,現在可能同時運行超過10個AI代理長時間作業。
例如OpenAI創始成員卡帕西(Andrej Karpathy)今年3月上旬發表的自動研究代理AutoResearch,便需要持續運行一整晚或更長時間;Anthropic Claude Code產品負責人切爾尼(Boris Cherny)曾分享,他日常工作中會同時開著複數Claude Code AI代理寫程式。
這種長時間的AI需求,直接推升了CPU的需求規模。哈斯指出,隨著AI代理能以遠高於人類的速度產生與處理請求,資料中心對CPU核心的需求可能在短時間內成長數倍,甚至供不應求也不奇怪。英特爾、AMD等CPU廠商也在財報與公開談話中承認,先前低估了這波需求的速度與規模。
AMD執行長蘇姿丰表示,CPU業務的成長超乎預期,看好2026年伺服器CPU市場有兩位數成長;英特爾財務長大衛.津斯納(David Zinsner)則認為,今年CPU又變得非常火熱。
AMD、英特爾都喊CPU需求正旺
當AI能力的關鍵從生成答案的準確度,轉變為衡量能否實際完成任務,整體效能便不再取決於單一晶片,而是取決於整個系統如何協同運作。在這樣的架構下,GPU仍負責高強度的推理計算,但CPU則成為串聯各個環節的中樞,負責決定何時呼叫模型、如何分配任務、以及如何與外部世界互動。
這或許也是為何輝達近年都開始強化自家CPU產品,甚至推出不搭載GPU的純CPU伺服器配置。Vera CPU便是輝達專為AI代理工作負載所打造的次世代處理器。在AI從訓練轉向推理、再進一步邁向代理化的過程中,CPU不再只是輔助角色,而是支撐整個系統運作的基礎設施。
當AI從被動回應問題的工具,演變為能主動執行任務的代理,運算需求比拼爆發力的短跑,轉變為重視長時間運轉效能的馬拉松。儘管GPU仍然是這股AI浪潮中最耀眼的明星,真正影響AI能否落地的,則是一度遭到忽視,如今再次變得不可或缺的CPU。
延伸閱讀:
Claude送免費額度!這三種方案都能領,怎麼領?要注意什麼?教學一次看
系統刷掉履歷也沒關係?哈佛研究「一句話」神助攻,她靠執著拿到Google夢幻職缺
資料來源:華爾街日報、UncoverAlpha
本文初稿為AI編撰,整理.編輯/ 陳建鈞
