輝達執行長黃仁勳日前在GTC上推出Vera CPU,並定位為「專為代理AI量身打造」,宣告CPU成為下一個AI基礎建設的戰場。
在這樣的趨勢下,半導體IP(矽智財)龍頭Arm(安謀)宣布正式跨界,踏入晶片戰場搶商機,成立35年來首度推出自研資料中心CPU「Arm AGI CPU」。該CPU交由台積電製造,採用三奈米製程。
Arm是眾多超大規模AI基礎建設的核心架構,包括亞馬遜、Google、Microsoft Azure及輝達的Vera等。Arm表示,隨著AI基礎架構在全球持續擴展,生態系中的合作夥伴也期待Arm承擔更多角色,因此Arm AGI CPU應運而生。
Arm執行長哈斯(Rene Haas)表示,AI資料中心是一個「非常龐大且仍未被滿足的市場」,有足夠空間容納不同玩家。同時表示,Arm AGI CPU相較於最新的x86系統,每機櫃可提供超過2倍的效能,可在每吉瓦的AI資料中心容量上,節省高達100億美元的資本支出(CAPEX)。
為什麼Arm要推出CPU?
隨著AI從模型訓練走向「代理式AI」,資料中心的運算架構正在改變。過去AI運算主要仰賴GPU負責訓練與推論,CPU多半只是輔助角色;但在代理式AI架構中,大量AI代理需要持續運作,並在不同模型、工具與資料之間即時調度,讓CPU轉為負責任務分派、資源協調與資料流動的核心節點。
Arm指出,在這樣的環境下,CPU已成為影響系統效率與擴展能力的關鍵,需求明顯上升,也帶動其角色轉變。過去Arm以IP授權為主,由客戶自行設計晶片;但隨著AI基礎設施快速擴張,雲端與AI業者更希望能快速、大規模部署運算平台,對「現成且可量產」的解決方案需求提高。
在這樣的背景下,Arm首度推出自研CPU,提供從IP、半成品到成品的不同選項,讓客戶依需求選擇導入方式。哈斯表示:「我們會提供不同層級的產品,如果客戶不選擇AGI CPU,選CSS或IP也沒問題。」
Arm推出AGI CPU,主要是回應AI基礎設施升級帶來的新機會。一方面,代理式AI讓CPU的重要性提升;另一方面,市場對快速部署的需求,也推動Arm從技術供應商,走向平台與產品提供者,試圖在AI基礎設施中占據更核心的位置。
會不會跟Arm的客戶搶生意?
Arm跨入晶片市場後,外界最關心的問題之一,就是是否會與原本的客戶產生競爭關係。過去,包括AWS、Google、Microsoft等雲端業者,皆是建立在Arm的架構之上自行設計CPU,如今Arm推出自有產品,確實在表面上與這些客戶的業務產生重疊。
對此,雲端AI事業部執行副總裁阿瓦德(Mohamed Awad)強調:「我們要給予客戶的是選擇權(optionality)。」Arm表示,這項策略並非取代既有客戶,而是擴充產品選項。Arm目前同時提供IP授權、運算子系統(CSS),以及此次推出的完整CPU產品,讓客戶可依不同應用場景選擇方案。例如在部分關鍵工作負載上,企業仍可能選擇自行設計晶片;但在需要快速部署或標準化架構的場景,則可直接採用Arm提供的現成產品。
換言之,Arm試圖建立的是一種「平台型供應」模式,而非單一產品競爭。透過同時涵蓋不同層級的技術與產品,Arm不僅能維持既有授權業務,也能切入過去未能觸及的市場需求。對雲端業者而言,這樣的策略反而增加彈性,使其在自研晶片之外,仍保有採用現成解決方案的選項,進一步擴大整體生態系的規模與使用範圍。
Arm CPU的合作夥伴與生態系
Meta與Arm共同開發此款CPU,以最佳化其應用程式系列所需的吉瓦(GW)級基礎架構,成為最大客戶。
其他首批合作夥伴包括 Cerebras、Cloudflare、F5、OpenAI、Positron、Rebellions、思愛普(SAP)與 SK 電訊(SK Telecom),皆與Arm合作導入Arm AGI CPU,加速雲端、網路及企業環境中的AI驅動服務。目前,永擎電子(ASRock Rack)、聯想(Lenovo)、廣達電腦(Quanta Computer)與美超微電腦(Supermicro)已開始提供可供訂購的商用系統,並預計於今年下半年擴大供應。
