雲端運算龍頭AWS的年度大會re:Invent 2025在美國拉斯維加斯展開,《數位時代》前進現場直擊。
面對AI時代算力需求爆炸與成本高漲的挑戰,AWS公用運算資深副總裁Peter DeSantis在基礎設施主題演講中,端出兩款關鍵自研晶片Graviton5與Trainium3,同時發表讓客戶能修改「一行程式」就輕鬆轉移到新晶片的新技術,大客戶蘋果也罕見站台分享。
AWS試圖從軟硬體包夾,搶下更多企業客戶,挑戰輝達(NVIDIA)AI算力壟斷的局面。
防守:Graviton 5築「通用運算」護城河,蘋果站台力挺
AWS作為雲端產業多年市佔第一的霸主,自2018年就起持續推出ARM架構設計的處理器Graviton系列,專門用於提高「雲端伺服器」的運算效率。
今年發表的全新Graviton5,單顆封裝高達192核心,創下Amazon EC2處理器最高紀錄,比上一代Graviton4提升25%效能,更多出2.6倍快取資源,對於龐大運算量、工作負載的資料庫來說,能減少資料處理時間,也降低營運成本。
大客戶蘋果更罕見二度出席站台為Graviton5背書,「我們有些服務每天要處理數十億次運算請求。」蘋果雲端系統與平台副總裁Payam Mirrashidi在台上分享,蘋果將App Store、Apple Music等核心服務遷移到AWS Graviton5處理器上,獲得巨大的效益,效能提升40%、成本降低30%,同時因為能用更少的資源達到更大的吞吐量,也間接減少碳足跡。
他舉例,在蘋果最新的iOS 26中推出的詐騙偵測功能 (spam detection feature),透過語音內容篩選來電,需要非常密集大量的運算,就是在AWS Graviton上運行才能實現的功能。
進攻:Trainium 3聯手PyTorch拆除輝達高牆,一行代碼實現「無痛轉移」
在首日發布會已經搶先公開的另一款自研AI晶片Trainium3是AWS今年的一項重要武器,從上一代5奈米躍升為台積電3奈米製程,算力較前代大幅提升4.4倍,更強調能為企業省下40%成本,挑戰輝達在AI算力市場的壟斷。
然而,要讓企業願意從輝達的GPU搬遷到Trainium,光靠硬體效能與成本優勢還不夠,還必須解決軟體障礙,因為長期以來,NVIDIA都憑藉「CUDA」平台、介面的生態系築起高牆,想更換晶片的企業可能面臨龐大的程式改寫成本。
為了降低企業的遷移門檻,AWS在發表會上宣布,Trainium將「原生支援」主流框架PyTorch,未來甚至只需要修改「一行程式碼」,現有的模型就可以直接在Trainium上運行,展現AWS在AI晶片軟體生態的戰略野心。
結論:軟硬包抄,吸企業跳槽
AWS透過兩大自研晶片Graviton5和Trainium3的更新,一攻一守試圖掌控底層運算的定義權。
Graviton5強調高效低成本的CP值優勢,Trainium3則透過支援PyTorch Native打破軟體壁壘,試圖把AI晶片的轉換門檻降到最低,吸引更多企業跳槽轉向。
責任編輯:李先泰
