當所有人的目光都還聚焦在NVIDIA Blackwell架構那令人窒息的性能數據上時,Google悄悄地亮出了自己的底牌——Ironwood,其第七代TPU。
Google這次發布Ironwood,核心目標只有一個:將AI戰爭從上半場的「訓練賽」,拖入下半場的「應用賽」。
現在的AI時代已經進入了另一時代,「訓練(Training)」不再是一切,「推理(Inference)」的重要性越來越高。
而Google,正嘗試在這片新大陸上加冕為王。
不只是一塊晶片,而是一支軍團
首先,我們快速看一下Google這把新武器的威力。
單兵作戰能力: Ironwood單晶片的浮點運算性能達到 4.6 PetaFLOPS,這個數字直接對標NVIDIA目前最強的Blackwell架構,甚至在某些指標上略微超越。
軍團協同作戰: 他們展示了一種「暴力美學」般的擴展能力,可以將多達 9,216顆 Ironwood晶片組成一個「Pod」(陣列),形成一個總算力高達 42.5 ExaFLOPS 的超級運算集群。
這是什麼概念?NVIDIA的策略是打造一個由幾十位超級英雄(頂級GPU)組成的精英戰隊;而Google的策略,則是組建一支由近萬名基因改造士兵組成的、完美協同的羅馬軍團。個體戰力或許各有千秋,但軍團作戰的規模和效率,完全是另一個維度的思考。
Google重新定義戰場
Google高層在發布會上反覆強調一個詞:「推理時代」(the age of inference)。這是一個極其聰明的敘事轉變。
AI的上半場是模型訓練(Training)。 這就像是把一個學生從零培養成博士,需要耗費巨大的資源和時間,但這是一次性的。NVIDIA的GPU憑藉其通用性和強大的CUDA生態,幾乎壟斷了這個市場,賺得盆滿缽滿。
AI的下半場是模型推理(Inference)。 這就像是這位博士畢業後,每天要回答全球數十億用戶提出的各種問題。這是一個持續的、規模遠比訓練大上百倍的日常運營。
Google承認在「訓練」這場仗上,NVIDIA已經贏了。但它要告訴全世界,真正的決戰在「推理」。而Ironwood,就是專為大規模、高效率、低成本的「推理」而生的終極武器。
Google與輝達不同的設計哲學:橫向擴展 vs. 縱向堆疊
Google與NVIDIA的晶片設計哲學,反映了兩種截然不同的世界觀。
NVIDIA的哲學是打造一顆「瑞士軍刀」般的通用GPU,讓它盡可能強大,然後用高速的NVLink將幾十顆串聯起來。它的優勢在於靈活性和強大的單體性能。
Google則打造一顆為特定任務(推理)高度優化的「專用釘子」,然後用超大規模的數據中心網絡,將成千上萬顆「釘子」組成一個無縫協作的整體。它的優勢在於極致的規模化效率和成本控制。
對於Google自身而言(搜尋、YouTube、Gmail),每天需要處理天文數字般的用戶請求,這種「羅馬軍團」式的架構,遠比「超級英雄戰隊」更具成本效益。現在,Google希望將這種成本優勢,透過Google Cloud賦能給像Anthropic這樣的客戶。
Anthropic的百萬訂單,對Google最有力的背書
空談戰略毫無意義,市場的認可才是唯一的試金石。
而Anthropic那筆高達100萬顆Ironwood TPU的多年期、數十億美元的訂單,就是對Google這場豪賭最有力的背書。
Anthropic作為OpenAI最強勁的對手之一,選擇將其Claude模型的未來規模化部署,重度押注在Ironwood上。
這無異於向全世界宣告:他們相信,在「推理」的戰場上,Google的「羅馬軍團」架構,將會極具擴展性和經濟效益。這是一次典型的「用腳投票」,其戰略意義遠超訂單本身的金額。
為什麼Google能做到這點?因為它控制著從上到下的整個技術棧:
底層: 自己設計Ironwood晶片。
中層: 自己設計數據中心的Jupiter網絡來連接晶片。
上層: 自己開發JAX、TensorFlow等軟體框架來驅動硬體。
這種極致的垂直整合,讓Google可以進行全局優化,實現軟硬體的完美協同。這是任何一家單獨購買NVIDIA晶片的公司都無法企及的。
Ironwood不僅僅是一塊晶片,它是Google Cloud帝國最鋒利的矛,也是最堅固的盾。
Google美麗的圍牆花園
然而,NVIDIA的帝國並不會因此輕易動搖。Google的策略雖妙,卻有一個致命的限制:Ironwood目前僅在Google Cloud的「圍牆花園」內提供服務。
這就形成了一個有趣的對比:
NVIDIA是「軍火之王」,它向所有人出售最先進、最通用的武器(GPU和CUDA)。無論你是誰,只要有錢,就能買到它的裝備。它的CUDA生態系統,更是經營多年的深厚護城河,開發者深陷其中,難以遷移。
Google是「帝國建造者」,TPU就像蘋果的路線,打造一個從晶片、網路、到軟體(JAX, TensorFlow)的垂直整合封閉生態。在這個生態裡,所有元件都為彼此完美優化,效率和成本控制達到極致。但前提是,你必須成為它帝國的子民(使用Google Cloud)。
因此,Ironwood的發布,標誌著AI基礎設施戰爭進入了一個新的階段。
這不再是單純的晶片性能競賽,而是一場關乎「開放 vs. 封閉」、「通用 vs. 專用」、「軍火商 vs. 帝國」的根本性哲學對決。
本文授權轉載自FOMO研究院電子報
