輝達Blackwell晶片解密|取名來自數學家,哪些台廠打入供應鏈?買家有誰?
輝達Blackwell晶片解密|取名來自數學家,哪些台廠打入供應鏈?買家有誰?

輝達於今年3月中GTC大會上發表新一代的AI晶片架構NVIDIA Blackwell,可在兆級參數大型語言模型上構建和運行即時生成式AI,而成本和能耗比其前身最低可達25倍。

Blackwell GPU 架構具有六項用於加速運算的變革性技術,這將有助於在資料處理、工程模擬、電子設計自動化、電腦輔助藥物設計、量子運算和生成式 AI 方面實現突破。

NVIDIA執行長黃仁勳表示,「30年來,我們一直在追求加速運算,目標是實現深度學習和 AI 等變革性突破。生成式 AI 是我們這個時代的決定性技術。 Blackwell 是推動這場新工業革命的引擎。,我們將與世界上最具活力的公司合作,實現人工智慧對每個產業的承諾。」

Blackwell 首波有哪些買家?大客戶們這麼說

計劃採用 Blackwell 的眾多組織包括 Amazon Web Services、戴爾科技集團、Google、Meta、微軟、OpenAI、甲骨文、Tesla 和 xAI。

Alphabet 和 Google 執行長 Sundar Pichai 表示:「將搜尋和 Gmail 等服務擴展到數十億用戶,教會了我們如何管理運算基礎設施。隨著我們進入AI平台轉型,為了自己的產品和服務,以及我們的雲端客戶,我們繼續深入投資基礎設施。我們很幸運能夠與 NVIDIA 建立長期合作夥伴關係,並期待將 Blackwell GPU 的突破性功能帶給我們整個 Google 的雲端客戶和團隊,包括 Google DeepMind,以加速未來的發現。」

亞馬遜總裁暨執行長 Andy Jassy 表示:「我們與 NVIDIA 的深度合作可以追溯到 13 年前,當時我們在 AWS 上推出了世界上第一個 GPU 雲端實例。今天,我們在雲端的任何地方提供最廣泛的 GPU 解決方案,支援世界上技術最先進的加速工作負載。這就是為什麼新的NVIDIA Blackwell GPU 將在 AWS 上運作得如此出色,也是 NVIDIA 選擇 AWS 共同開發 Project Ceiba 的原因,該專案將 NVIDIA 的下一代 Grace Blackwell 超級晶片與 AWS Nitro System 先進的虛擬化技術和超高速 Elastic Fabric Adapter 網路結合,用於 NVIDIA 自己的 AI 研發。 透過 AWS 和 NVIDIA 工程師的共同努力,我們將繼續共同創新,使 AWS 成為任何人在雲端中運行 NVIDIA GPU 的最佳場域。」

戴爾科技集團創辦人暨執行長 Michael Dell 表示:「生成式 AI 對於創造更智慧、更可靠和更有效率的系統至關重要。戴爾科技集團和 NVIDIA 正在共同努力塑造科技的未來。隨著 Blackwell 的推出,我們將繼續為客戶提供下一代加速產品和服務,為他們提供推動跨產業創新所需的工具。」

Google DeepMind 共同創辦人暨執行長 Demis Hassabis 表示:「AI 的變革性潛力令人難以置信,它將幫助我們解決世界上一些最重要的科學問題。Blackwell 突破性的技術能力將提供所需的關鍵運算,幫助世界上最聰明的人開闢全新的科學發現。」

Meta 創辦人暨執行長 Mark Zuckerberg 表示:「從我們的大型語言模型到內容推薦、廣告和安全系統,AI 已經為一切提供了動力,並且它在未來只會變得更加重要。我們期待使用 NVIDIA 的 Blackwell 幫助訓練我們的開源 Llama 模型並建立下一代的 Meta AI 和消費產品。」

微軟董事長暨執行長 Satya Nadella 表示:「我們致力於為客戶提供最先進的基礎設施,提供他們的 AI 工作負載動力。透過將 GB200 Grace Blackwell 處理器導入我們全球的資料中心,以我們在雲端最佳化 NVIDIA GPU 的悠久歷史為基礎,同時我們也為世界各地的組織兌現了 AI 的承諾。」

OpenAI 執行長 Sam Altman 表示:「Blackwell 實現了大幅的效能躍升,並將加快我們推出領先模型的能力。我們很高興繼續與 NVIDIA 合作來增強 AI 運算。」

Oracle 董事長暨技術長Larry Ellison 表示:「Oracle 與 NVIDIA 的密切合作將在 AI、機器學習和資料分析方面實現質和量的突破。為了讓客戶發現更多可行動的洞察,必須要有像 Blackwell 這樣專門為加速運算和生成式 AI 而構建的更強大的引擎。」

Tesla 和 xAI 執行長 Elon Musk 表示:「目前沒有什麼比 NVIDIA 硬體更好的 AI 硬體了。」

Blackwell 架構命名由來?

輝達表示,此全新架構以 David Harold Blackwell 命名, 紀念這位專門研究賽局理論和統計學的數學家,他也是第一位入選美國國家科學院的黑人學者。 此架構繼承了兩年前推出的 NVIDIA Hopper™ 架構。

Blackwell 性能究竟如何?超級晶片GB200採用台積4奈米

輝達指出,Blackwell 的六項革命性技術共同支援 AI 訓練和即時大型語言模型推理,模型可擴展至 10 兆個參數。其中包括:

世界上最強大的晶片 :Blackwell 架構 GPU 配備了 2080 億個電晶體, 採用台積電客製化 4 奈米製程製造 ,兩倍光罩尺寸GPU裸晶透過 10 TB/s 的晶片到晶片互連連接成單個、統一GPU。

第二代 Transformer 引擎 :透過新的微張量擴展(micro-tensor scaling)支援以及 NVIDIA 的先進動態範圍管理演算法整合到 NVIDIA TensorRT™-LLM 和 NeMo Megatron 框架中,Blackwell 將利用新的 4 位浮點 AI 推論能力支援加倍地運算和模型尺寸。

第五代NVLink :為了加速多兆參數和混合專家(mixture-of-experts) AI 模型的效能,最新版本的 NVIDIA NVLink® 提供了每個 GPU 驚人的 8TB/s 的雙向吞吐量,確保在最複雜的大型語言模型中高達 576 個 GPU 之間實現無縫的高速溝通。

RAS 引擎 : Blackwell 驅動的 GPU 包含一個專用引擎,可實現可靠性、可用性和可服務性。 此外,Blackwell 架構還增加了晶片級功能,利用基於 AI 的預防性維護來運行診斷和預測可靠性問題。 這樣可以最大化系統正常運行時間,並增強大規模 AI 部署的彈性,使其連續數週甚至數月不間斷地運行,並降低運營成本。

安全 AI :先進的機密運算功能可在不影響效能的情況下保護 AI 模型和客戶資料,並支援新的本機介面加密協定,這對於醫療保健和金融服務等隱私敏感產業至關重要。

解壓縮引擎 :專用解壓縮引擎支援最新格式,加速資料庫查詢,以提供資料分析和資料科學的最高效能。 未來幾年,公司每年花費數百億美元的資料處理將越來越使用 GPU 加速。

NVIDIA GB200 Grace Blackwell 超級晶片透過 900GB/s 超低功耗 NVLink 晶片到晶片互連技術將兩個 NVIDIA B200 Tensor Core GPU 與 NVIDIA Grace CPU 連接起來。

為了獲得最高的 AI 性能,GB200 驅動的系統可以與 NVIDIA Quantum-X800 InfiniBand 和 Spectrum™-X800 乙太網路平台連接,這些平台可提供速度高達 800Gb/s 的先進網路。

GB200 是 NVIDIA GB200 NVL72 的關鍵元件,NVIDIA GB200 NVL72 是一種多節點、液冷、機架規模系統,適用於運算最密集的工作負載。

它結合了 36 個 Grace Blackwell 超級晶片,其中包括透過第五代 NVLink 互連的 72 個 Blackwell GPU 和 36 個 Grace CPU。 此外,GB200 NVL72 還包括 NVIDIA BlueField®-3 資料處理單元,可在超大規模 AI 雲端中實現雲端網路加速、可組合儲存、零信任安全性和 GPU 運算彈性。 與 NVIDIA H100 Tensor Core GPU 相比,GB200 NVL72 可提供高達 30 倍的大型語言模型推論工作負載效能,並將成本和能源消耗降低多達 25 倍。

該平台充當單一 GPU,具有 1.4 exaflops 的 AI 效能和 30TB 的快速記憶體,是最新 DGX SuperPOD 的構建塊。

NVIDIA 提供 HGX B200,此伺服器主機板能透過 NVLink 連接八個 B200 GPU,以支援基於 x86 的生成式 AI 平台。HGX B200 透過 NVIDIA Quantum-2 InfiniBand 和 Spectrum-X 乙太網路平台支援高達 400Gb/s 的網路速度。

Blackwell 全球供應鏈 台廠入列

輝達在新聞資料上揭露全球合作夥伴供應商,AWS、Google Cloud、Microsoft Azure 和 Oracle Cloud Infrastructure 將成為首批提供Blackwell 驅動執行個體的雲端服務供應商。

NVIDIA 雲端夥伴計劃的公司包括Applied Digital、CoreWeave、Crusoe、IBM Cloud 和 Lambda 也同樣將提供相應的產品。

主權 AI 雲端也將提供基於 Blackwell 的雲端服務和基礎設施,包括 Indosat Ooredoo Hutchinson、Nebius、Nexgen Cloud、Oracle EU Sovereign Cloud、Oracle 美國、英國和澳洲政府雲端、Scaleway、Singtel、Northern Data Group 的 Taiga Cloud、 Yotta 資料服務的 Shakti Cloud 和楊忠禮電力國際。

GB200 也將在 NVIDIA DGX™ Cloud 上提供,這是一個與領先的雲端服務供應商共同設計的 AI 平台,讓企業開發人員能夠專門存取建置和部署先進生成式 AI 模型所需的基礎設施和軟體。 AWS、Google Cloud 和 Oracle Cloud Infrastructure 計畫在今年稍後託管基於 NVIDIA Grace Blackwell 的新執行個體。

思科、戴爾科技集團、慧與科技、聯想和美超微預計提供基於Blackwell 產品的各種伺服器,還有Aivres、永擎電子、華碩、Eviden、鴻海、技嘉科技、英業達、和碩聯合科技、雲達科技、緯創資通、緯穎科技和雲達國際科技。

此外,包括 Ansys、Cadence 和 Synopsys 等全球領先的工程模擬公司與持續增加的軟體製造商,將使用基於 Blackwell 的處理器來加速用於設計和模擬電氣、機械和製造系統及零件的軟體。他們的客戶可以利用生成式 AI 和加速計算,更快地、以更低的成本和更高的能源效率將產品推向市場。

延伸閱讀:輝達將推AI人才專業認證!黃仁勳加碼:還有培訓課程,打造人才生態系

本文授權轉載自:《財訊》雙週刊

責任編輯:錢玉紘

本網站內容未經允許,不得轉載。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
台日半導體新局 全解讀
© 2024 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓