「沒有Anthropic,TPU成長從哪來?」黃仁勳坦承太晚投資Anthropic是失誤,把大訂單拱手讓人
「沒有Anthropic,TPU成長從哪來?」黃仁勳坦承太晚投資Anthropic是失誤,把大訂單拱手讓人

重點一:輝達(NVIDIA)的護城河不是鎖定產能,而是說服整條供應鏈為一個尚未到來的兆美元市場提前投資。

重點二:黃仁勳罕見地正面回應 TPU 威脅,以 TCO 數據挑戰 Google 和 AWS 公開基準測試。

重點三:對中國晶片出口的論述核心是「恐懼驅動的禁令會把開源生態系推向非美國技術堆疊」。

2026 年 4 月 15 日,黃仁勳 (Jensen Huang) 坐在 Dwarkesh Patel 的鏡頭前,用一句話定義了輝達:「輸入是電子,輸出是token,中間是 NVIDIA。」

這不僅僅是修辭。據最新財報,輝達已與晶圓代工、記憶體和封裝廠簽下近 1,000 億美元的採購承諾;半導體分析機構 SemiAnalysis 報導,實際承諾可能高達 2,500 億美元。

這些數字的意義不在於「鎖定產能」。黃仁勳解釋了一套更精密的機制:他花大量時間直接向上游 CEO 說明 AI 產業的規模預測,讓他們願意為輝達的需求擴建產能:「為什麼他們願意為我投資,而不是為別人?因為他們知道我有能力買下他們的供給,再透過我的下游賣出去。」

GTC 大會在這套體系中扮演的角色,與其說是產品發表會,不如說是供應鏈信心的年度校準儀式。上游看見下游的需求規模,下游看見上游的產能承諾,所有人同時看見 AI 新創的爆發速度。

黃仁勳說,他的主題演講之所以總帶點「教育」色彩,是因為他必須確保整條供應鏈理解「什麼東西正在逼近我們,為什麼,以及規模多大」。

具體案例是先進封裝技術 CoWoS 的瓶頸化解。兩年前,CoWoS 是制約 AI 晶片出貨的最大障礙。輝達的做法是連續翻倍投資,迫使台積電 (TSMC) 將 CoWoS 從「特殊製程」重新定位為「主流運算技術」,產能規劃與邏輯晶片同步擴張。黃仁勳也提到與美光 (Micron) 的合作:他在 AI 爆發前就向美光 CEO 展示了對 HBM 記憶體的需求預測,美光因此提前下注。

更前瞻的佈局在矽光子 (silicon photonics)。輝達已與 Lumentum、Coherent 等光通訊廠合作,在台積電體系內建立全新的矽光子供應鏈,甚至將專利授權給整個生態系以保持開放。這套「預取瓶頸」(prefetching bottlenecks) 的方法論,是黃仁勳對「沒有任何瓶頸會持續超過兩三年」這句話的底氣來源。

與台積電的 30 年握手協議

這套方法論的深層基礎,是黃仁勳與供應鏈長期建立的非典型信任關係。他透露一個驚人細節:輝達與台積電合作近 30 年,兩家公司之間「沒有法律合約」。「有時候我佔便宜,有時候我吃虧,但整體而言,這段關係不可思議。我可以完全信任他們、完全依賴他們。」這種以信任取代合約的模式,讓輝達得以在高度不確定的未來進行超大規模產能承諾。

黃仁勳魏哲家_吳宙棋.jpg
黃仁勳(右)透露,輝達與台積電合作近30年,兩家公司之間「沒有法律合約」;左為台積電董事長暨總裁魏哲家。
圖/ 吳宙棋攝影

他也揭示了一個與業界常態截然不同的定價原則:輝達從不根據供需調整價格。「你報了價就是報了價。如果需求暴增,那就這樣。」黃仁勳認為,成為產業可預測的基礎比短期利潤最大化更重要。

同樣的穩定邏輯也體現在 GPU 分配上,他否認了外界盛傳的 Larry Ellison 和 Elon Musk 晚餐「跪求 GPU」說法:「我們絕對有一起吃晚餐,而且是很棒的晚餐。但他們從未跪求 GPU。他們只需要下訂單就好。」

但他也坦承了一個無法用資本解決的瓶頸:水電工和電工。「如果末日論者讓人們不敢當軟體工程師,我們就會短缺軟體工程師。十年前有人說放射科醫師會第一個被 AI 取代,結果呢?我們現在最缺的就是放射科醫師。」

為什麼 TPU 不敢來 MLPerf?

Dwarkesh 丟出了一個尖銳的問題:全球前三大 AI 模型中,Claude 和 Gemini 都在 TPU 上訓練,這對輝達意味著什麼?

黃仁勳的回應策略是拉高維度。他強調輝達做的是「加速運算」(accelerated computing),不是張量處理器。從分子動力學、量子色動力學到流體動力學,CUDA 生態系的應用範圍遠超任何 ASIC。「我們支援世界上所有類型的應用程式。這就是優勢。」

沒有 Anthropic,TPU 成長從何而來?

但他最具爆炸性的論點,是對 Anthropic 角色的直接定義。Dwarkesh 指出 Anthropic 剛宣布與 Broadcom 及 Google 達成數 GW 規模的 TPU 合約,這是否代表趨勢?

黃仁勳的回應極為尖銳: 「Anthropic 是一個獨特案例,不是趨勢。沒有 Anthropic,TPU 成長從何而來?百分之百是 Anthropic。沒有 Anthropic,Trainium 成長從何而來?百分之百是 Anthropic。」 這句話直接質疑了 Google TPU 和 AWS Trainium 作為獨立商業平台的可行性。

他進一步拆解了自建晶片的成本迷思。外界常假設繞過 NVIDIA 70% 的毛利率就能大幅省錢,但黃仁勳指出 Broadcom 等 ASIC 設計公司的毛利率也高達 65%:「你到底省了什麼?」

Google TPU
AI新創Anthropic日前宣布部署多達一百萬個 TPU,強調「這將大幅提升我們的運算資源。」
圖/ Google

一個 300 億美元的遺憾

而 Anthropic 之所以深度綁定非 NVIDIA 平台,根源其實是輝達自己的戰略失誤。

黃仁勳罕見地自我批評:當年 Anthropic 需要供應商等級的巨額投資來取得算力,但輝達當時的規模無法支持數十億美元的投入。「我沒有深刻理解他們別無選擇,沒有 VC 會投入 50 到 100 億美元。這是我的失誤。」

Google 和 AWS 趁勢入場,以鉅額投資換取 Anthropic 使用其自研晶片。據報導,輝達後來投資 OpenAI 高達 300 億美元、Anthropic 100 億美元,試圖亡羊補牢。「如果我能回到過去,我早就投了。但我不會再犯同樣的錯誤。」

在 TCO(總擁有成本)上,黃仁勳同樣發起正面挑戰。他直接宣稱:「輝達的每瓦效能全球最佳,沒有任何單一平台能展示更好的效能-TCO 比。TPU 不會來 MLPerf,Trainium 不會來 InferenceMAX。」他點名 SemiAnalysis 的 InferenceMAX 基準測試,邀請所有競爭對手公開比較推論成本。

這番話的背景是,輝達 60% 營收來自五大超大規模客戶(Google、Amazon、Microsoft、Meta、Oracle)。Dwarkesh 質疑:這些客戶有能力自建軟體堆疊,CUDA 的護城河是否正在瓦解?

黃仁勳的反駁有兩層。第一層是技術深度:「NVIDIA 的 GPU 像 F1 賽車,不是人人都能開到極限。我們派駐在 AI 實驗室的工程師數量驚人,常能幫客戶再提升 2 到 3 倍效能。」

第二層是商業邏輯:「大部分我們在 AWS 和 Azure 的業務是外部客戶,不是內部使用。」換言之,超大規模客戶買 NVIDIA 不只是為了自用,更是為了租給他們的客戶。

中國晶片禁令的反直覺邏輯

訪談中最激烈的交鋒發生在中國議題。Dwarkesh 以 Anthropic 的 Mythos Preview 模型為例:這個模型發現了數千個高嚴重性安全漏洞,甚至在以安全著稱的 OpenBSD 中找到一個存在 27 年的漏洞。如果中國用 AI 晶片訓練出同等能力的模型並大規模部署,是否威脅美國國安?

黃仁勳的回應直接挑戰了禁令的前提假設。他指出三個事實:第一,Mythos 訓練使用的算力規模和類型,中國已經擁有;第二,中國製造全球 60% 以上的主流晶片,擁有全球約 50% 的 AI 研究人員;第三,中國有大量閒置的資料中心和廉價能源。「AI 是平行運算問題。為什麼不能用 4 倍、10 倍的晶片?能源對他們來說幾乎免費。」

他進一步論證:7 奈米晶片的能力相當於 Hopper 世代,而今天多數前沿模型仍在 Hopper 上訓練。華為 2025 年創下史上最高單年營收,已展示矽光子互連技術。「你認為中國沒有 AI 晶片,這個想法完全是胡說八道。」

真正的威脅:開源生態系的歸屬

但黃仁勳最具說服力的論點不是技術層面的,而是生態系層面的。他警告:如果美國的封鎖政策迫使全球開源 AI 生態系轉向非美國技術堆疊,那才是對美國利益的真正傷害。「如果出現兩個生態系:開源生態系只跑在外國技術堆疊上,封閉生態系跑在美國技術堆疊上,我認為那對美國是災難性的結果。」

他用一個假設場景收束論點:「如果 DeepSeek 有一天先在華為硬體上推出,那對我們國家是災難。」這句話的潛台詞是:禁令非但沒有阻止中國的 AI 發展,反而可能加速中國建立獨立於美國的完整技術堆疊。

朗訊的前車之鑑

黃仁勳還搬出了一個歷史教訓。他將晶片禁令類比為導致美國電信設備業崩潰的政策失誤:「你所主張的這種政策,其結果是把美國電信產業管出了全球市場(policied out),到了我們連自己的電信網路都不再掌控的地步。」

他指的是朗訊 (Lucent) 等美國電信設備商在政策與市場壓力下衰落,最終讓華為和 Ericsson 主導全球電信基礎設施的歷史。在他看來,晶片禁令正在重演同樣的劇本:以保護國安為名,實則削弱美國產業的全球領導地位。

單一架構的賭注與邊界

訪談尾聲,Dwarkesh 問了一個看似技術性、實則觸及核心戰略的問題:為什麼不同時開發多種晶片架構?

黃仁勳的回答出人意料地坦率:「我們可以做,只是沒有更好的主意。我們在模擬器裡全部模擬過了,證明都更差。」這句話透露了一個重要訊號:輝達的單一架構策略不是資源限制,而是工程判斷。他的信心來源是極端的協同設計能力:同時在處理器、系統、互連架構、函式庫和演算法五個層面進行最佳化。

唯一的例外是輝達最近與推論加速器新創 Groq 達成的技術授權合作。黃仁勳解釋,這是因為一個新的市場區隔正在浮現:高價值 token。「如果我能給軟體工程師更快的回應速度,讓他們更有生產力,我願意付更多錢。」不同回應時間可以有不同定價,這拓展了推論市場的帕雷托前沿。

但這也暴露了輝達策略的邊界條件。當 AI 工作負載的形態(而非演算法)發生根本變化時,單一架構的效率優勢可能不再成立。黃仁勳自己也承認:「如果工作負載發生劇烈改變,我們可能會決定增加其他加速器。」

這意味著輝達的護城河本質上是一個關於 AI 運算形態穩定性的賭注。如果 AI 的發展路徑從 transformerMoE 大幅偏離,輝達將面臨比 TPU 競爭或中國禁令更根本的挑戰。

延伸閱讀:魏哲家入選《時代》百大影響力人物!黃仁勳親寫推薦文:台積電讓輝達AI超級電腦成為可能

資料來源:Dwarkesh Podcast

本文初稿為AI編撰,整理.編輯/ 李先泰

往下滑看下一篇文章
AI 成為企業新基礎設施,勤英科技從雲端代理走向 AI Infra 整合
AI 成為企業新基礎設施,勤英科技從雲端代理走向 AI Infra 整合

因應生成式 AI、代理式 AI 與實體 AI 的崛起,模型成為企業資訊基礎設施的一環,企業不僅需要算力、還必須具備同時管理多個 AI 模型、優化營運成本,以及確保 AI 基礎設施的安全與穩定;有鑑於此,服務超過 2,000 家企業客戶上雲的勤英科技(ELITE CLOUD)將業務範疇從雲端代理延伸到 AI 基礎設施整合商,協助企業整合多元模型資源、因應不同應用場景彈性調度算力資源,在 AI 新世代建立可規模化的 AI Infra 能力。

「隨著 AI 從單一聊天機器人進化到多模型、多代理協作,企業的核心競爭力不再僅是擁有 AI,而是建立一套可管理、多模型共存、穩定、安全且可持續擴充的 AI Infra 環境。」勤英科技區域總經理黃士培表示,為協助更多企業推進 AI 創新實務,勤英科技從原本的 AWS、Google Cloud、Azure 雲端代理角色,進一步轉型為 AI 基礎設施整合服務商,透過多語言模型平台 MixRoute、代理式 AI 導入與企業資料治理服務,協助企業建立真正可落地、可管理、可擴展的 AI 應用架構。

從 IT Infra 到 AI Infra,企業最大挑戰不是模型、算力而是管理

過去幾年,許多企業透過生成式 AI 實現「問問題」、「摘要文件」、「生成簡報」,提升員工工作績效,而代理式 AI 的崛起與普及,則讓「內嵌 AI 的企業應用」快速成為新常態,從企業資源規劃(ERP)、顧客關係管理(CRM)、人力資源(HR),到客服、研發甚至製造系統,AI 開始深度嵌入各類企業應用,AI 扮演的角色也從單純的輔助工具,逐漸進化為企業營運與決策流程的重要核心。

也因此,企業保持未來競爭力的關鍵,不再是「有沒有導入 AI」,而是「是否具備管理 AI 的能力」,包括如何讓多模型共存、如何控管 Token 成本、如何確保資料品質與一致性、如何依不同部門需求配置 Agent,以及如何避免 AI 成為新的資訊孤島,都是企業導入 AI 後的新挑戰。

「Gemini、Claude、OpenAI、Mistral 等模型快速迭代,意味著企業若只押注單一模型,未來很可能在成本、效能與彈性上失去優勢。」勤英科技區域總經理黃士培表示,企業接下來更需要以「Models as Infrastructure(模型即基礎建設)」的思維,將大型語言模型視為與運算、儲存、網路同等重要的基礎資源來規劃、治理以及進行成本管理,將資訊系統架構重塑為 AI 基礎建設。

勤英科技_內文1.JPG
圖/ 數位時代

勤英科技服務的客戶數超過 2,000 家,不少客戶已導入 AI 應用服務,正積極建置 AI Infra 與管理環境,因此,勤英科技自 2025 年積極轉型,將 AI Infra 視為企業長期競爭力的基礎建設來經營,業務範疇從傳統雲端代理擴展至 AI Infra 整合服務商,例如與多模型平台 MixRoute 合作,並開發可支援單一登入(SSO)、彈性調度不同大型語言模型 Token 的管理平台,協助企業簡化模型管理與成本控管,將更多資源與心力聚焦於核心業務與創新應用。

從雲端代理走向 AI Infra 整合,勤英科技從三面向協助企業發揮 AI 綜效

有鑑於 AI 應用與雲端環境息息相關,勤英科技除因應企業客戶的多雲策略協助管理多雲環境、優化成本,以及落實資安治理,更因應不同使用情境推出三種 AI 方案助力企業:

第一:提供開箱即用的 AI 服務。

黃士培以 Google Cloud 的產品為例解釋,透過整合 Gemini 的 Google Workspace,企業可直接在 Gmail、Meet、Docs、Sheets、Slides 中使用 AI 功能,包括會議摘要、文件生成、簡報整理等,快速提升員工生產力,同時,增強企業對 AI 應用的信心,為之後的應用深化做準備。

第二:協助企業規劃、打造與導入代理式 AI 應用服務。

「對於擁有豐沛結構化數據資料、知識庫的企業來說,除以生成式 AI 打造企業大腦,還會透過代理式 AI 提升自動化執行能力,重塑工作效率。」黃士培表示,勤英科技可以基於 Google Gemini Enterprise,提供含括底層雲端架構、AI 模型調度、資料治理與 AI Agent 串接等服務,讓企業員工可以自然語言安全調用企業資料,讓 Agent 進一步執行任務與推動流程。

舉例來說,勤英科技協助在台灣成立超過 50 年的製造業品牌商將 Gemini Enterprise 介接 SAP 與 Salesforce 訓練模型、建立可供 AI 調用的企業知識中樞;另在影音內容生成領域,勤英科技亦協助客戶導入 AI 自動化技術,將內容產製成本縮減達 90%。

第三:提供多模型聚合管理平台,滿足企業以 API 串連各種模型的需求。

勤英科技與新加坡 MixRoute 合作,提供企業客戶多模型管理平台,讓企業可以視需求彈性敏捷的調度 Gemini、Claude、OpenAI 等不同模型,並透過單一帳號、單一帳單與 Budget Alert 機制,管理 token 使用量與 AI 成本。

勤英科技_內文2.JPG
圖/ 數位時代

「透過我們提供的多模型管理平台,企業客戶不會被單一模型綁定,可以在模型快速疊代的環境下,更靈活地管理成本與算力資源。」黃士培如是說道。

總的來說,隨著 AI 應用從單點工具走向大規模企業部署,下一波競爭核心將從模型能力延伸至 AI 基礎設施管理能力,而這也是勤英科技從雲端代理走向 AI Infra 整合服務商背後的核心原因:當 AI 開始成為企業營運的一部分,企業需要的,已不只是模型供應商,而是能協助串接雲端、資料、Agent 與應用場景的長期技術夥伴。

有關更多勤英科技相關資訊,請查詢網站:https://www.elite.cloud/zh/

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓