黃仁勳,這位手臂上有刺青、愛穿黑色皮衣的創業家,自 30 歲那年創立輝達以來,二十多年間經歷晶片半導體領域的起起落落。截至目前為止,在美國市值一兆美元以上的公司裡,輝達是唯一一家曾兩次從高點下跌超過 85%的公司。
在標準電腦架構中,一個被稱為「中央處理器」( central processing unit, CPU)的微晶片承擔大部分工作。程式設計師編寫程式,這些程式將數學問題交給 CPU,後者一次產生一個解決方案。幾十年來, CPU 的主要製造商是英特爾,英特爾曾多次試圖將輝達逼出市場。黃仁勳說:「我絕不接近英特爾,」他形容他們之間的關係就像貓和老鼠:「每當他們靠近我們,我就抓起我的晶片跑掉。」
黃仁勳決定用差異化產品與巨頭競爭,那就是「圖形處理器」( graphics-processing unit,GPU)。 1999 年,輝達在上市後不久推出一款名為 GeForce 的顯示卡,也就是後人常說的GPU。與通用的 CPU 不同, GPU 將複雜的數學任務分解為一系列較小的計算任務,然後以平行運算的方法同時處理所有任務。
CPU 就像一輛運送貨物的卡車,一次只能送出一個包裹;GPU 則像是一個遍布整個城市的摩托車隊。正是基於這種特性, GPU 可以完成複雜的運算,這是加密貨幣市場、深度神經網路以及大螢幕上呈現絢麗色彩所必需的。同樣的,這些科技可以讓殘酷的射擊遊戲無比逼真,讓自動駕駛汽車在沒有協助的情況下做出 S 形拐彎。它們可以賦予電腦視力、聽力、理解能力和學習能力。
很快的,一群人工智慧研究員發現輝達 GPU 在訓練神經網路過程中的潛力。 2012 年,辛頓(編按:Geoffrey Hinton,有AI教父之稱)帶領兩位愛徒艾力克斯.克里澤夫斯基和伊爾亞.蘇茨克維推出 AlexNet。相較於 Google用 1 萬 6000 顆 CPU, AlexNet 只用 4 顆輝達 GPU,在學術界和產業界引發轟動。 AlexNet完成電腦視覺領域的巨大突破,它成功證明深度神經網路(DNN)可以有效對許多物件進行分類,而增加訓練資料量可以提高 DNN 的有效性。開發和訓練這些神經網路需要大量運算資源,而且使用大規模並行的 GPU 訓練模型的時間,比單獨使用多核 CPU 訓練模型的時間更短。
黃仁勳敏銳意識到,輝達下一個成長機會在人工智慧領域。黃仁勳打賭輝達的電腦晶片可以成為人工智慧的大腦,他決定將所有的籌碼放上賭桌。黃仁勳後來回憶:「我們有幸退後一步,問自己這對電腦的未來意味著什麼。我們得出正確的結論,這將改變運算方式,這將改變軟體編寫方式,這將改變我們可以編寫的應用程式類型。」
黃仁勳開始積極布局針對人工智慧的 GPU。輝達差不多花 5 年時間製作出 DGX,這個GPU 重達 317.5 公斤,黃仁勳把它形容為一輛電動汽車。馬斯克聽說這個消息後,找到黃仁勳,表示 OpenAI 想要一個這樣的 GPU。於是,在 2016 年 8 月的一天,黃仁勳造訪 OpenAI在舊金山的辦公室。他在一間會議室裡將這台超級電腦(屬於最新推出的 DGX-1 系列)親手交給馬斯克。
那一刻,黃仁勳突發奇想,隨手拿起一支馬克筆,在這台超級電腦的機身上寫道:「為了伊隆和 OpenAI 團隊!為了電腦和人類的未來!我將世界上第一台 DGX-1 作為禮物送給你們!」寫完後,他把筆交給馬斯克和圍過來的 OpenAI 團隊成員,所有人逐一在主機殼上簽名。
當天晚上, 馬斯克在 Twitter 上寫道:「十分感謝輝達和 Jensen。(黃仁勳的英名名)將第一台 DGX-1 超級電腦捐給 OpenAI,以推動 AI 科技的普及。」
DGX-1 超級電腦擁有高達 170 TFLOPS 的半精度浮點運算能力,較當於 250 台傳統伺服器,可以將深度學習的訓練速度加快 75 倍,使 CPU 性能提升 56 倍,報價 12.9 萬美元。根據黃仁勳的介紹,這個產品由 3000 人耗時 3 年時間研發出來,開發成本巨大。黃仁勳稱:「如果這個計畫只是為了打造一台這樣的超級電腦,那麼這個計畫的成本將高達 20 億美元。」
當時 OpenAI 和輝達都沒有解釋這台超級電腦的準確用途。但輝達聲稱, DGX-1 是為了處理深度學習等 AI 問題而量身打造的超級電腦。黃仁勳提到:「世界上第一台專為 AI 打造的超級電腦即將落腳在一家專注於開放式 AI 研究的實驗室,簡直是天作之合。」
此後幾年,隨著利用 GPU 訓練大模型成為產業共識,愈來愈多的公司開始追逐高端 GPU,導致 GPU 奇缺。馬斯克曾說,現在它們「非常難搞」。這些晶片成為淘金熱的鎬和鏟。
2022 年,黃仁勳第一次嘗試使用 ChatGPT,他讓它寫一首關於輝達的詩。ChatGPT 回覆的結果讓他很滿意:
輝達迎接挑戰。
憑藉強大的 GPU 和人工智慧,
正在拓展科技的邊界。
看到這首詩,黃仁勳開心的笑了,他知道自己賭對了。
隨著 AI 訓練的最大規模大約每 6 個月增加一倍,輝達成為這場戰爭裡唯一的「軍火商」。幾年後,隨著 ChatGPT 的走紅和輝達市值突破 3 兆美元(截至 2024 年 10 月),馬斯克和黃仁勳出神的看著這台超級電腦的照片在網路上流傳,背後是奧特曼寫在牆上的那句名言。那句名言的後半句是:「我們每個人都有責任把世界的命運寄託在自己身上。」
時代的鐘聲從遠處傳來,當演算法(Transformer模型)、算力(輝達)和資料(網際網路)都萬事俱備的時候,一扇新時代的大門打開。
奧特曼後來回憶,在一個夏日涼爽的黃昏時分, OpenAI 研究團隊完成一個關於規模法則的實驗,這個實驗呈現出用於訓練人工智慧的運算能力與其結果能力之間的關係,並產生一系列「完美、平滑的曲線」,這些指數曲線看起來更像是宇宙基本定律,而不是實驗數據。
奧特曼和一群研究人員走到辦公室外,望著遠處的夕陽。他們共同意識到,通用人工智慧不僅可能實現,而且它的來臨可能比先前預期要快得多。奧特曼後來回憶說:
我們都在想,這一切真的會發生,不是嗎?
這就像是科學史上的一個轉捩點。
我們已經洞悉一種全新的事物,即將向全人類宣告它的來臨。
本文授權轉載自 《奧特曼傳:OpenAI執行長開啟生成式AI變革時代》,周恒星著,天下文化出版
延伸閱讀:白話科技|Vibe coding、MCP是什麼意思?AI詞彙懶人包:NLP、神經網路⋯一次看懂
OpenAI釋出GPT-4.5 !比4o貴30倍、更高EQ⋯模型特色一次整理