GPT-4為何這麼強?輝達GPU如何助攻?OpenAI首席科學家、黃仁勳解密
GPT-4為何這麼強?輝達GPU如何助攻?OpenAI首席科學家、黃仁勳解密

由人工智慧OpenAI所打造的ChatGPT,風潮延燒全球,當中也用到不少繪圖晶片大廠輝達(NVIDIA)出產的GPU。執行長黃仁勳21日發表2023年的GTC大會演說時指出:「輝達的第一台DGX超級電腦,就是我親手交給OpenAI的。」

黃仁勳也在本屆GTC的議程中,與OpenAI聯合創始人暨首席科學家伊爾亞・蘇茨克維(Ilya Sutskever)開啟爐邊談話,雙方針對ChatGPT的誕生、訓練過程和未來願景進行對談。內容精華如下:

NVIDIA 創辦人暨執行長黃仁勳於GTC 2023回答媒體提問
NVIDIA 創辦人暨執行長黃仁勳於GTC 2023上,和OpenAI聯合創始人暨首席科學家Ilya Sutskever(伊爾亞‧蘇茨克維)開啟爐邊談話
圖/ 輝達提供

ChatGPT是如何誕生的?

黃仁勳(以下簡稱黃): 你為何知道深度學習未來會發揮作用?你當初為何會接觸呢?

Ilya Sutskever(以下簡稱Sutskever): 回到2003年,學習是一件人類可以做但電腦不能做的事情,甚至理論上能不能實現都不知道。因此我想,若能在深度學習上做出一些成績,可能會是人工智慧最大的進步。很幸運的是,我遇到Geoffrey Hinton(傑佛瑞.辛頓) 教授,他是在研究神經網路,因為神經網路是在學習平行處理運算,與大腦運作很相似。雖然還不太清楚如何讓它有作用,不過在當時,這已經是當時最可行的方向。

黃: 你剛開始研究時,運算的規模如何?

Sutskever: 其實當時沒人覺得規模很重要,因此人們訓練的只有50到100個神經元,100萬會被認為太龐大。當時我們在CPU上跑我們的數據,我們做了一些實驗,什麼都試看看。Hinton當時也認為用神經網路解一些數學問題非常有趣,這是生成模型的源頭。但隨後問題就出現:什麼應用才能真正推動技術進步?

OpenAI聯合創始人暨首席科學家IlyaSutskever
OpenAI聯合創始人暨首席科學家IlyaSutskever開始打造神經網路時,幾乎沒人關心這項領域。

黃: 你何時具體知道要建構視覺導向的網路神經運算,並參加電腦視覺競賽?

Sutskever: 在發展電腦視覺之前,我首先了解到監督式學習(Supervised learning)是我們的前進的方向 (編按:機器學習大致可分為三個方向,監督式學習、無監督式學習 與增強式學習;監督式學習指的是電腦從標籤化(labeled)的資訊中分析模式後做出預測,像是學習標準答案,可一邊修正去達到更精準的預測) 。這不僅僅是一種直覺,還是無法辯駁的前進方向。如果神經網路很深又強大,可以解決困難任務,關鍵字為「深」和「大」,但那時大家不關注神經網路。

大的神經網路能在面對問題時給予好的答案,但需要大量數據才能做到,不過,很明顯優化是一個瓶頸。當時 Hinton的另一個研究生James Martens取得突破,他突出一種不同的優化的做法,讓我們證明神經網路是可訓練的。

所以路徑就很清楚: 你找到一些數據,把它變大,訓練神經網路,然後你就能成功 。但下一個問題是要找什麼數據,答案就是ImageNet(大型視覺資料庫)。當時ImageNet看起來難度很高,但只要你有足夠算力用於ImageNet的數據,就會成功。

輝達GPU助攻!OpenAI如何茁壯?

黃: 那時候我們就開始攜手合作,你如何發現GPU是很有幫助的,但如何發生的,你沒和我說過?

Sutskever: Jeff Hinton教授告訴我們可以試試這個GPU,但一開始我們也沒搞懂要用在哪。接下來我們發現,ImageNet的數據及很適合用GPU來運算,速度很快,訓練規模前所未有。

Nvidia Hopper H100 GPU
輝達(NVIDIA)GPU助攻OpenAI,完成大量圖片運算。
圖/ Nvidia

黃: 你來到矽谷,和一些朋友創辦OpenAI,你對OpenAI最初的想法是什麼?你如何達到現在的成就?

Sutskever: 一開始,我們不是百分百知道如何推動,環境也和現在很不同。2015~2016年我們創業時,研究人員很少,只有100人,大部分人是從Google的DeepMind來的。

當時我第一個想法是透過壓縮數據,讓機器進行無監督學習(編按:機器在面對資料時,依照關聯性去歸類、找出潛在規則與套路等,不需事先以人力處理標籤,也不會判別資訊的正確性)。

這個技術拿到現在來看,會覺得很簡單,只要預先訓練就好,但在2016年時根本沒人知道怎麼做。臉書(Meta)首席人工智慧科學家楊立昆(Yann LeCun)當時還到處演講說是巨大挑戰。

時至今日,GPT不只可做到壓縮訓練數據(編按:GPT將大量的資訊壓縮,並進行歸類、找出潛在的規則);壓縮得好,甚至還能有效提取數據中隱藏的訊息。

也因為如此,在進一步發展後,我們在亞馬遜(Amazon)上預測下一則評論會出現的字詞,發現它具備預測能力,意味著可以發現數據中的秘密,這就是大家今天看到ChatGPT今天能做到的事:給它一些資訊,它能從中提煉和預測。

GPT-4
GPT-4基本建構在具備更佳預測能力模型之上,因此有更強大的功能。
圖/ shutterstock

黃: OpenAI寫了一篇論文談論訓練規模大小的重要性,哪個東西你預見會先出現?是GPT1、2和3,還是訓練大小的規模擴展?

Sutskever: 我有一個很強大的信念就是越大越好。在OpenAI,有個重要任務是:如何正確運用越來越大的訓練規模,以及如何精準運用?另一個目標就是強化學習,但你要拿它做什麼?

第一個在OpenAI完成的大專案,就是我們解決實戰遊戲Dota2,我們做了一個強化學習agent,讓它和自己對抗,目標是希望可和世界上最好的玩家競爭。

延伸閱讀:小孩子才做選擇!Nvidia佈局AI是「全都要」,黃仁勳怎麼搶GPU數兆美元商機?

GPT-4為何這麼強?

黃: ChatGPT是最簡單的應用程式,任何人都可以用。GPT-4在很多領域表現都令人驚艷,在很多測試中都領先了人類能做到的水準,GPT-4為何能有如此大的進步?

Sutskever: GPT-4在很多維度做了改變,它建立在有更好預測能力的基礎之上,當神經網路越能預測下一個字詞,相對來說也代表更理解文本的內容。

例如偵探小說中有很多難的字、事件、線索,當最後要揭曉誰是犯人時,有很多預測結果,但透過更了解文本,就能更精確的預測字詞(誰是犯人),這就是為什麼GPT-4功能更強大。

黃: ChatGPT會希望問問題的人先給予一些先備知識再給予回答,所以ChatGPT已具備內建的推理能力?

Sutskever: 某些程度上是,但現在神經網路的推理結果還不太可靠,有時候這些神經網路會有幻想,或做出人類不太會犯的錯誤,降低他們的用處。但我認為繼續做一些研究,能達到更高的可信度,使模型學會要問得更清楚再回答。

黃: 我之前看到GPT-4在維基百科頁面做檢索,GPT-4是否能在既存的事實資料中做檢索,印證其所推論得結果呢?

Sutskever: 目前發布的GPT-4沒有檢索能力,他只是很好的預測字詞工具。雖然GPT-4現在沒有支援檢索,但完全具備這樣的能力,能透過檢索讓答案變得更好。

延伸閱讀:AI的iPhone時刻來了,黃仁勳端出「核彈級」產品助攻!台積電2奈米也有AI

AI將持續震驚人類

黃: 有時候我們說「great(好)」或是「sick(生病、厭倦)」,可能會因誤情況不同產生不同語境,AI可以通過音頻等進行模型學習嗎?

Sutskever: 可以,影片很有用。

黃: 未來AI會自己訓練自己嗎?

Sutskever: 這個可能性仍有待觀察。

黃: AI未來最讓你興奮的地方在哪?

Sutskever: 預測是很難的,尤其對太具體的事。我認為這個領域會持續進步,我們將繼續看到AI持續震驚人類。AI未來絕對會達到可以讓人完全信賴,在它不懂時,將會開口要求更多資訊,這是人工智慧未來進步的一大關鍵。

黃: GPT-4什麼東西讓你驚訝?

Sutskever: 他展示很多很酷的東西,令人驚奇。首先,GPT-4可靠的程度令人驚艷。之前問問題,ChatGPT可能會用愚蠢的方式誤解,但GPT-4不會。

其次,GPT-4解決數學問題的能力超強大。很多人也注意到,它可以用一個字母開頭寫詩,很清晰遵循指令。在視覺方面我喜歡他如何解釋迷因圖等笑話。

延伸閱讀:憑一顆AI晶片,耐能打入高通!助AI運算能力提高4倍,這家新創什麼來頭?

責任編輯:林美欣

往下滑看下一篇文章
屹立43 年專注標準電源,明緯企業如何以自身優勢並結合創新戰略,實現百年標竿企業的願景
屹立43 年專注標準電源,明緯企業如何以自身優勢並結合創新戰略,實現百年標竿企業的願景

明緯企業(MEAN WELL)成立於1982年,總部位於台灣新北產業園區,是全球少數專注於標準電源供應器的品牌製造商,產品功率含括0.5W~30000W,符合國際安規,被廣泛應用於工控、醫療、資通訊等多種產業;歷經43年的努力,明緯企業不僅在全球各地設立18個銷售辦公室,更設置3個研發中心、5個生產據點、8個物流倉儲、9個技術支援中心,同時,串連全球超過260家經銷夥伴,以「快速交付、安全可靠、隨時可得」的品牌承諾累積服務超過上萬家企業客戶數,穩居全球標準電源市場領導地位。

以客戶需求為核心,明緯企業3策略形塑差異化競爭力

2025年4月,市場研究機構Micro Technology Consultant公布全球電源供應器製造商排名,明緯企業名列第五,與前四名倚賴OEM/ODM模式的電源廠不同,明緯企業是榜上唯一以自有品牌–MEAN WELL–在市場上脫穎而出的企業,背後的三大關鍵策略是:

第一:持續優化標準化產品。明緯企業技服中心課長謝正堂表示:「我們不僅與時俱進的提供多元產品選擇,更專注於精進產品功能與取得最多國際認證,例如今年推出的XDR系列導軌型電源供應器的功率密度便較前一代提升80%以上,目標是讓客戶可以快速取得高性價比的即用型產品。」也因如此,明緯企業不僅提供AC/DC 電源供應器、DC/DC 轉換器、LED 驅動電源、導軌型與基板型電源、電池充電器與逆變器、UPS與電源管理模組、特殊應用電源與周邊配件等標準化產品,更因應工業控制、LED照明、醫療、交通與綠能等跨產業需求取得相應的國際認證,同時,以自動化生產機制進行規模量產以確保成本競爭力。

明緯企業技服中心課長謝正堂
明緯企業技服中心課長謝正堂
圖/ 明緯企業

第二:完善全球經銷網絡與提供在地化支援服務。明緯企業除在全球9個國家設立分公司與辦事處,更與歐、美、亞超過260家經銷商締結深厚的合作關係,由其提供產品銷售、維修與服務,讓企業客戶快速取得所需產品,放心且安心的應用在各個領域。

明緯
明緯企業集團分佈圖
圖/ 明緯

第三:透過虛實整合服務快速回應市場需求。明緯企業除透過官方網站提供完整的產品資訊,如產品型錄與規格書、技術文件、安裝手冊、認證與檢驗資訊,以及產品壽命與相容性資訊等,更於2020年8月推出線上展覽館,讓客戶可以從三大產品範疇、12個展覽館快速找到產品資訊,此外,還可透過線上產品諮詢,大幅提升選購體驗並縮短採購流程,讓企業客戶可以快速因應市場需求變化。

明緯
線上展覽館
圖/ 明緯

「透過可接受少量多樣的標準化產品、全球經銷網絡,以及虛實整合的服務能量,我們不僅形塑品牌信譽,也墊高了同業競爭者的進入門檻,成功以差異化產品服務引領市場發展。」謝正堂如是總結。

不僅提供標準化產品,更協助經銷商轉型為智慧解決方案供應商、滿足客戶創新需求

值得特別注意的是,明緯企業除提供適用於各產業的標準化電源產品,更因應市場需求、攜手經銷商夥伴提供產業所需的解決方案。謝正堂進一步解釋,隨著智慧化產業發展,企業不僅需要標準品,更期望明緯企業與經銷夥伴可以提供完整的解決方案,因此,明緯企業除在廠內實作綠能、儲能系統與智慧燈控等場域,今(2025)年,更進一步協助經銷商夥伴轉型,以協作機器人、智慧自動化工廠、智慧家居、智慧商辦、智慧燈控,以及移動式儲能系統電源等解決方案滿足市場需求。「今年,我們的經銷商–耀毅企業、永鉅電機與中和碁電–將前進2025台灣機器人與智慧自動化展,展示自動化、綠能科技與其他智慧解決方案,協助更多企業智贏未來。」

除透過參展等方式讓全球客戶了解明緯企業與經銷夥伴可以提供智慧解決方案,明緯企業亦積極透過線上展覽館等方式展示以機架式電源(Rack Power)、模組式電源(Modular Power)、系統電源(System Power)三大產品線搭配其他產品,如控制器、智慧管理設備與介面配件等,以「3+N」的概念讓智慧解決方案可以依造客戶需求整合電源模組、控制器、監控與智慧通信等功能。

明緯擁有超過一萬種標準電源機型與全球當地專業技術服務團隊,透過相關技術諮詢服務,可依客戶應用需求提供產品與組合式系統解決方案。

3+N產品涵蓋模組電源、機架式電源、機櫃系統電源等產品,結合數位智能控制器或搭配超過一萬種標準電源機型組合應用,提供多產業應用。

展望未來,明緯企業將持續攜手全球經銷夥伴,以安全可靠、即取即用的高品質電源方案,引領全球標準電源市場潮流,打造共創、共榮、共贏的永續生態系。

了解更多MEAN WELL合作夥伴
立即看線上展覽館

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓