GPT-4為何這麼強?輝達GPU如何助攻?OpenAI首席科學家、黃仁勳解密
GPT-4為何這麼強?輝達GPU如何助攻?OpenAI首席科學家、黃仁勳解密

由人工智慧OpenAI所打造的ChatGPT,風潮延燒全球,當中也用到不少繪圖晶片大廠輝達(NVIDIA)出產的GPU。執行長黃仁勳21日發表2023年的GTC大會演說時指出:「輝達的第一台DGX超級電腦,就是我親手交給OpenAI的。」

黃仁勳也在本屆GTC的議程中,與OpenAI聯合創始人暨首席科學家伊爾亞・蘇茨克維(Ilya Sutskever)開啟爐邊談話,雙方針對ChatGPT的誕生、訓練過程和未來願景進行對談。內容精華如下:

NVIDIA 創辦人暨執行長黃仁勳於GTC 2023回答媒體提問
NVIDIA 創辦人暨執行長黃仁勳於GTC 2023上,和OpenAI聯合創始人暨首席科學家Ilya Sutskever(伊爾亞‧蘇茨克維)開啟爐邊談話
圖/ 輝達提供

ChatGPT是如何誕生的?

黃仁勳(以下簡稱黃): 你為何知道深度學習未來會發揮作用?你當初為何會接觸呢?

Ilya Sutskever(以下簡稱Sutskever): 回到2003年,學習是一件人類可以做但電腦不能做的事情,甚至理論上能不能實現都不知道。因此我想,若能在深度學習上做出一些成績,可能會是人工智慧最大的進步。很幸運的是,我遇到Geoffrey Hinton(傑佛瑞.辛頓) 教授,他是在研究神經網路,因為神經網路是在學習平行處理運算,與大腦運作很相似。雖然還不太清楚如何讓它有作用,不過在當時,這已經是當時最可行的方向。

黃: 你剛開始研究時,運算的規模如何?

Sutskever: 其實當時沒人覺得規模很重要,因此人們訓練的只有50到100個神經元,100萬會被認為太龐大。當時我們在CPU上跑我們的數據,我們做了一些實驗,什麼都試看看。Hinton當時也認為用神經網路解一些數學問題非常有趣,這是生成模型的源頭。但隨後問題就出現:什麼應用才能真正推動技術進步?

OpenAI聯合創始人暨首席科學家IlyaSutskever
OpenAI聯合創始人暨首席科學家IlyaSutskever開始打造神經網路時,幾乎沒人關心這項領域。

黃: 你何時具體知道要建構視覺導向的網路神經運算,並參加電腦視覺競賽?

Sutskever: 在發展電腦視覺之前,我首先了解到監督式學習(Supervised learning)是我們的前進的方向 (編按:機器學習大致可分為三個方向,監督式學習、無監督式學習 與增強式學習;監督式學習指的是電腦從標籤化(labeled)的資訊中分析模式後做出預測,像是學習標準答案,可一邊修正去達到更精準的預測) 。這不僅僅是一種直覺,還是無法辯駁的前進方向。如果神經網路很深又強大,可以解決困難任務,關鍵字為「深」和「大」,但那時大家不關注神經網路。

大的神經網路能在面對問題時給予好的答案,但需要大量數據才能做到,不過,很明顯優化是一個瓶頸。當時 Hinton的另一個研究生James Martens取得突破,他突出一種不同的優化的做法,讓我們證明神經網路是可訓練的。

所以路徑就很清楚: 你找到一些數據,把它變大,訓練神經網路,然後你就能成功 。但下一個問題是要找什麼數據,答案就是ImageNet(大型視覺資料庫)。當時ImageNet看起來難度很高,但只要你有足夠算力用於ImageNet的數據,就會成功。

輝達GPU助攻!OpenAI如何茁壯?

黃: 那時候我們就開始攜手合作,你如何發現GPU是很有幫助的,但如何發生的,你沒和我說過?

Sutskever: Jeff Hinton教授告訴我們可以試試這個GPU,但一開始我們也沒搞懂要用在哪。接下來我們發現,ImageNet的數據及很適合用GPU來運算,速度很快,訓練規模前所未有。

Nvidia Hopper H100 GPU
輝達(NVIDIA)GPU助攻OpenAI,完成大量圖片運算。
圖/ Nvidia

黃: 你來到矽谷,和一些朋友創辦OpenAI,你對OpenAI最初的想法是什麼?你如何達到現在的成就?

Sutskever: 一開始,我們不是百分百知道如何推動,環境也和現在很不同。2015~2016年我們創業時,研究人員很少,只有100人,大部分人是從Google的DeepMind來的。

當時我第一個想法是透過壓縮數據,讓機器進行無監督學習(編按:機器在面對資料時,依照關聯性去歸類、找出潛在規則與套路等,不需事先以人力處理標籤,也不會判別資訊的正確性)。

這個技術拿到現在來看,會覺得很簡單,只要預先訓練就好,但在2016年時根本沒人知道怎麼做。臉書(Meta)首席人工智慧科學家楊立昆(Yann LeCun)當時還到處演講說是巨大挑戰。

時至今日,GPT不只可做到壓縮訓練數據(編按:GPT將大量的資訊壓縮,並進行歸類、找出潛在的規則);壓縮得好,甚至還能有效提取數據中隱藏的訊息。

也因為如此,在進一步發展後,我們在亞馬遜(Amazon)上預測下一則評論會出現的字詞,發現它具備預測能力,意味著可以發現數據中的秘密,這就是大家今天看到ChatGPT今天能做到的事:給它一些資訊,它能從中提煉和預測。

GPT-4
GPT-4基本建構在具備更佳預測能力模型之上,因此有更強大的功能。
圖/ shutterstock

黃: OpenAI寫了一篇論文談論訓練規模大小的重要性,哪個東西你預見會先出現?是GPT1、2和3,還是訓練大小的規模擴展?

Sutskever: 我有一個很強大的信念就是越大越好。在OpenAI,有個重要任務是:如何正確運用越來越大的訓練規模,以及如何精準運用?另一個目標就是強化學習,但你要拿它做什麼?

第一個在OpenAI完成的大專案,就是我們解決實戰遊戲Dota2,我們做了一個強化學習agent,讓它和自己對抗,目標是希望可和世界上最好的玩家競爭。

延伸閱讀:小孩子才做選擇!Nvidia佈局AI是「全都要」,黃仁勳怎麼搶GPU數兆美元商機?

GPT-4為何這麼強?

黃: ChatGPT是最簡單的應用程式,任何人都可以用。GPT-4在很多領域表現都令人驚艷,在很多測試中都領先了人類能做到的水準,GPT-4為何能有如此大的進步?

Sutskever: GPT-4在很多維度做了改變,它建立在有更好預測能力的基礎之上,當神經網路越能預測下一個字詞,相對來說也代表更理解文本的內容。

例如偵探小說中有很多難的字、事件、線索,當最後要揭曉誰是犯人時,有很多預測結果,但透過更了解文本,就能更精確的預測字詞(誰是犯人),這就是為什麼GPT-4功能更強大。

黃: ChatGPT會希望問問題的人先給予一些先備知識再給予回答,所以ChatGPT已具備內建的推理能力?

Sutskever: 某些程度上是,但現在神經網路的推理結果還不太可靠,有時候這些神經網路會有幻想,或做出人類不太會犯的錯誤,降低他們的用處。但我認為繼續做一些研究,能達到更高的可信度,使模型學會要問得更清楚再回答。

黃: 我之前看到GPT-4在維基百科頁面做檢索,GPT-4是否能在既存的事實資料中做檢索,印證其所推論得結果呢?

Sutskever: 目前發布的GPT-4沒有檢索能力,他只是很好的預測字詞工具。雖然GPT-4現在沒有支援檢索,但完全具備這樣的能力,能透過檢索讓答案變得更好。

延伸閱讀:AI的iPhone時刻來了,黃仁勳端出「核彈級」產品助攻!台積電2奈米也有AI

AI將持續震驚人類

黃: 有時候我們說「great(好)」或是「sick(生病、厭倦)」,可能會因誤情況不同產生不同語境,AI可以通過音頻等進行模型學習嗎?

Sutskever: 可以,影片很有用。

黃: 未來AI會自己訓練自己嗎?

Sutskever: 這個可能性仍有待觀察。

黃: AI未來最讓你興奮的地方在哪?

Sutskever: 預測是很難的,尤其對太具體的事。我認為這個領域會持續進步,我們將繼續看到AI持續震驚人類。AI未來絕對會達到可以讓人完全信賴,在它不懂時,將會開口要求更多資訊,這是人工智慧未來進步的一大關鍵。

黃: GPT-4什麼東西讓你驚訝?

Sutskever: 他展示很多很酷的東西,令人驚奇。首先,GPT-4可靠的程度令人驚艷。之前問問題,ChatGPT可能會用愚蠢的方式誤解,但GPT-4不會。

其次,GPT-4解決數學問題的能力超強大。很多人也注意到,它可以用一個字母開頭寫詩,很清晰遵循指令。在視覺方面我喜歡他如何解釋迷因圖等笑話。

延伸閱讀:憑一顆AI晶片,耐能打入高通!助AI運算能力提高4倍,這家新創什麼來頭?

責任編輯:林美欣

往下滑看下一篇文章
從「製造中心」到「亞洲NASDAQ」!詹文男揭示創新籌資平臺的附加價值與關鍵策略建議
從「製造中心」到「亞洲NASDAQ」!詹文男揭示創新籌資平臺的附加價值與關鍵策略建議

面對國際地緣政治的「去風險化」浪潮之下,長期觀察臺灣產業發展趨勢的數位轉型學院院長詹文男建議,臺灣不能再依賴單一的製造能力來換取戰略保障,而是將國家戰略從「製造中心」升級為「技術與系統整合」的樞紐。

在此背景下,金管會、證交所與櫃買中心共同成立的亞洲創新籌資平臺,詹文男觀察該平臺的價值,絕不僅是為資本市場引進活水,更能放大產業附加價值,成為驅動臺灣產業整合的關鍵引擎,打造下一波更多護國群山。

亞洲創新籌資平臺可望創造的三個附加價值

亞洲創新籌資平臺的核心宗旨,希望在臺灣本土打造「亞洲的NASDAQ」市場板塊,詹文男認為除了「籌資」的任務之外,其實平臺更可以扮演產業轉型的重要角色,進一步擴大其附加價值,其中可以體現於以下三個面向。

首先是先前美國商務部長提出「美臺晶片產能五五分」的主張,詹文男認為臺灣不能只靠單一「矽盾」作為我國戰略的屏障,也就是調整「重製造、輕解決方案」的現狀,讓製造轉向技術及解決方案的綜合發展,成為我國的新籌碼。隨著亞洲創新籌資平臺的建立,加上精進創新板上市及交易制度,開放當沖交易,提升創新板規模及流動性,都能讓更多具備利基技術的企業有機會進入資本市場。

第二個是亞洲創新籌資平臺能成為「軟硬整合」與「以大帶小」的創新引擎。詹文男指出,臺灣有數家市場領頭的電子硬體製造商代表,亞洲創新籌資平臺能進一步驅動這類科技業者與新創企業合作,例如以大帶小模式,當新創技術獲得大廠的認可,進而藉助大廠的商業人脈,打進全球大型客戶的供應鏈合作網絡,讓新創開發的技術方案與服務,有更多機會在全球落地。

詹文男認為第三個附加價值,有助於加速中小企業的AI轉型及數位化落地。他觀察臺灣多數中小企業仍處「數位化」階段,加上目前政府積極推動「百工百業用AI」,當越多加入創新板的企業推出類似AI as a Service的解決方案,能讓資源相對不足的中小企業,以較低門檻、不需高成本導入AI解決方案,又為新創企業帶來實際營收。「此模式促使新創和中小企業的Win-Win局面,同時驅動產業朝向AI轉型的助力,」詹文男補充道。

勿為上市而上市!登板企業應具備「全球思維」與「治理韌性」

不過對於渴望進入資本市場的創新經營團隊,詹文男院長也提醒,切忌把「募資作為單一手段,上市視作唯一目標」。詹文男提供企業創辦者幾個思考方向,第一是確立全球市場目標,臺灣可當成實地試驗(Field Try)和建立最佳實踐(Best Practice)的試煉場,但也建議新創在發展初期以全世界市場為目標,募資的規劃也可以從全球市場的角度出發,確保產品應用在國際市場獲得青睞。

第二是提升透明度與公司治理能力。上市後,投資人會高度關心公司治理及獲利能力,若要提升流動性,新創必須加強企業的透明度。因此詹文男院長強調,千萬不要「為上市而上市」,而是要有一個完整的規劃並依據目標按部就班,資本市場會給予相對的回饋。另外他也建議平臺針對上市前的企業,能提供「治理的輔導」,而非僅是「程序上的協助」,協助新創導入更健全管理制度。

建構亞洲NASDAQ的驅動引擎,給平臺的三大策略建議

因應亞洲創新籌資平臺成立後,迎來創新板交易制度改革、放寬外國企業上市櫃規範、帶動轉板彈性、鼓勵大眾參與等多項舉措。在此基礎之上,詹文男分享三大策略建議,期許平臺日後運作持續成長茁壯。

首先是強化非傳統資訊揭露,提升市場流動性。詹文男觀察創新板企業多處早期發展階段,傳統財報資訊較不足,導致降低投資人進場意願。為了強化流動性,他建議主管機關要求企業揭露更多反映成長性的實質指標,例如使用者數據、研發進度、商轉里程碑或專利成果。透過降低資訊不對稱,以活絡交易量。

第二個建議是建立研究報告體系,深化產業洞察。由於創新板企業的研究報告仍稀少,導致價格難以反映基本面,降低機構投資人的參與意願。詹文男認為平臺可透過獎勵機制、研究補助或資料庫資源的方式,邀請投信、券商或研究機構成立專責團隊,藉由定期提供具產業洞見的研究報告給投資人參考。

第三個方向是促進制度國際化,吸引跨國創新企業來臺上市。詹文男表示,「亞洲創新籌資平臺不僅是鼓勵臺灣企業在地上市,也希望吸引國際創新企業走進來。除了持續制度鬆綁開放,也要讓制度與流程國際化。」他舉例,推動跨境申報文件與流程的全面英語化、提供具預測的審查流程、以及稅務制度透明化,讓臺灣在全球資本競爭持續脫穎而出。

對於亞洲創新籌資平臺的最終期許,詹文男認為其價值可從「募資導向」轉向「品牌導向」。一方面讓全球瞭解臺灣除了半導體之外,還有領先的解決方案,進而建立起全球市場對我國產業的信任;另一方面,強化「說故事」能力,讓登板的企業協助全球打造AI及ESG「雙軸轉型」,進而建立起嶄新的國家形象。透過上述的努力,相信臺灣將能持續造山,確保下一波的護國群山如春筍般持續成長茁壯!

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓