GPT-4為何這麼強?輝達GPU如何助攻?OpenAI首席科學家、黃仁勳解密
GPT-4為何這麼強?輝達GPU如何助攻?OpenAI首席科學家、黃仁勳解密

由人工智慧OpenAI所打造的ChatGPT,風潮延燒全球,當中也用到不少繪圖晶片大廠輝達(NVIDIA)出產的GPU。執行長黃仁勳21日發表2023年的GTC大會演說時指出:「輝達的第一台DGX超級電腦,就是我親手交給OpenAI的。」

黃仁勳也在本屆GTC的議程中,與OpenAI聯合創始人暨首席科學家伊爾亞・蘇茨克維(Ilya Sutskever)開啟爐邊談話,雙方針對ChatGPT的誕生、訓練過程和未來願景進行對談。內容精華如下:

NVIDIA 創辦人暨執行長黃仁勳於GTC 2023回答媒體提問
NVIDIA 創辦人暨執行長黃仁勳於GTC 2023上,和OpenAI聯合創始人暨首席科學家Ilya Sutskever(伊爾亞‧蘇茨克維)開啟爐邊談話
圖/ 輝達提供

ChatGPT是如何誕生的?

黃仁勳(以下簡稱黃): 你為何知道深度學習未來會發揮作用?你當初為何會接觸呢?

Ilya Sutskever(以下簡稱Sutskever): 回到2003年,學習是一件人類可以做但電腦不能做的事情,甚至理論上能不能實現都不知道。因此我想,若能在深度學習上做出一些成績,可能會是人工智慧最大的進步。很幸運的是,我遇到Geoffrey Hinton(傑佛瑞.辛頓) 教授,他是在研究神經網路,因為神經網路是在學習平行處理運算,與大腦運作很相似。雖然還不太清楚如何讓它有作用,不過在當時,這已經是當時最可行的方向。

黃: 你剛開始研究時,運算的規模如何?

Sutskever: 其實當時沒人覺得規模很重要,因此人們訓練的只有50到100個神經元,100萬會被認為太龐大。當時我們在CPU上跑我們的數據,我們做了一些實驗,什麼都試看看。Hinton當時也認為用神經網路解一些數學問題非常有趣,這是生成模型的源頭。但隨後問題就出現:什麼應用才能真正推動技術進步?

OpenAI聯合創始人暨首席科學家IlyaSutskever
OpenAI聯合創始人暨首席科學家IlyaSutskever開始打造神經網路時,幾乎沒人關心這項領域。

黃: 你何時具體知道要建構視覺導向的網路神經運算,並參加電腦視覺競賽?

Sutskever: 在發展電腦視覺之前,我首先了解到監督式學習(Supervised learning)是我們的前進的方向 (編按:機器學習大致可分為三個方向,監督式學習、無監督式學習 與增強式學習;監督式學習指的是電腦從標籤化(labeled)的資訊中分析模式後做出預測,像是學習標準答案,可一邊修正去達到更精準的預測) 。這不僅僅是一種直覺,還是無法辯駁的前進方向。如果神經網路很深又強大,可以解決困難任務,關鍵字為「深」和「大」,但那時大家不關注神經網路。

大的神經網路能在面對問題時給予好的答案,但需要大量數據才能做到,不過,很明顯優化是一個瓶頸。當時 Hinton的另一個研究生James Martens取得突破,他突出一種不同的優化的做法,讓我們證明神經網路是可訓練的。

所以路徑就很清楚: 你找到一些數據,把它變大,訓練神經網路,然後你就能成功 。但下一個問題是要找什麼數據,答案就是ImageNet(大型視覺資料庫)。當時ImageNet看起來難度很高,但只要你有足夠算力用於ImageNet的數據,就會成功。

輝達GPU助攻!OpenAI如何茁壯?

黃: 那時候我們就開始攜手合作,你如何發現GPU是很有幫助的,但如何發生的,你沒和我說過?

Sutskever: Jeff Hinton教授告訴我們可以試試這個GPU,但一開始我們也沒搞懂要用在哪。接下來我們發現,ImageNet的數據及很適合用GPU來運算,速度很快,訓練規模前所未有。

Nvidia Hopper H100 GPU
輝達(NVIDIA)GPU助攻OpenAI,完成大量圖片運算。
圖/ Nvidia

黃: 你來到矽谷,和一些朋友創辦OpenAI,你對OpenAI最初的想法是什麼?你如何達到現在的成就?

Sutskever: 一開始,我們不是百分百知道如何推動,環境也和現在很不同。2015~2016年我們創業時,研究人員很少,只有100人,大部分人是從Google的DeepMind來的。

當時我第一個想法是透過壓縮數據,讓機器進行無監督學習(編按:機器在面對資料時,依照關聯性去歸類、找出潛在規則與套路等,不需事先以人力處理標籤,也不會判別資訊的正確性)。

這個技術拿到現在來看,會覺得很簡單,只要預先訓練就好,但在2016年時根本沒人知道怎麼做。臉書(Meta)首席人工智慧科學家楊立昆(Yann LeCun)當時還到處演講說是巨大挑戰。

時至今日,GPT不只可做到壓縮訓練數據(編按:GPT將大量的資訊壓縮,並進行歸類、找出潛在的規則);壓縮得好,甚至還能有效提取數據中隱藏的訊息。

也因為如此,在進一步發展後,我們在亞馬遜(Amazon)上預測下一則評論會出現的字詞,發現它具備預測能力,意味著可以發現數據中的秘密,這就是大家今天看到ChatGPT今天能做到的事:給它一些資訊,它能從中提煉和預測。

GPT-4
GPT-4基本建構在具備更佳預測能力模型之上,因此有更強大的功能。
圖/ shutterstock

黃: OpenAI寫了一篇論文談論訓練規模大小的重要性,哪個東西你預見會先出現?是GPT1、2和3,還是訓練大小的規模擴展?

Sutskever: 我有一個很強大的信念就是越大越好。在OpenAI,有個重要任務是:如何正確運用越來越大的訓練規模,以及如何精準運用?另一個目標就是強化學習,但你要拿它做什麼?

第一個在OpenAI完成的大專案,就是我們解決實戰遊戲Dota2,我們做了一個強化學習agent,讓它和自己對抗,目標是希望可和世界上最好的玩家競爭。

延伸閱讀:小孩子才做選擇!Nvidia佈局AI是「全都要」,黃仁勳怎麼搶GPU數兆美元商機?

GPT-4為何這麼強?

黃: ChatGPT是最簡單的應用程式,任何人都可以用。GPT-4在很多領域表現都令人驚艷,在很多測試中都領先了人類能做到的水準,GPT-4為何能有如此大的進步?

Sutskever: GPT-4在很多維度做了改變,它建立在有更好預測能力的基礎之上,當神經網路越能預測下一個字詞,相對來說也代表更理解文本的內容。

例如偵探小說中有很多難的字、事件、線索,當最後要揭曉誰是犯人時,有很多預測結果,但透過更了解文本,就能更精確的預測字詞(誰是犯人),這就是為什麼GPT-4功能更強大。

黃: ChatGPT會希望問問題的人先給予一些先備知識再給予回答,所以ChatGPT已具備內建的推理能力?

Sutskever: 某些程度上是,但現在神經網路的推理結果還不太可靠,有時候這些神經網路會有幻想,或做出人類不太會犯的錯誤,降低他們的用處。但我認為繼續做一些研究,能達到更高的可信度,使模型學會要問得更清楚再回答。

黃: 我之前看到GPT-4在維基百科頁面做檢索,GPT-4是否能在既存的事實資料中做檢索,印證其所推論得結果呢?

Sutskever: 目前發布的GPT-4沒有檢索能力,他只是很好的預測字詞工具。雖然GPT-4現在沒有支援檢索,但完全具備這樣的能力,能透過檢索讓答案變得更好。

延伸閱讀:AI的iPhone時刻來了,黃仁勳端出「核彈級」產品助攻!台積電2奈米也有AI

AI將持續震驚人類

黃: 有時候我們說「great(好)」或是「sick(生病、厭倦)」,可能會因誤情況不同產生不同語境,AI可以通過音頻等進行模型學習嗎?

Sutskever: 可以,影片很有用。

黃: 未來AI會自己訓練自己嗎?

Sutskever: 這個可能性仍有待觀察。

黃: AI未來最讓你興奮的地方在哪?

Sutskever: 預測是很難的,尤其對太具體的事。我認為這個領域會持續進步,我們將繼續看到AI持續震驚人類。AI未來絕對會達到可以讓人完全信賴,在它不懂時,將會開口要求更多資訊,這是人工智慧未來進步的一大關鍵。

黃: GPT-4什麼東西讓你驚訝?

Sutskever: 他展示很多很酷的東西,令人驚奇。首先,GPT-4可靠的程度令人驚艷。之前問問題,ChatGPT可能會用愚蠢的方式誤解,但GPT-4不會。

其次,GPT-4解決數學問題的能力超強大。很多人也注意到,它可以用一個字母開頭寫詩,很清晰遵循指令。在視覺方面我喜歡他如何解釋迷因圖等笑話。

延伸閱讀:憑一顆AI晶片,耐能打入高通!助AI運算能力提高4倍,這家新創什麼來頭?

責任編輯:林美欣

本網站內容未經允許,不得轉載。
往下滑看下一篇文章
HPE Networking Instant On來助力,初咖啡打造像家一樣的咖啡體驗空間!
HPE Networking Instant On來助力,初咖啡打造像家一樣的咖啡體驗空間!

走進位於台中沙鹿四平街的「初咖啡」,芬芳滿室的咖啡香、溫暖療癒的陽光、綠意盎然的植栽,以及便捷舒適的空間體驗,不僅讓人流連忘返、更是訪客不斷回訪的關鍵。初咖啡主理人楊倩如表示:「我心中的理想咖啡廳不僅要有引人的裝潢外觀、舒適的空間規劃、便捷的WiFi服務,每一季,我們都會更換咖啡豆以滿足客戶嘗鮮的需求,此外,我們設有兩座咖啡豆烘培機器,以淺培、中培的方式處理咖啡豆,讓訪客可以品嘗最原始的咖啡風味。」

鉅晶
圖/ 數位時代

關鍵拼圖,初咖啡以HPE Networking Instant On完善咖啡空間體驗

初咖啡對理想的堅持,不僅自然而然的形成差異化服務優勢、吸引一群死忠消費者,挺過疫情衝擊後,初咖啡將咖啡廳二樓打造成小型體驗空間,開始提供各種咖啡課程、或者是做為舉辦小型活動的場地,為了順利擴展業務,初咖啡除進行相應的空間裝潢,更計畫更新店內的WiFi服務。
協助楊倩如一起打理初咖啡、主導WiFi設備升級工作的邱俊銘表示:「無論是咖啡、空間還是服務,我們的理念一直是:只要可以就做到最好。」以WiFi服務為例,一開始,初咖啡使用的是家用型WiFi AP,隨著裝潢的調整與訪客的增加,不僅店內空間出現WiFi連線訊號死角問題、一樓室外空間也無法連結WiFi,再加上WiFi AP的外觀與店內裝潢風格不搭,只能擺放在訪客看不到的吧檯櫃內空間,設備線材雜亂也影響連線品質,為改善這些問題,以及確保二樓空間也能夠順利連網,開始評估系列解決方案,最終決定採用HPE Networking Instant On系列產品:導入Instant On 1930系列交換器、在一樓室內安裝1台Instant On AP22、一樓戶外安裝1台Instant On AP17,以及在二樓安裝1台Instant On AP22。

鉅晶
圖/ 數位時代

邱俊銘進一步解釋會決定採用HPE Networking Instant On的原因有三:首先是既有的訊號死角與連線覆蓋率不足等問題迎刃而解,而且,HPE Networking Instant On只要透過網路線就可以供電,大幅降低室內與室外拉線問題,此外,美觀的外型也與初咖啡欲打造的空間氛圍一致,有相互加分的成效;其次是合作夥伴 – 鉅晶國際 – 提供專業且貼心的諮詢與技術支援服務,例如在一開始的評估階段就針對初咖啡的室內裝潢提出最佳規畫建議,以及在一周左右的時間完成施工與架設工作,安裝上線後,鉅晶國際的團隊也總是在最短時間內提供相應的支援;最後,同時也是最重要的是,系統設備高度整合且易於管理,完全符合初咖啡的管理需求。

鉅晶
圖/ 數位時代

「透過HPE Networking Instant On App,無論在哪都可以輕鬆掌握各個網路設備的即時運行狀況,甚至是從中找出異常事件、防範於未然。」邱俊銘面帶微笑地說,導入HPE Networking Instant On後,初咖啡又往理想–讓訪客可以像在家一樣的悠閒品嘗咖啡、渡過美好時光–邁進一步,是咖啡廳營運的最佳幫手。

鉅晶
圖/ 數位時代

為未來做最佳準備,初咖啡以別具一格的咖啡體驗持續擴展業務版圖

導入HPE Networking Instant On除有助於初咖啡解決當務之急:連網與管理問題,更為未來的商業擴展做好最佳準備,例如可以因應業務需求輕鬆設定、擴展WiFi 服務,以內建的安全性閘道和防火牆將業務與訪客流量分開,以及透過(遠端)監管的方式即早發現異常連線行為以降低惡意攻擊、將危害降低到最低,提供訪客安全無虞的WiFi連線體驗等。
「我們想提供給客戶最好的體驗,透過HPE Networking Instant On除可提供訪客提供高品質的連網服務,還可以進一步落實安全防護,這是以前想都沒有想過的事情。」邱俊銘面帶微笑地解釋,初咖啡除提供咖啡、餐飲服務,販售自家烘培的咖啡商品,以及開設與咖啡相關的課程與活動,亦不排除開設二店甚至是三店,在這樣的前提下,功能強大且可輕鬆管理的WiFi服務顯得尤其重要,不僅能完善空間服務體驗,也讓團隊可以無後顧之憂的衝刺咖啡等核心業務。
「我們十分滿意HPE Networking Instant On帶來的絕佳使用體驗,除會視需求擴展使用,也會不藏私地介紹給同業。」關於HPE Networking Instant On的未來規劃,邱俊銘如是說道。

本網站內容未經允許,不得轉載。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
台日半導體新局 全解讀
© 2024 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓