數位關鍵字171.從臺大到矽谷:他如何打造讓AI訓練效率翻倍的開源神器?

近年來ChatGPT等大型語言模型蓬勃發展,但訓練這些AI模型需要耗費大量運算資源與開發成本。本集數位時代創新長黃亮崢James邀請到Liger Kernel專案創辦人徐秉倫Byron,分享如何透過開源方案讓AI訓練更有效率。

他提到:

  1. AI模型訓練的硬體需求:以目前最受歡迎的開源模型LLaMA為例,需要數十台甚至上百台AI Server的頂級顯示卡,同時運算的GPU可能破千甚至上萬片。

  2. Liger Kernel的優化成果:透過底層最佳化,讓訓練速度提升20%、記憶體使用減少60%。以OpenAI訓練GPT-4的一億美金成本來計算,這樣的優化可為企業節省約兩千萬美金。

  3. 開源專案的三大優勢:
    ・建立社群讓全球專家免費協助開發
    ・獲得不同專業領域的技術支援
    ・有助於人才招募並建立企業形象

  4. GPU軟硬整合的發展方向:Byron建議臺灣可以投入HPC(High Performance Computing)領域,特別是在GPU kernel層級的最佳化,以及終端推理、小型模型等特殊晶片的應用開發。

Byron分享了他從在臺大電機系到Berkeley深造,最後在LinkedIn工作的經歷。他強調,開源專案不僅能幫助工程師展現實力,更可能成為前往國際企業工作的跳板。透過開源貢獻,臺灣工程師有機會被國際企業看見,獲得更好的工作機會。

對於未來發展,Byron指出AI正從預訓練階段進入後訓練時代,如何讓模型在特定領域達到更好的效能將成為關鍵。他建議臺灣可以善用在硬體領域的優勢,投入GPU運算優化與推理引擎的開發,在全球AI產業鏈中扮演重要角色。

EP223. 川普2.0下的美台科技業變局 ft.科技解密Podcast主持人詹益鑑

記者茶水間150.過年必玩電玩遊戲!黑神話:悟空、幻獸帕魯居然不在裡面!?

數位關鍵字170.國家級算力戰略布局!臺灣如何打造AI時代的運算實力?

EP222. 半導體業2025年展望 ft.半導體專家吳金榮

塊轉WEB3_105. 兒時回憶回歸! 全新鏈遊《楓之谷N》有啥可期待的?

記者茶水間149.翰林茶館被收購了!38年手搖飲始祖為什麼放手賣掉?六角其實買貴了?

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓