盤點,是一種對未來想像的策展。遍布全球的AI 100、立足台灣的AI 50當中,可以拼湊出關鍵趨勢。從這一次封面故事的報導和專訪中,我們試圖勾勒出AI產業的當下與未來。
AI需要算力,而算力要靠鈔票(買GPU)和人頭(市場規模)堆疊。全世界目前有能力持續投資超過百億美元蓋大型資料中心的公司,主要來自美國,加上一小部分來自中國,而這些公司都擁有上億用戶。
美、中之外,像台灣這種千萬用戶數量的市場略為尷尬。自行發展受限於鈔票和人頭,完全交給國際大公司付費當用戶,又有主權AI(Sovereign AI)和繁體中文資料訓練等議題待解。
因此,台智雲這樣本土公司的存在,便具有戰略意義,增加客戶的選擇和談判籌碼。
「6年前大家還不知道什麼是大語言模型(LLM),我們的團隊就已開始投入算力建設。」台智雲總經理吳漢章說。6年來除了母公司華碩的資源支持,台智雲還手握台灣第1座AI超級電腦「台灣杉二號」計畫培養的實力和算力。
吸多國公部門取經「主權AI」
台智雲瞄準AI領域最核心的3大服務——算力代工、模型代訓練和公有雲。在全球500大高速計算主機(TOP500)中,台灣進榜的7座超級電腦,就有5座是台智雲隊協助建設;在模型方面,打造全球第1座可商用繁體中文大語言模型「福爾摩沙」,甚至東南亞、歐洲政府單位都找上門,希望台智雲協助訓練模型,並提供「主權AI」需要的算力。
「從國家到企業,很多都是有錢有資源,卻不會建造、維護基礎建設,所以我們就幫忙代建、代維護。」吳漢章說。這也是台智雲招牌的業務內容「算力代工」,協助客戶建造、營運AI大型資料中心。
至於口袋不深的企業,台智雲提供「公有雲服務」,讓客戶直接租用台智雲的資料中心,跳過大把資金建置GPU伺服器,按照需求向台智雲租用算力,並可彈性調整。
這方面AI基礎建設的實力,來自台灣杉二號計畫的結晶。2018年,在科技部(現為國科會)國網中心的號召下,華碩、台灣大哥大、廣達3家公司組成「AI國家隊」,用4年50億元的經費,打造出全球排名第21的AI超級電腦「台灣杉二號」,目前仍是支援台灣AI發展的重要基礎建設。
「當時根本沒人相信台灣可以做到,甚至懷疑資料中心會變成蚊子館。」吳漢章回憶道,整個計畫沒有依賴任何國外技術移轉,完全靠台灣企業的技術累積,甚至嚴格規範進度「延遲1天罰款300萬元」,原本評估至少要2年完成,竟趕在7個月內上線並穩定運作。
在計畫中,華碩任務是雲端服務平台、雲端伺服器及AI應用整合,計畫結束後接手維運台灣杉二號,組成後來的台智雲。
起步就有國家級算力,讓台智雲在模型訓練上也跑得更快。ChatGPT問世3個月後,台智雲就開始打造第1個大語言模型的訓練,半年後發表「福爾摩沙大語言模型」(Formosa Foundation Model,FFM),花了1,000顆GPU、投入約1億元的資源,並採用多達1,760億個參數,讓該語言模型擁有超越文字、圖像等基本理解能力,做到理解因果關係、邏輯推理、預測推薦等任務。
1台伺服器就能玩AI!搭ChatGPT應用列車衝IPO
台智雲以算力和福爾摩沙大模型為重要基礎,提供客戶「模型代訓練」服務,幫企業打造自有、可控的模型,不必依賴OpenAI等大廠的模型;同時也具備最小的版本甚至只要1台伺服器,就能讓企業擁有AI能力。
針對繁體中文語意理解、和台灣本地歷史文化,都比國外大模型有更豐富資料量,經過繁體中文驗證集TMMLU+實測,FFM-Llama3-70B在繁體中文大型語言模型表現超越GPT-4。
「你沒有算力也沒辦法練兵,更別說幫客戶做他想要的模型。」吳漢章說,知道台灣企業未來會需要自己的模型,不可能每家廠商都有條件做這件事,「算力、模型、平台我們都擅長,做出一個大家都能用的模型,速度更快成本也更低。」目前台智雲的客戶以製造業為大宗,還有部分金融、醫療產業。
「我們運氣很好,成立3年就等到機會,其實ChatGPT沒有出來會很辛苦。」吳漢章坦言,回頭看2022年的AI議題冷到不行,當時解決單一任務如圖像分類、語音識別的AI 1.0,根本還用不上這麼大的算力。直到ChatGPT掀起革命徹底改變一切,今年中國開源模型DeepSeek又降低企業自有模型門檻,開啟新一波落地應用商機。
打鐵趁熱,台智雲預計今年第4季 IPO(公開發行),比起募到資金,更重要目標是募得資本市場對這個產業的信心。「站穩這個角色,未來3到5年,台智雲只要好好做,就不怕被別人忘記。」吳漢章說。
台智雲
總經理:吳漢章
市場成績:建置台灣進榜TOP500的5座超級電腦、打造繁體中文大語言模型「福爾摩沙」
責任編輯:蘇柔瑋