台灣有自己的企業用繁中AI模型了!
和碩聯合科技、長春集團、欣興電子、長庚醫院等多家企業於7月1日聯合發表「Project TAME」(TAiwan Mixture of Experts)模型開源專案,是台灣首款擁有700億參數等級的大型語言模型,將以開放原始碼的形式,號召產學界加入,力求成為目前市面上「最懂台灣產業、最懂繁體中文」的模型。
Project TAME由台大資工系、資管系協助,和NVIDIA算力支持,投入多家企業專業知識,讓Project TAME成為電子製造、石化工業、醫療、法律等產業的專業AI助手,目前推動數月,在台灣的大學學測、律師資格考試、中醫考試、導遊證照、駕照等測驗,都有領先業界的分數表現。
Project TAME 厲害在哪?
Project TAME由台大資工系副教授陳縕儂帶領的實驗室團隊協助訓練,在沒有簽約約束下,企業自發性加入合作,共有長春集團、和碩聯合科技、欣興電子、長庚醫院、科技報橘、律果科技等公司的專業人員投入訓練,讓電子製造、石化工業、醫療、法律等產業知識。
Project TAME專案負責人、和碩人工智慧發展處處長蕭安助表示,Project TAME預訓練有多達5000億個參數(token),以繁體中文資料為主,總共使用35萬個GPU(繪圖處理器)小時,由31名工程師投入,中間過程用了1285個工時,具有在地化和產業化的特色。
優勢1:很懂台灣語境
台大資工系博士班學生林彥廷分享,目前大型語言模型多由美國資料做訓練,影響AI的意識形態和文化觀點,對於繁體中文這類小語種來說能力相當有限。
而Project TAME專為台灣繁體中文而生,甚至連網路流行語「很盤」的意思都答得出來「買東西吃虧」的答案,同時GPT-4o卻回答出完全相反的答案「價格合理」,由此可見在地化程度的差異。
優勢2:專業知識量
經過數月的訓練,Project TAME的考試成績已經超越GPT-4o、Google Gemini等美國企業的大型語言模型,包括台灣的大學學測、律師資格考試、中醫考試、導遊證照、駕照等測驗都通過,甚至有超過70分的成績表現。
在台灣39項綜合評測、近3000個題目中,Project TAME分數也超過所有模型,正確率相較第2名的Claude-Opus模型高出6.8%,比GPT-4o高出9.3%。
優勢3:省成本和時間
參與計劃的亞太智能機器執行長吳柏翰指出,一般企業如果要從零開始訓練10億等級的參數模型,需要耗資新台幣3.8億元,並且耗時576小時訓練。
但Project TAME作為700億參數的模型,企業導入卻只需台幣1,600萬的成本、且一次更新迭代只要花短短3.5小時,就能投入企業資料訓練,能夠降低導入的成本及時間。
主權AI勢在必行,產官學投入訓練
AI龍頭廠商輝達(NVIDIA)執行長黃仁勳多次強調「主權AI」的重要性,他認為推動第二波AI浪潮的是各國政府,因為已經開始意識到每個國家都需要建立自己的人工智慧,也就是主權AI。他主張,AI對於政治、經濟、軍事等國家事務有越來越大的影響力,國家不會希望假他人之手訓練AI。
加上語言文化的獨特性,需要在AI時代保留下來,繁體中文使用的國家、人數都少於簡體中文,若不自行訓練,各界都擔心會繁體中文逐步被取代。
而台灣的主權AI以國科會推動的TAIDE(Trustworthy AI Dialog Engine,可信任的AI對話引擎)開先例,於去年發表,以台灣文化為基礎,融入台灣語言、價值觀、習俗等元素打造,能夠理解和回應台灣用戶的需求。
如今業界響應推出Project TAME,加入語言能力以外的產業知識力量,希望提供企業發展AI更厚實的基礎。
目前,Project TAME已開放企業及開發者從 Github免費下載使用,也提供模型聊天頁面供民眾使用;亞太智能機器(APMIC)也整合Project TAME,提出聊天機器人測試頁面供搶先體驗。
責任編輯:李先泰