讓AI「長出手」,自己學會Google、找計算機!Meta新訓練方式Toolformer厲害在哪?
讓AI「長出手」,自己學會Google、找計算機!Meta新訓練方式Toolformer厲害在哪?

從去年開始,許多人工智慧工具開放公眾使用,從AI圖像生成工具Midjourney、Stable Diffusion揭起大眾的興趣,再到去年年底人工智慧聊天機器人ChatGPT成為公眾話題。儘管讓AI生成圖像和文字相當有趣,但這些工具要進入我們的日常,還有很長的一段路──大多數AI模型都有其局限性,例如沒有最新的資料、會對事實產生「訊息幻覺」、缺乏進行精確計算數學等等。

在ChatGPT還在嘗試克服這些缺點、挑戰Google搜尋引擎地位的同時,Meta冷不防從一旁殺出,用一篇新論文實踐這些問題的解套:讓AI自己使用外部工具。換句話說,如果AI沒有最新資訊,那就讓它自己搜尋最新的資料;如果不會算術,就去找計算機,諸如此類。

生成字句的同時呼叫API,將問題與運算「外包」

這個方法不是Meta獨創,但是被稱為「Toolformer」的這個方法也克服了先前讓AI使用外部工具的障礙;原先的方式仰賴人工註釋,或需要限制在特定的任務內容,導致語言模型與外部工具的結合難以推廣。但Toolformer在產生文字的過程中,遇到特定字詞或需求,就會直接呼叫工具的「API」,叫出搜尋引擎或是計算機。

例如,讓ChatGPT相形見絀的算數:

或是確切日期,呼叫月曆來查詢:

甚至直接搜尋:

Toolformer經過優化,可以自主決定要使用哪些API,以及使用哪些參數來運算或是查詢。而這個的學習過程被稱為「自我監督」:研究人員只需要讓語言模型學習「少量」人工編寫的API呼叫範例,而這些範例已經被手動標註會使用到API的部分。然後再讓語言模型去生成更多包含這些範例的資料庫。

而訓練的過程分成三個步驟:第一是取樣,就是看輸入到語言模型的文字當中,哪些地方可能會需要那哪些工具,就直接把要呼叫API的指令插入句子當中。再來,就是執行這項API指令,並把產生的答案插入對應的部分。

第三步是過濾,如果第二步所生成的文字對整句話的意義不大的話,就會直接剔除,僅保留整句話原本所需要的資訊。

與其他大型語言模型比較起來,Toolformer又有哪些厲害之處?

在Meta的論文當中,比較了Toolformer與多個其他大語言模型,包括GPT-J,OPT(66B)以及GPT-3(175B)在數學、問答以及機器翻譯等方面的能力;研究結果顯示了在學習使用工具後,GPT-J的零樣本學習能力明顯增加,甚至優於GPT-3模型。在數學、QA與LAMA基準測試上的平均表現也有所增強。

研究人員也表示,使用API除了能得到更精準的輸出結果,語言模型自身使用外部工具的能力,也可以解決例如數學運算與事實查核等大型語言模型常有的問題。

不過同時,研究人員也指出,這個系統還是有其局限性。例如,API工具無法連續使用,或是使用一個輸出作為下一句的輸入,因為每個工具的指令是獨立生成的,導致應用範圍有所限制。

延伸閱讀:明明也擁抱AI,祖克柏在AI大戰中版面超少?Meta 科學家喊冤:我們不夠「好命」

語言模型掌握工具,已是未來語言模型發展趨勢

科技巨頭的人工智慧之戰,加入戰局的Meta顯然也不輸微軟與Google;雖然現在聲浪尚無法比上ChatGPT引發的一片譁然,但Meta讓語言模型對工具的使用自主性與熟練度更了上一層樓。

儘管Toolformer所展現出的「自學」能力可能還是個雛形,但顯然語言模型發展的下一步,就是要訓練它們知道在什麼時間、要用什麼工具,且一切的輸入、輸出都可以轉化成自然語言。

這勢必會全然改變人們操作電腦與網頁的方式,而現在也不只Meta走向這個潮流;微軟的Bing搜尋引擎將接入ChatGPT,而Google推出的人工智慧Bard即將嵌入到Google搜尋當中。

資料來源:the decoderTowards AI新浪科技

責任編輯:錢玉紘

往下滑看下一篇文章
總統科學獎揭曉!梁賡義院士、葉均蔚院士用創新與堅持,寫下臺灣科學光輝新頁
總統科學獎揭曉!梁賡義院士、葉均蔚院士用創新與堅持,寫下臺灣科學光輝新頁

【總統科學獎】宗旨在於提升臺灣在國際學術界之地位,獎勵數理科學、生命科學、人文及社會科學、工程科學在國際學術研究上具創新性且貢獻卓著之學者,尤以對臺灣社會有重大貢獻之基礎學術研究人才為優先獎勵對象。

2025年11月11日,總統科學獎頒獎典禮於總統府正式舉行。2001年設立、每2年頒發1次的總統科學獎,今年已邁入第13屆,本屆的2位獲獎者,分別是生命科學組的院士梁賡義、工程科學組的院士葉均蔚。2位臺灣的科研泰斗,不僅全心全意投入創新,更樹立了典範,成為所有科研人員的榜樣。

總統賴清德在致詞時,引用諾貝爾和平獎得主曼德拉(Nelson Mandela)的話指出:「在事情完成之前,一切都看似不可能。這說明了2位院士的故事,他們對未知世界保持熱情、好奇,認真從基礎研究做起,並堅持努力到最後一刻,成功終將屬於他們。」

2025年總統科學獎得主,生命科學組 梁賡義 院士(右)、工程科學組 葉均蔚 院士(左)。
2025年總統科學獎得主,生命科學組 梁賡義 院士(右)、工程科學組 葉均蔚 院士(左)。
圖/ 數位時代

梁院士開創廣義估計方程式 ,加速新藥問世,造福千萬病患

從數學跨足生物統計、再投身高等教育與國家衛生的梁院士,從小就喜歡數學的嚴謹,在美國華盛頓大學攻讀博士期間,因為接觸到當時炙手可熱的「存活分析」,進而對生物統計產生興趣,「投入『生物統計』是條不歸路,因為我發現,統計工具的發展,可以對人類健康有間接幫助。」後來,他前往美國約翰霍普金斯大學任教,又與同事Scott Zeger研發出新的統計方法「廣義估計方程式」,突破了傳統分析方法必須假設所有樣本獨立的侷限,讓長期追蹤資料的解讀更嚴謹,也成為全球健康研究不可或缺的工具。

梁院士研究做得出色,卻不只將心力擺在學術上,他更心心念念著臺灣的發展,持續關心高等教育、國家衛生等領域。他在美國任教的28年間,幾乎年年暑假,都返國舉辦研討會,分享國際生物統計和流行病學的新知。2010年,他乾脆辭去教職,回臺擔任國立陽明大學校長,將陽明大學打造成醫學、人文並重的全人大學。

數位時代
賴總統親自頒發「2025年總統科學獎」殊榮予梁院士。
圖/ 數位時代

2017年,他又接下國家衛生研究院院長一職,並在新冠肺炎爆發期間,擔任中央流行疫情指揮中心研發組組長,與阿斯特捷利康(AstraZeneca)簽約,採購1千萬劑疫苗,完成防疫任務,「所以獲得總統科學獎,不僅是個人的榮耀,更是國家對全人教育的推動、公共衛生實踐,以及任務導向的研究重要性的肯定。能在其中有一些貢獻,我深感榮幸。」

高熵合金之父葉院士,堅持不懈打破材料學定律

被譽為「高熵合金之父」的葉院士,打破材料學界以1~2種主元素為基底的傳統,開創出能讓數十種元素混合的「高熵合金」,為元素週期表注入嶄新生命力,在半導體、智慧機械、綠能科技、國防與生醫等領域帶來突破性的應用。過去合金多以單一金屬為主,再加入少量元素微調性質,金屬種類愈多反而愈脆、延展性與硬度下降,使應用受限;然而高熵合金卻反其道而行,以4、5種以上金屬融合,展現出更佳的延展性、耐腐蝕性與硬度,重新定義合金的可能性。

令人驚訝的是,30年前葉院士提出高熵合金構想時,曾被質疑「觀念錯誤、毫無可能」。他不畏質疑,透過紮實的實驗與論證,於2004年一口氣發表5篇高熵材料論文,為高熵合金命名、定義並奠定理論基礎,後續更平均每年發表逾10篇研究,提出高熵效應、嚴重晶格扭曲效應、緩慢擴散效應與雞尾酒效應等核心概念,開創全新的材料科學典範。

數位時代
賴總統親自頒發「2025年總統科學獎」殊榮予葉院士。
圖/ 數位時代

如今,高熵合金不只在學界掀起熱潮,更成功落地產業。「學以致用非常重要!」葉院士強調,學術研究不該停留在象牙塔,而應投入產業、協助解決關鍵瓶頸。他不僅與國立清華大學共同成立「高熵材料研發中心」,也創辦全球首家高熵材料公司,推動技術轉移與產業升級,讓高熵合金真正走向世界舞臺。

所有總統科學獎得獎人的科學成就及重要貢獻,不僅提升臺灣學術聲譽及國際競爭力,對於增進人類生活福祉更有深遠的影響,實為臺灣學術界的最高典範。而本屆梁院士、葉院士2位得獎人終身投入科學探索、人才培育的成果,嘉惠了整個社會,更成就跨世代的深遠影響,為臺灣科學寫下光輝一頁。

【總統科學獎委員會 廣告】

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓