Google Bard靈魂推手來自台灣！紀懷新解密AI：LLM有哪些限制？怎麼訓練？|數位時代 BusinessNext

Google今年推出實驗性對話式AI服務「Bard」，7月更進一步升級支援包括繁體中文在內的40種以上語言，吸引多數台灣用戶體驗Google最新的AI技術應用。在Google Bard團隊中，最關鍵的靈魂人物就是來自台灣的紀懷新（Ed H. Chi）博士。

任職Google超過12年、身為Google DeepMind的傑出科學家，紀懷新親自從美國總部回來台灣解密，分享Google如何持續在多元產品與服務中，透過AI技術應用，幫助使用者帶來更智慧的體驗。

「Google的使命，就是透過大型語言模型（LLM）彙整全球資訊，並以自然的對話方式，供大眾使用，也使人人受惠。」在Google分享聚會中，紀懷新也親自回答3大核心問題，包括Google為何今年加入AI戰局、Bard如何學習並理解、大型語言模型還有哪些挑戰？

重點一：為什麼Google在今年才決定加入AI戰局？

由於市場上的生成式AI話題是由ChatGPT而來，使得不少民眾以為，Google是為了迎戰ChatGPT的熱潮，才加緊推出Bard產品。

紀懷新解釋，「事實上，Google將AI技術帶入產品和服務中，已超過10年。」意思是，Bard是Google布局10年之久的AI戰略中，其中之一的成果。

Google在發展Bard之前，2011年就已經有Google Brain計畫團隊，嘗試導入AI上的研究及運用。

像是在「Google智慧鏡頭」透過圖片來搜尋其中的文字資訊、結合AR技術顯示路線環境的「Google地圖」、透過AI機器學習技術強化Gmail或Meet工具的「Workspace」，以及Pixel手機的即時翻譯、魔術橡皮擦等，都是AI應用的例證。

延伸閱讀：Google內部文件揭密：Google助理跟Bard有什麼不同？

自2013年至今，紀懷新帶領的機器學習研究團隊，也包含大型語言模型、對話程式語言模型（LaMDA/Bard）、神經網路推薦系統（neural recommendations）、可靠性機器學習（reliable machine learning）等相關研究。

他的團隊也幫助過YouTube推薦演算法、Google新聞、廣告、Google Play商店等一系列Google產品，「這10年來，僅僅我們團隊，就在Google帶來720項改進。」

重點二：Bard如何學習並理解不同語言？

「資料跟資料效率，是發展對話式AI的關鍵。」紀懷新解釋，Bard整套訓練中，必須經過3個不同階段，分別是「預訓練」（Pre-Traing）、「微調」（Fine-Tuning）、「提示／提問」（Prompting）等。

他進一步解說，「預訓練」就是學習語言的基礎能力，也是最昂貴的階段；「微調」是專精於特定任務，尤其數據資料效率比較好的預訓練模型，能用更少的資料量學習；「提示／提問」則是提示及小樣本數據資料，能夠在正確的時間喚醒正確的能力。

有趣的是，紀懷新也用德文諺語「Ich verstehe nur Bahnhof」作為案例，若單純用Google翻譯工具，這句話就只會字面上翻譯成英文「I only understand train station」（我只知道火車站）。

由於Bard具備更好的「多語言理解能力」（multilingual understanding），因此，就會進一步解釋這句翻譯是錯誤的，並明確指出這句德文諺語的真正意思「I don't understand anything」（我什麼都不知道），向用戶解說「這句諺語是一種誇飾性的說詞」。

由此可知，語言模型能夠互為集中、學習，進一步理解而提升原有的模型基礎，這樣的結果也吸引多數用戶將Bard成為自己的語言學習家教。

延伸閱讀：一個關鍵優勢，Google領先10年！分析師：AI大戰比微軟更有贏面

Bard擁有很好的對話基礎，但在此之前的互動也不具備連貫性，話題內容更不夠廣泛，這都是學習的過程。紀懷新坦言，AI聊天機器人的體驗，應該要表現出交換式（Transaction）與互動式（Interaction）兩大特色並存，要有人性化的互動，而不單只是幫忙人類工作而已。

此外，有別於ChatGPT的回答基礎限制在僅能參考2021年前的資料，Google Bard則可利用搜尋引擎的工具，提高更正確、具有時效性的答案。「這就好像我們教大型語言模型LLM，如何繼續搜索、去閱讀這些網絡結果，進而產生相應的動作，最後是經過Google內部的搜索引擎產生出的回應。」紀懷新如此解釋。

值得一提的是，被問到Google訓練AI時，是用TPU，還是輝達（NVIDIA）的GPU呢？紀懷新透露，Google一直100%使用自家的TPU，尤其Google很早就在AI領域投入大量資源，裡頭的數學運算及訓練方法，都是早就發展的成果。

重點三：Bard存在「5大已知的限制」

「大型語言模型目前仍處於早期發展階段。」紀懷新說，儘管Google的對話程式語言模型（LaMDA）可以做到1,370億個參數，讓Bard理解合理性、具體性、趣味性、安全性、真實性，並歸納出數百萬任務，但事實上AI模型仍需不斷微調「更自然方式」的具體內容，才能跳脫早期的Google Assistant單一及不自然。

紀懷新指出，就目前來說，大型語言模型（包含Bard在內）仍存在「5大已知的限制」，像是回答時出現與事實不符合的「幻覺」及偏差：

準確性：Bard的回應可能未必準確，尤其當詢問複雜或講求事實的主題時。

偏差性：Bard的回應可能反映偏見或呈現出訓練資料中的特定觀點。

人格化：Bard的回應可能會讓人以為它有個人意見或感受。

偽陽性／偽陰性：Bard可能對某些適合的提示不予回應，並提供不適合的回應。

惡意提示的刻意攻擊：使用者會不斷尋找對Bard進行壓力測試的方法。

面對這5大問題，紀懷新解釋，這是Google和整個業界正在研究的領域，Google也將隨著時間推移演進，致力改善這些面向。Google也會持續與政府機關、企業、大專院校等多方合作交流，共同研擬相關做法和標準，設法降低風險。

延伸閱讀：日立把AI變老師傅，是培訓幫手也是產品！百年老店AI大計

紀懷新也透露，一年多沒回來台灣，此次希望參與學術交流，並與Google台灣同仁交流，希望台灣針對AI領域作出一些貢獻。「大型語言模型會改變我們與AI互動的方式，並為生活帶來明顯改變，我們將持續參與其中。」

紀懷新博士小檔案

現職： Google DeepMind 傑出科學家，帶領機器學習研究團隊，進行大型語言模型（LaMDA/Bard）、神經網路推薦系統（neural recommendations）、可靠性機器學習（reliable machine learning）等相關研究。

貢獻： 他所帶領的研究團隊協助推出Bard，並從2013年起為YouTube、Google 新聞、等產品帶來超過720項改進。紀懷新著名的研究領域為網路和線上社群系統對使用者行為的影響，並擁有39項專利和200多篇研究論文的發表。

經歷： 帕羅奧多研究中心（Palo Alto Research Center）增強社群認知小組的區域經理及首席科學家，帶領團隊了解社群系統如何幫助人們的記憶、思考和推理。

學歷： 在六年半內取得明尼蘇達大學（University of Minnesota）學士、碩士和博士等3個學位。他獲選為電腦協會院士（ACM Fellow）和人機互動學會院士（CHI Academy），也因在資訊視覺化研究貢獻獲頒20年的Test of Time Award。他的相關研究與言論曾被《經濟學人》、《時代雜誌》、《洛杉磯時報》和《美聯社》等媒體報導和引用。

興趣： 高爾夫、游泳、攝影和滑雪，且擁有跆拳道黑帶。

責任編輯：林美欣

當GPU不再是唯一主角，記憶體為何躍上AI舞台中央？

過去，半導體的焦點多圍繞在晶片，例如CPU、GPU跟AI加速器等，市場普遍認為，晶片運算能力是左右科技產業發展速度的關鍵，但在進入生成式AI世代後，產業逐漸發現另一個事實：真正限制AI效能的瓶頸不是運算，而是資料能否快速被存取與傳輸。

從大型語言模型訓練，到AI推論、代理式工作流程（Agentic Workflow），甚至未來的機器人與自駕車，龐大的資料流量正持續推升對高頻寬、低延遲、高容量記憶體的需求，讓記憶體產業從過去相對標準化、以價格競爭為主的市場，逐漸轉變為AI基礎建設的重要核心。

「仔細觀察AI應用服務會發現，大多數工作負載都被頻寬限制。」美光科技全球業務執行副總裁Mike Cordano認為，記憶體是突破（頻寬）瓶頸的關鍵，也讓AI競賽從晶片算力升級到記憶體與儲存架構的系統級競爭。這樣的產業洞察，也正是Mike在歷經二十餘年的儲存產業資歷，加上四年半的創投生涯後，選擇加入美光的核心原因之一：在AI重塑產業結構的浪潮下，記憶體將成為這波成長最直接的動能所在。

從零組件供應商到策略夥伴，記憶體共創時代來臨

AI的崛起，正在改變記憶體廠商與客戶的關係。

過去，記憶體產品多是標準化元件，客戶關注的是價格、供貨與規格；合作模式也偏向短期採購與交易導向。然而隨著AI系統規模愈來愈大，從資料中心、雲端平台到終端裝置，記憶體已經成為決定系統效能的重要關鍵，也因如此，越來越多企業將記憶體視為「策略性資產」，而非單純零組件。

Mike表示：「現在，我們跟客戶合作的時間跨度改變了，在產品正式上市前三到四年便開始合作，從系統架構階段就共同規劃未來需求。」例如，美光科技與NVIDIA共同研發的資料中心所使用的低功耗記憶體，便是雙方提前多年展開深度合作（co-design）的成果。

值得特別注意的是，美光科技除從技術層面與晶片製造商等夥伴共創產品，也在需求層面與客戶進行密切合作，例如，將過去較無約束力、期限僅一年的長期協議（LTA）轉變成為期五年、條款更具約束力的策略性客戶協議（SCA），藉此掌握客戶的未來需求，進而在技術層面做更深度的合作。Mike坦言，深度協同設計是高成本的投入，美光的做法是先廣泛進行市場感知，理解不同場域的需求方向，再與生態系統中的夥伴們展開客製化合作。

從裝置導向轉為Token導向，AI浪潮重寫記憶體成長模式

除了合作模式改變，更大的典範轉移是需求的改變。

Mike解釋，過去記憶體需求跟PC、手機跟伺服器出貨量息息相關，但在AI新世代，推動記憶體需求成長的核心不再是設備數量，而是AI模型所產生的運算與資料消耗量。「AI產業逐漸走向以『Consumption』或『Token』為主的新經濟模式，每一次的模型運算都需要消耗大量的記憶體跟儲存資源，這意味著，即使設備銷量成長趨緩，記憶體需求仍可能持續上升。」

更重要的是，AI應用正從資料中心外擴至手機、PC、自駕車與機器人等場域，儘管不同場域對記憶體的需求不盡相同，但是，Mike認為：所有AI裝置都存在三項共同需求：更快的速度、更大的容量，以及更高的能源效率。

正如Mike在受訪時提到的：「我們最大的挑戰，是如何與客戶和整個生態系保持高度一致，一方面創造供給與產能，另一方面持續推動技術創新。」可以預期，在接下來的五年，記憶體產業面臨的挑戰不僅僅是擴展產能，而是如何與客戶共同規劃需求、同步投入技術創新，而這也是美光科技積極經營AI生態體系的原因。

總的來說，AI帶來的改變，不只是算力提升，而是重新定義整個運算架構：過去，記憶體被視為支援運算的基礎元件；現在，則是決定AI效能、能源效率與創新速度的關鍵資源；當產業競爭從晶片性能延伸到資料流動效率，從裝置數量轉向Token消耗量，記憶體的重要性也將隨之水漲船高，對美光科技來說，這將是其從供應商走向AI生態系核心夥伴的關鍵角色轉變。

Google Bard靈魂推手來自台灣！紀懷新解密Bard：AI有哪些限制？怎麼訓練？