Google Bard靈魂推手來自台灣!紀懷新解密Bard:AI有哪些限制?怎麼訓練?
Google Bard靈魂推手來自台灣!紀懷新解密Bard:AI有哪些限制?怎麼訓練?

Google今年推出實驗性對話式AI服務「Bard」,7月更進一步升級支援包括繁體中文在內的40種以上語言,吸引多數台灣用戶體驗Google最新的AI技術應用。在Google Bard團隊中,最關鍵的靈魂人物就是來自台灣的紀懷新(Ed H. Chi)博士。

任職Google超過12年、身為Google DeepMind的傑出科學家,紀懷新親自從美國總部回來台灣解密,分享Google如何持續在多元產品與服務中,透過AI技術應用,幫助使用者帶來更智慧的體驗。

「Google的使命,就是透過大型語言模型(LLM)彙整全球資訊,並以自然的對話方式,供大眾使用,也使人人受惠。」在Google分享聚會中,紀懷新也親自回答3大核心問題,包括Google為何今年加入AI戰局、Bard如何學習並理解、大型語言模型還有哪些挑戰?

Google DeepMind傑出科學家紀懷新(Ed H. Chi)博士
Google今年7月更進一步升級Bard支援包括繁體中文在內的40種以上語言。
圖/ 楊絡懸攝影

重點一:為什麼Google在今年才決定加入AI戰局?

由於市場上的生成式AI話題是由ChatGPT而來,使得不少民眾以為,Google是為了迎戰ChatGPT的熱潮,才加緊推出Bard產品。

紀懷新解釋,「事實上,Google將AI技術帶入產品和服務中,已超過10年。」意思是,Bard是Google布局10年之久的AI戰略中,其中之一的成果。

Google在發展Bard之前,2011年就已經有Google Brain計畫團隊,嘗試導入AI上的研究及運用。

像是在「Google智慧鏡頭」透過圖片來搜尋其中的文字資訊、結合AR技術顯示路線環境的「Google地圖」、透過AI機器學習技術強化Gmail或Meet工具的「Workspace」,以及Pixel手機的即時翻譯、魔術橡皮擦等,都是AI應用的例證。

延伸閱讀:Google內部文件揭密:Google助理跟Bard有什麼不同?

自2013年至今,紀懷新帶領的機器學習研究團隊,也包含大型語言模型、對話程式語言模型(LaMDA/Bard)、神經網路推薦系統(neural recommendations)、可靠性機器學習(reliable machine learning)等相關研究。

他的團隊也幫助過YouTube推薦演算法、Google新聞、廣告、Google Play商店等一系列Google產品,「這10年來,僅僅我們團隊,就在Google帶來720項改進。」

重點二:Bard如何學習並理解不同語言?

「資料跟資料效率,是發展對話式AI的關鍵。」紀懷新解釋,Bard整套訓練中,必須經過3個不同階段,分別是「預訓練」(Pre-Traing)、「微調」(Fine-Tuning)、「提示/提問」(Prompting)等。

他進一步解說,「預訓練」就是學習語言的基礎能力,也是最昂貴的階段;「微調」是專精於特定任務,尤其數據資料效率比較好的預訓練模型,能用更少的資料量學習;「提示/提問」則是提示及小樣本數據資料,能夠在正確的時間喚醒正確的能力。

Google DeepMind傑出科學家紀懷新(Ed H. Chi)博士
紀懷新博士解釋,具備「多語言理解能力」的Bard如何解釋德文諺語。
圖/ 楊絡懸攝影

有趣的是,紀懷新也用德文諺語「Ich verstehe nur Bahnhof」作為案例,若單純用Google翻譯工具,這句話就只會字面上翻譯成英文「I only understand train station」(我只知道火車站)。

由於Bard具備更好的「多語言理解能力」(multilingual understanding),因此,就會進一步解釋這句翻譯是錯誤的,並明確指出這句德文諺語的真正意思「I don't understand anything」(我什麼都不知道),向用戶解說「這句諺語是一種誇飾性的說詞」。

由此可知,語言模型能夠互為集中、學習,進一步理解而提升原有的模型基礎,這樣的結果也吸引多數用戶將Bard成為自己的語言學習家教。

延伸閱讀:一個關鍵優勢,Google領先10年!分析師:AI大戰比微軟更有贏面

Bard擁有很好的對話基礎,但在此之前的互動也不具備連貫性,話題內容更不夠廣泛,這都是學習的過程。紀懷新坦言,AI聊天機器人的體驗,應該要表現出交換式(Transaction)與互動式(Interaction)兩大特色並存,要有人性化的互動,而不單只是幫忙人類工作而已。

此外,有別於ChatGPT的回答基礎限制在僅能參考2021年前的資料,Google Bard則可利用搜尋引擎的工具,提高更正確、具有時效性的答案。「這就好像我們教大型語言模型LLM,如何繼續搜索、去閱讀這些網絡結果,進而產生相應的動作,最後是經過Google內部的搜索引擎產生出的回應。」紀懷新如此解釋。

值得一提的是,被問到Google訓練AI時,是用TPU,還是輝達(NVIDIA)的GPU呢?紀懷新透露,Google一直100%使用自家的TPU,尤其Google很早就在AI領域投入大量資源,裡頭的數學運算及訓練方法,都是早就發展的成果。

重點三:Bard存在「5大已知的限制」

「大型語言模型目前仍處於早期發展階段。」紀懷新說,儘管Google的對話程式語言模型(LaMDA)可以做到1,370億個參數,讓Bard理解合理性、具體性、趣味性、安全性、真實性,並歸納出數百萬任務,但事實上AI模型仍需不斷微調「更自然方式」的具體內容,才能跳脫早期的Google Assistant單一及不自然。

紀懷新指出,就目前來說,大型語言模型(包含Bard在內)仍存在「5大已知的限制」,像是回答時出現與事實不符合的「幻覺」及偏差:

  1. 準確性:Bard的回應可能未必準確,尤其當詢問複雜或講求事實的主題時。

  2. 偏差性:Bard的回應可能反映偏見或呈現出訓練資料中的特定觀點。

  3. 人格化:Bard的回應可能會讓人以為它有個人意見或感受。

  4. 偽陽性/偽陰性:Bard可能對某些適合的提示不予回應,並提供不適合的回應。

  5. 惡意提示的刻意攻擊:使用者會不斷尋找對Bard進行壓力測試的方法。

面對這5大問題,紀懷新解釋,這是Google和整個業界正在研究的領域,Google也將隨著時間推移演進,致力改善這些面向。Google也會持續與政府機關、企業、大專院校等多方合作交流,共同研擬相關做法和標準,設法降低風險。

延伸閱讀:日立把AI變老師傅,是培訓幫手也是產品!百年老店AI大計

紀懷新也透露,一年多沒回來台灣,此次希望參與學術交流,並與Google台灣同仁交流,希望台灣針對AI領域作出一些貢獻。「大型語言模型會改變我們與AI互動的方式,並為生活帶來明顯改變,我們將持續參與其中。」

紀懷新博士小檔案

現職: Google DeepMind 傑出科學家,帶領機器學習研究團隊,進行大型語言模型(LaMDA/Bard)、神經網路推薦系統(neural recommendations)、可靠性機器學習(reliable machine learning)等相關研究。

貢獻: 他所帶領的研究團隊協助推出Bard,並從2013年起為YouTube、Google 新聞、等產品帶來超過720項改進。紀懷新著名的研究領域為網路和線上社群系統對使用者行為的影響,並擁有39項專利和200多篇研究論文的發表。

經歷: 帕羅奧多研究中心(Palo Alto Research Center)增強社群認知小組的區域經理及首席科學家,帶領團隊了解社群系統如何幫助人們的記憶、思考和推理。

學歷: 在六年半內取得明尼蘇達大學(University of Minnesota)學士、碩士和博士等3個學位。他獲選為電腦協會院士(ACM Fellow)和人機互動學會院士(CHI Academy),也因在資訊視覺化研究貢獻獲頒20年的Test of Time Award。他的相關研究與言論曾被《經濟學人》、《時代雜誌》、《洛杉磯時報》和《美聯社》等媒體報導和引用。

興趣: 高爾夫、游泳、攝影和滑雪,且擁有跆拳道黑帶。

責任編輯:林美欣

本網站內容未經允許,不得轉載。
往下滑看下一篇文章
AI賦能 設計起飛,Pinkoi 執行長顏君庭以 Samsung Galaxy S24旗艦系列拓展國際設計生態圈
AI賦能 設計起飛,Pinkoi 執行長顏君庭以 Samsung Galaxy S24旗艦系列拓展國際設計生態圈

翻開 Pinkoi 名片背後,一句簡潔的「Design the way you are」映入眼簾,這正是 Pinkoi 共同創辦人暨執行長顏君庭創立公司的初衷:希望每個人都能用好的設計,實踐獨特的自我風格與生活樣貌。近年來, Pinkoi 不僅成功將設計生態圈拓展至國際,也串接 AI 引擎服務,成功以科技力搶攻消費者心佔率,讓跨境銷售零距離。

擁抱科技力,Pinkoi 自建 AI 模型 極致個人化體驗

2011年發跡於台灣的 Pinkoi,產品聚焦於生活風格及設計相關,如今已是擁有超過625萬名會員的國際電商平台,設計館來自全球77個地區、消費者遍及全球150個國家。為搶攻全球文化創意產業商機,去年底, Pinkoi 搭上 AI 科技浪潮, 正式推出「生活風格智慧模型」,以大規模個人化為主要場景,打造個人化商城,讓設計師得以更有效率的行銷商品。

「自建 AI 模型,就是為了打造獨特的個人化體驗。」出身美國矽谷科技業的顏君庭,談起自家創建的 AI 服務,眼神閃爍著光芒。他指出,「 Pinkoi 站上以設計品為主力,而設計品常常是各國民眾的興趣、風格、價值主張、地域性文化的延伸,所以相較於一般電商,我們更需要深入經營在地市場,了解設計師與消費者的需求。」

透過自建 AI 模型,不僅讓 Pinkoi 業績大幅成長,消費者在平台的瀏覽時間也提升近三成、創造1.5倍的商品點擊率,有效提升品牌黏著度。顏君庭笑稱,日本市場對於 Pinkoi 甚至有「沼る」的美譽,盛讚平台商品獨特、令人忍不住著迷而長久駐足。

DSC00365.jpg
Pinkoi 共同創辦人暨執行長顏君庭對新科技趨之若鶩,讚嘆 Samsung Galaxy S24 Ultra 是「貼身得力助理」!
圖/ Samsung

智慧即時翻譯、筆記智慧助理 跨國商務人士最得力的行動幫手

對新科技趨之若鶩的顏君庭,近期則對三星電子最新推出的智慧型手機深深著迷,它就是首款結合全方位 Galaxy AI 應用的 Samsung Galaxy S24 旗艦系列 。

身為跨境電商平台的領導者,顏君庭經常需要走訪世界各地,最近剛結束日本差旅的他,直言 Samsung Galaxy S24 Ultra簡直是他的「貼身得力助理」。

「智慧即時翻譯的功能,真的是領先所有同業的最大亮點!」顏君庭表示,不會日文的他,過去在日本如果要打電話訂餐廳、旅館,都需要請朋友或同事幫忙,或是透過其他翻譯軟體來回轉譯,過程十分曲折。

「這次去日本有 Samsung Galaxy S24 Ultra,我可以直接按手機通話,開啟翻譯功能,我講英文,對話就會直接翻譯成日文,對方回應日文,也會轉回成英文,等於我們可以直接溝通,這點完全解決過去一直無法被解決的痛點,」顏君庭興奮地說道。

DSC00341拷貝.jpg
「智慧即時翻譯」的功能,即使在沒有 Wi-Fi 的飛航模式下也能使用。
圖/ Samsung

『智慧即時翻譯』與『智慧自動摘要』功能,對時常參與跨國團隊會議的顏君庭,更是省時省力。他指出,雖然團隊主要溝通語言為英文,但有些交流討論常會運用到日文、韓文等多國語言,「如果請一個即時口譯,對公司的營運成本來說非常高,請同事翻譯,頂多也只能簡譯。有了 Samsung Galaxy S24 旗艦系列,我們可以把對話錄下來,透過 AI 即時翻譯成指定語言的文字,好像大家即時的聊天、參與討論。」

DSC00125+147.jpg
與員工會議時,透過語音轉文字生成會議紀錄,還能分辨多人對話,並利用智慧自動摘要功能,一鍵做好摘要。
圖/ Samsung

「這對帶領跨國團隊很有幫助,有時用自己的母語討論,更能直接的表達想法,有效增進團隊的情感凝聚力,」顏君庭說。

筆記智慧助理也是日理萬機的顏君庭很喜歡的功能,他表示,每天要閱讀的文件相當多,現在只要輕輕觸碰手機螢幕幾下,就能快速獲得資料的精簡版本,筆記智慧助理還會自動排版、校正拼音,甚至在內文上方生成條列式的摘要,亦可將手寫字轉為文字,自動排版、生成重點摘要,將重要訊息直接佈達給團隊執行,「幫我省下很多時間。」

搜尋圈,一圈即搜:助力Pinkoi團隊精簡工作流程

Samsung Galaxy S24 旗艦系列 對於審核 Pinkoi 平台產品,更是如虎添翼。顏君庭表示, Pinkoi 對於產品審核非常嚴格,從設計本身到圖片拍攝,都要求出自設計師原創。因此,每當設計師上架產品,團隊須將圖片投遞到不同的平台,透過「以圖搜圖」的方式,確認有無相似物件。

「現在不用這麼麻煩了,我直接用 S Pen 觸控筆 圈起 Samsung Galaxy S24 Ultra 上的圖片,就可以立即搜尋,」他笑著說:「剛開始拿到S Pen 還有點納悶,因為使用經驗停留在過去,但實際使用才發現,意外的好用!」

顏君庭表示, Pinkoi 站上商品多達110萬項,內部會議討論時,有時沒辦法很精確的說出品牌或風格,透過 Samsung Galaxy S24 旗艦系列「搜尋圈」一圈即搜的功能,就可以很快速找到商品的細節,或類似的品項,讓團隊得以更快速聚焦討論。

DSC00227.jpg
「搜尋圈」的功能,快速找到商品的細節及類似的品項,讓團隊在會議中聚焦討論更有效率。
圖/ Samsung

極致攝影 超強續航力 捕捉靈感不斷電

創業這10餘年來,顏君庭還是保有實地探訪台灣、各地市集的習慣,他也喜歡以手機拍攝,紀錄新發現的品牌或設計概念。「 Samsung Galaxy S24 Ultra 拍照的內建相機非常厲害,白天晚上都不需要用到濾鏡,」顏君庭也分享智慧相片編輯 的妙用,他指出,差旅移動中隨手拍照,常常會拍到不想要的物品或背景,這時只要用 Samsung Galaxy S24 旗艦系列內建的生成式相片編輯功能,輕鬆選取物件,即可移動或擦除, AI 還會自動填充背景,「完全不用擔心照片拍得不好。」

D.jpg
內建「智慧相片編輯」,輕鬆圈選,即可移動或擦除物品, AI 運算自動填充背景。(右圖為完成畫面)
圖/ Samsung

此外,顏君庭也分享長途差旅的重要需求,他表示,由於海外出差行程滿檔,經常是清晨六點到深夜的行程,旅途中還需要拍照紀錄、開線上會議、收發即時通訊等,常因爲忘記帶手機充電線,需要跟店家開口要求幫忙充電,「 Samsung Galaxy S24 的高續航力也解決這個痛點,一整天高度使用竟然都還有電,讓我很放心。」

Samsung Galaxy S24 的簡潔設計,也讓他印象深刻。「我很喜歡 S24 超窄邊框的設計,讓整個手機畫面更清晰,不會被邊框干擾。」而深紫色的新色也十分特別,顏君庭分享到,「礦物在華人文化中有特別的寓意,例如這次拿到的深紫色非單調的色塊,而是帶有類似紫水晶的礦物感,也有點帶來事業與生活上的好運,整體設計很時尚,很符合商務人士的需求。」

建立「亞洲設計生態圈」串聯跨界連結設計

顏君庭會依據不同的使用需求變換裝置,例如隨身攜帶的手機,方便解決訊息、拍照、筆記或翻譯等即時需求,有較完整的工作時間時,則可用畫面較大的 Samsung Tab S9 平板接續處理。利用「快速分享」功能,跨裝置傳遞檔案,相互串聯。

「『智慧生態圈』(Samsung Galaxy Ecosystem)串連的模式,我認為很符合商務上的使用習慣,手機用來快速紀錄靈感、平板 進一步編輯;跨裝置的傳送省去了等待,又可以發揮每個裝置的優勢,讓我充分利用時間,」顏君庭說。

DSC00251.jpg
Samsung Galaxy Ecosystem 智慧生態圈,跨裝置串聯,可將Tab中的筆記直接複製於手機上,讓商務生活更加便捷。
圖/ Samsung

面對日益競爭的市場,顏君庭以三星電子的智慧生態圈裝置策略巧妙比喻, Pinkoi 將持續致力建造「亞洲設計生態圈」,未來兩年亦將更專注在跨境市場銷售,聚焦協助台灣設計師共同推展至日本市場。

如同 Samsung Galaxy S24 旗艦系列運用 AI 科技力作為解方,解決消費者的痛點,顏君庭也將帶領 Pinkoi ,強化 AI 運用,將更美好的生活與使用體驗,傳遞給更多消費者。

了解更多 https://pse.is/5wumz6

本網站內容未經允許,不得轉載。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
台日半導體新局 全解讀
© 2024 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓