講話帶有「台灣味」的Google助理正式誕生,和Siri比誰聰明?
講話帶有「台灣味」的Google助理正式誕生,和Siri比誰聰明?
2018.10.17 | Google

10月16日這一天,Google在台灣又跨出了兩步:

台灣成為第13個Pixel手機進駐的市場,推出了第一支Google Pixel 3外,第二點則更加振奮人心——語音助理Google Assisant在2016年的I/O開發者大會首度亮相後,現在終於有了中文版本,而第一站就選在台灣上線。

這下,Android裝置終於有自己「會講中文的Siri」了。

Google助理、Siri誰聰明?

無論是從智慧音箱潮爆發,還是行動裝置語音助理發展趨勢來看,「語音」無疑有望成為下一個最自然的人機操作介面。

Google助理2.png
搭載Android 5.0以上的裝置,即日起開始可陸續使用中文版Google助理,官方表示,不久的將來iPhone也可以更新使用。
圖/ Google助理官網

在上個月剛推出的iOS 12中,Siri不只開始有性別可選,大改以往「冷冰冰」的形象,聲音變得溫柔,還有情緒語調,更像在和「真人」在對話,透過新的「捷徑」功能,只要先設定好跟Siri講某一句話,便可讓Siri執行一系列串連好的動作。

至於Google助理,雖然在英文版上聲音多變,甚至還找來R&B歌手John Legend獻聲,但中文版目前則先採用民眾最熟悉的「Google小姐」的聲音,透過AI、機器學習醞釀了兩年,才讓中文版Google助理出道,不如來比比「內涵」,誰更聰明一些?

時下流行詞彙

像是「如懿傳」、「延禧攻略」,Siri和Google助理基本上都能辨識,但當問到「延禧攻略演員有誰」時,Google助理非常直覺地給了更多答案。

英語單詞

兩者都不支援純英文,但若在中文中夾雜英文單詞,簡單的單詞基本上還是都可以辨識,但Google助理出錯的機率較小。

打開App,進行一串連續操作

兩者都可以幫忙打開App,但若是要打開YouTube上播某一首歌,Google助理較能連貫執行;若是以判斷使用者現有狀況,給出相關資訊,像是說「我起床了」,Google助理會主動報時並給出天氣資訊,Siri不會,但這可通過Siri的捷徑功能設定。

講笑話

Siri和Google助理都會,也可進行輕鬆的對談。

呼喊對手的名字

總體來說,Google不僅直覺、也聰明不少,但若iOS用戶知道自己常常需要用到哪些功能,先到「捷徑」設定好,也能方便許多。

跟以前的「OK Google」相比,Google助理不同處在哪?

不少人可能會想,以前靠一句「Ok Google」也能透過語音來執行任務,和現在中文版的Google助理,究竟差別在哪?先來看看在發表會上,Google助理做了什麼:

過去靠一句「Ok Google」可以喚醒語音輸入,來進行搜尋,執行一些指令,像是在網頁上幫忙找答案,或是執行設定鬧鐘等日常事務。假設你説「Ok Google,我要設定鬧鐘」,當鬧鐘的設定框被叫出,如果還要用語音輸入鬧鐘到底要設幾點,則得再說一次「Ok Google」,才能再次喚醒語音輸入功能,並不能進行連貫的操作,可以說 只是透過「語音辨識」,單純的執行任務。

而現在的Google助理,同時掌握語音跟文字理解的能力,可以理解就是Android版的Siri,會透過AI跟你進行對話 當你說「Ok Google,講個笑話給我聽」,過去只會幫你在網頁上搜尋「講個笑話給我聽」,而現在Google助理會真的講一個笑話;此外,針對Google軟體的整合與執行力也大幅提高,如要導航去某處,Google助理會直接幫跳出Google Maps執行,若要在YouTube上聽輕鬆的音樂,他就會打開YouTube後搜尋「輕鬆」頻道,不用再用手點螢幕,或是再喚醒一次語音輸入,即可執行連貫的操作。

Google助理.jpg
當然,最方便的事,莫過於叫Google助理幫忙翻譯了,他會直接串連網頁的Google翻譯,並唸出來,應該也算語言最齊全的翻譯機了吧?
圖/ 唐子晴/攝影

Google AI資深研究員宋雲軒表示,Google助理以「語音辨識」、「自然語言處理」為基礎,透過AI、機器學習而生,所以不單單是「執行」,還有對自然語意的理解,讓Google助理判定當下該怎麼做,透過和使用者一次次的對話學習,變得更聰明,也更懂用戶。

學習語言非常難,如何讓Google助理有「台灣味」?

「20年前,Google的目標就是要彙整全球所有的資訊,讓用戶都可以存取使用,剛剛開始只是一個網頁搜尋框;到了2007年,智慧型手機問世,現在Google發現超過一半以上的搜尋都來自型裝置,其中五分之一更是用語音來完成。」宋雲軒說道。

Google助理在2016年英語版本問世後,就不斷想推出不同的語言版本到不同的市場,但介於每種語言背後,其文化底蘊博大精深,這讓執行上相當困難。若單單看最複雜的語言之一中文,到底難在哪?他舉了三點:聲調、上下文跟斷句。

中文有四聲調,即便原音相同,但聲調不同就差遠了,例如「我想要水餃」跟「我想要睡覺」;而若是面對比較長的句子,上下文的差異,也會影響解讀,如「我以前,喜歡一個人」、又如「我現在,喜歡一個人」,更別說更長的句子,斷句也影響了原意。

google助理.jpg
Google AI資深研究員宋雲軒表示,目前中文版Google助理或許可以解讀夾雜一些英語單詞的句子,但若要雙語言都支援,可以同時理解,難度太大。
圖/ 唐子晴/攝影

而Google在這2年內,需要大量的資料來進行機器學習,包括匿名使用者、自願者的數據,但並不是「中文資料」都可以,「同一個詞,在台灣、中國、馬來西亞會有不一樣的說法,我們會針對當地使用者的用法來學習,所以台灣版本,就用台灣用戶的資料來處理。」

針對語音,應該是搜集之前「Ok Google」的使用者的歷史資料來學習;若針對文字,則是用採用Google網頁上的搜尋紀錄,除了介面是繁體中文,對於用戶用語和發音的理解也都源自台灣,這也是為什麼,在台灣上線的Google助理有股「台灣味」。

幫人打電訂餐的Duplex、智慧音箱Google Home,會來嗎?

Google助理作為自家AI代表之一,最令人印象深刻的,莫過於今年5月I/O開發者大會上展示的新功能「Duplex」,當Google助理有了Duplex,只要跟Google助理說「幫我訂某某餐廳,兩位」,Google助理就會自己打電話完成,當遇到突發狀況,也能自然地解決,重點是還會「仿人聲」,對話之中會夾雜「嗯」、「呃」等語句中間詞語,讓電話另一頭完全聽不出來這不是真人。

這項技術限制在封閉場景中,執行一些特定的任務,因為在任務中場景涵蓋的內容夠少,讓 AI可以充分地進行深度學習,Duplex便能讓對話過程盡可能自然,電話另一端的人,可以像和另一個人說話一樣自然地交流,目前美國仍處實驗階段,Google官方表示雖然中文版暫無此計劃,但就像「剛學會走路的孩子」,未來也不排除採用。

令人期待的是,既然中文版Google語音助理來了,那麼以語音為最主要技術的Google Home是不是也有望登台?

「目前沒辦法多做說明,我們要先進駐Android和iOS裝置,但談到Google助理進駐物聯網,智慧音箱、車聯網一直是我們深耕的方向,」雖然又是模稜兩可的官方回答,在全球智慧音箱爆發之際,台灣已經有了「遠傳愛講音箱」和「小豹AI音箱」,但一來量體不夠大、使用者資料不多,在AI語音學習上還需要時間,二來圈起的服務生態系太小,仍有很長的路要走,但隨著Siri、Google語音助理在「中文聽說讀寫」上更成熟,「語音」成為下一個人機介面已勢不可擋。

往下滑看下一篇文章
全台首創對話式金融服務iWish 永豐銀讓GAI真正走進金融交易現場
全台首創對話式金融服務iWish 永豐銀讓GAI真正走進金融交易現場

你還在手寫填單、逐格Key-in資料嗎?在生成式AI浪潮席捲各行各業之際,永豐銀行推出全台首創「說話就能完成交易」的智能對話式金融服務iWish,讓繁瑣的填單流程成為過去式,使用者可以透過文字輸入、口說敍述或上傳照片等方式,向AI傳達自身需求,無論哪一種方式,AI都可以即時理解使用者意圖,並根據與使用者的對話內容,自動填寫存款、提款、轉帳、匯款等相關表單,顛覆使用者對金融服務的想像。

生成式AI再進化,開啟AI代理人時代

隨著生成式AI的進步,LLM大型語言模型已具備多輪對話和上下文理解的能力,甚至正邁向可以獨立完成任務、不需要人類涉入的AI代理人(AI Agent)的新階段,這項技術突破讓企業既有服務得以展現全新樣貌。

以國際證券經紀商FBS為例,其推出的FBS AI Assistant服務,跳脫傳統單向建議模式,不直接提供評論或建議,而是讓用戶先選擇一至多項技術指標,再交由生成式AI模型解讀並生成專屬分析與操作建議,打造更具互動性與參與感的使用體驗。

永豐金控數位科技長張天豪認為,這種以生成式AI為核心的互動式服務模式,將大幅優化客戶的使用體驗,成為金融服務新常態。未來,客戶不必學習如何操作App,也不用記得交易程序,只要用對話、上傳照片或螢幕截圖等自己習慣的方式表達需求,AI就會理解並協助完成後續動作。「未來的金融服務將像生活中人與人之間的對話一樣,簡單而自然,」張天豪強調。

永豐銀行
前排由左至右:永豐金控數位科技長 張天豪、永豐銀行資訊、數位及作業督導張升寶、永豐銀行綜合企劃處處長 王筱嵐 後排由左至右:永豐金控數位科技處專案經理 林維婕、永豐金控數位科技處專案工程師 廖庭暘
圖/ 永豐銀行

從填單到對話,iWish重塑分行服務體驗

瞄準此未來趨勢,永豐銀行進一步盤點金融服務場景,決定從最貼近客戶的分行場域出發,打造互動式服務新體驗。

張天豪說明,臨櫃交易往往需要填寫各式各樣的表單,這些表單格式通常很制式、欄位繁複,對不熟悉流程的客戶而言,常常填到一半才發現格式錯誤、填錯位置,甚至必須整張重來,徒增挫折與作業時間。

「iWish服務的推出,就是為了讓這段流程可以變得更自然、直覺且輕鬆,」永豐銀行資訊、數位及作業督導張升寶說,客戶不再需要手寫填單,只要開口說、輸入文字或是上傳圖片,告訴iWish想要使用哪些金融服務,就可以完成交易,將原本繁瑣、仰賴經驗的填單作業,轉化成只需一句話或一張圖就能搞定,大幅提升臨櫃交易的服務體驗與作業效率。

以轉帳交易為例,客戶可以口說轉帳帳戶及金額,或是上傳網購訂單的轉帳頁面截圖、團媽在Line上提醒轉帳付款的對話截圖等,iWish會從中辨識表單所需資訊並精準填入銀行系統中對應的欄位,待客戶確認資訊無誤之後,系統就會生成一個二維條碼,只要將二維條碼交由臨櫃人員完成最後核對,就能輕鬆完成金融交易。

AI減輕行員負擔,專注更高價值服務

除了顛覆客戶的使用體驗,iWish服務也為內部作業流程帶來優化和改變,「對永豐銀行而言,iWish服務不是引進AI技術的炫技展示,而是與現有服務模式的無縫融合,讓創新落地、貼近人性」,永豐銀行綜合企劃處王筱嵐處長說。

王筱嵐進一步表示,最開始,金融交易需要經歷「客戶填單+櫃員輸入」的雙重程序,不僅耗時,也容易出錯。之後,永豐銀行推出免填單服務,客戶可以口述或將交易資訊抄寫在紙上,交由櫃員輸入至系統中、列印單據,待客戶簽名確認即可完成交易。

永豐銀行
圖/ 永豐銀行

而iWish則是免填單服務的再進化,藉由生成式AI(GAI)的語意理解與圖像辨識能力,取代櫃員的手動輸入作業,不僅提高效率與準確度,也大幅降低櫃員的作業負擔,可以將心力投注在更有價值的服務與溝通上。

GAI不只是客服輔助工具,更是金融轉型的推進引擎

相較於目前金融業的生成式AI應用,多數仍停留在客服階段,iWish是全台首創直接導入金融交易場景的GAI服務,堪稱跨出關鍵一步。

然而,在實際開發過程中,永豐銀行團隊也面臨諸多挑戰,其中壓力最大的,便是如何降低LLM可能出現的「幻覺」與辨識錯誤風險。尤其在金融交易場景中,AI的辨識精準度不僅關係到客戶權益,更直接影響其對金融服務的信任感,必須以更審慎的態度來看待。

為此,永豐銀行從多個面向著手提升模型準確度,包括優化Prompt設計與模型邏輯、與前線單位密切協作,共同討論介面呈現、使用流程與應用情境、在UI/UX介面加入提醒文字與引導機制,避免造成誤解。此外,團隊也分階段進行大規模封閉測試,邀請全行數百位同仁參與測試,並根據測試結果持續微調優化,確保最終推出的服務穩定度。

iWish的智慧來自於訓練與學習,「越用越聰明」的特性需要使用者參與激發

iWish是一款全新上市的智能服務,專為提升臨櫃交易體驗而設計。現階段iWish服務聚焦於台幣存款、提款、轉帳及匯款4大交易類型,並以「分行」為主要場景,未來則計劃將iWish服務擴展至更多金融交易類型,甚至走出分行場景,與iBranch等線上服務結合。

永豐銀行
永豐iWish以「智讀」、「智說」、「智寫」人性化操作,讓金融交易更方便快速
圖/ 永豐銀行

iWish的成功落地不僅是技術突破,更宣示意味著,生成式AI正式從客服輔助工具,搖身一變成為可以理解意圖、自然回應、主動引導的智慧助理,讓用戶在熟悉的對話情境中完成交易,實現真正以人為本的金融體驗。而AI模型的成長需要訓練,iWish在初期也需要客戶的參與來變得更聰明,透過接觸到更多元的使用情境,進一步完善服務,讓每一次互動都更懂客戶的需求。

「iWish服務只是第一步,」張升寶認為,這項服務不僅重新定義人與銀行的互動方式,也為生成式AI在金融業的應用看見新的可能。他期許未來能進一步擴大AI Agent應用範圍,讓AI不再只是輔助工具,而是驅動金融轉型的核心力量。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓