NVIDIA AI 軟硬體技術與平台力助桃園機場捷運 打造結合互動語音 AI 與虛擬分身「霏霏」實踐無人客服智慧車站
NVIDIA AI 軟硬體技術與平台力助桃園機場捷運 打造結合互動語音 AI 與虛擬分身「霏霏」實踐無人客服智慧車站

桃園機場捷運是台灣關鍵的大眾交通運輸之一,負責承載國內外旅客進出境。桃園市與桃園大眾捷運股份有限公司長期致力於智慧化桃園機場捷運,希望透過智慧科技升級,讓捷運營運能夠提供更優質的服務,增強旅客體驗。因此,這次將互動語音AI及虛擬分身技術應用在車站旅客服務的創新開發,除了能展現台灣的資通訊技術,並希望藉由引人注目的技術讓民眾留下深刻印象,同時向海外旅客展示台灣的 AI 技術實力。

未來智慧車站以無人技術為起始點

桃捷公司為了打造一個充滿未來感的智慧車站,構想在車站實現以科技取代真人服務的目標,桃捷公司特別引進了 AI 語音客服系統,結合了專屬虛擬人物的動態展現,以近似於真人互動的方式回答旅客基本車站、票務、周邊交通與景點等相關問題。為了達到這個目標,桃捷公司與台灣在地開發商喬泰科技合作,採用了在業界具有相關實績 NVIDIA(輝達)的人工智慧(AI)軟、硬體平台和開發環境,經過了結合 NVIDIA 的技術諮詢服務 NVIDIA AI Enterprise 率先在機場捷運系統的 A18 高鐵桃園站和 A20 興南站導入虛擬智慧站務人員「霏霏」。

NVIDIA
圖/ NVIDIA

霏霏的設計上,除了要能如真人般與旅客進行實時互動,並因應桃捷擔任國家門戶的特性,霏霏必須自動即時辨識中、英、日、韓四國語言的理解提問,正確回答旅客的大小問題,包括站務、票據、乘車資訊及週邊旅遊景點等相關諮詢。當受到嚴重噪音干擾或遇到無法解決的問題,霏霏在第一時間也能轉由「學姊」,亦即真人客服提供服務,並同步將先前客服對話過程轉為文字敘述,便於真人客服快速釐清旅客的問題。霏霏不僅是台灣第一套基於完整 AI 互動語音與虛擬分身(Avatar)的客服系統,也是首度將 AI 語音技術與真人後台結合的客服系統。為桃園機場捷運系統注入科技、年輕化、國際化,以及既簡易便利又高效率的新氣象。該服務建立在相比點選螢幕更為直覺的 AI 自然語音互動基礎上,而站務人力資源則能更加妥善分配至其他站務所應用。

NVIDIA
圖/ NVIDIA
NVIDIA
圖/ NVIDIA

NVIDIA 軟硬體技術,充分滿足部署霏霏之所需

桃園捷運站務中心主任謝明融表示:「當這個計畫構想成形以後,最重要的就是如何找到能達成我們想要效果的合作夥伴與技術,在公開徵選時喬泰科技提出了以 NVIDIA 為核心的整體運用技術,在經過了評選之後成為我們的夥伴,歷經了多次的討論與修正,終於讓虛擬站務人員「霏霏」呈現在大家的面前,成為我們桃園捷運旅客服務的重要里程碑。」

喬泰技術長黃祥麟表示:「我們在向桃園捷運提案時即提出 NVIDIA 的平台是實現這套需要同步整合 AI、邊緣運算、雲端運算與虛擬分身的首選。歸功於 NVIDIA 多元完善的軟、硬體資源與開發環境,團隊得以針對 AI 與系統整合進行優化,實現這套台灣首創的落地元宇宙應用。」

霏霏背後的技術架構是採用霧運算(Fog Computing)的分散式運算方式,將不同延遲需求的工作流適時的分配給邊緣運算(Edge Computing)與雲端運算進行處理;熟悉 GPU 加速與 GPU 虛擬化技術的 NVIDIA 早在開發 AI 工具時便考慮到多種運算環境,因此能依據系統需求,順利實現霏霏的霧運算架構。

邊緣運算使用的是 NVIDIA GeForce RTX 3090 硬體系統,而雲端運算則串接到 Google Kubernetes (K8S) 平台,並結合 NVIDIA Triton 推論伺服器將霏霏邊緣系統所接收到的 AI 運算需求分流至邊緣系統與 K8S 平台。實際執行模式包括幾個重要程序:語言的輸入、語言的文字轉換、AI 語意理解與找尋問題的答案、結合虛擬分身與合成語音的解答。

解決了主架構設計後,更大的問題潛伏在落地的實際場域-霏霏所在場域是人流量極大、環境噪音複雜的交通要點。如何利用最新型降躁麥克風接收語音,並借助 NVIDIA Maxine SDK進行輸入語音降噪,使語音資料在進行文字轉化前更為乾淨、易於辨識,再把資料傳遞到基於 AI 的語音與語言模型神經網路模組進行語言理解,最後把輸出的回答結合 Unreal Engine 進行角色渲染與輸出。多項 NVIDIA 重要的自然語言技術是打造霏霏的核心,包括 NVIDIA Riva 語音人工智慧 SDK協助將旅客的談話辨識並轉化為文字、NVIDIA NeMo 大型語言模型(LLM)模型服務 做為霏霏提供自然應答的 AI 語言模型,以及利用 NVIDIA Triton 推論伺服器進行部署。

為實現流暢的 AI 自然語言互動,利用搭載 8 張 V100 GPU 的系統執行 NVIDIA NeMo Framework 進行 AI 語言模型訓練,進一步將基礎模型與站務、票據與觀光資訊等相關的資料投入訓練;不過受限於霏霏系統邊緣運算端的 GPU 運算效能與 VRAM,訓練完成的類神經網路模型仍進行壓縮,使邊緣端能夠流暢運作。

高效能運算和AI的應用與發展,已成為改變與主導未來世界的力量

霏霏是一個極佳的車站 AI 化的開始,透過 NVIDIA 的軟硬體技術與喬泰科技系統整合團隊技術的結合,包括像是大量應用WebRTC與gRPC等技術達成對話的「即時」性,能使每次對話回應控制在1秒以內,更使霏霏這個基於 AI 自然語言互動的虛擬分身實現了「即時」對話功能已達成相當程度的實用性。

霏霏率先證實以 AI 打造智慧車站客服平台系統的真實可行性,未來如霏霏這樣結合自然語言與虛擬分身的智慧服務系統也將陸續擴大至更多的大眾運輸系統,以提升大眾運輸系統的服務品質。結合 AI 運算的高效能 GPU 技術,同時針對各類 AI 應用率先提供開發者友善工具且不斷精進的 NVIDIA 軟硬體技術與平台,勢必將是引領此類智慧客服與虛擬分身應用的關鍵所在。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓