用說的更方便!語音輸入帶來行動新商機
用說的更方便!語音輸入帶來行動新商機
2014.07.25 | 科技

現今的智慧型手機幾乎皆有語音輸入功能(iPhone的Siri、HTC的Hidi、Yahoo!的語音數位助理等)。根據美國的調查 ,2012年擁有iPhone 4S的使用者當中有87%的人至少一個月使用Siri一次,30%以上的人幾乎每天透過Siri打電話、發信或蒐集資訊。Gartner在「Hype Cycle for Emerging Technologies, 2012」中提到:「語音辨識技術目前正處在啟蒙期,在未來的2~5年之間將成為主流並進入生產穩定期」。智慧型手機使用Google Now的語音輸入系統,Apple與 NUANCE技術合作開發語音廣告等,皆顯示語音輸入將是未來重要開發趨勢。本文從過去觀察使用者使用語音輸入的行為,說明使用者對於語音輸入功能的需求。

使用語音輸入功能的人群特徵和需求

「追求效率」與「追求簡單」為使用語音輸入功能的兩大主要目標,擁有不同目標的使用者在使用需求與偏好上有很大的差異(表一)。

【表一】語音輸入功能使用者人群與使用特性
enter image description here
資料來源:beBit

「追求效率者」的需求是透過自然地對話有效率的完成操作。在實際調查中發現,智慧型手機使用頻率高的使用者往往屬於此類,他們希望透過語音輸入簡短問答,直接獲得結果。因此偏好可以一次完整輸入的Siri型操作模式。

「追求簡單者」的智慧型手機使用頻率不高,平常不習慣手機文字輸入介面,操作畫面也不容易,所以想要透過語音輸入更簡單的完成指令,特別是高年齡層的使用者屬於這類。這類使用者無法適應Siri等操作性高的語音輸入,反而偏好一問一答的輸入形式。例如是銀行匯款,他們期待從選擇「匯款」的大分類漸漸進入細節的內容,因為在操作前對於完整的操作內容沒有概念也不想思考,對於一問一答的輸入形式感到方便性。

圖一以透過語音輸入功能完成「銀行匯款500美金到老婆戶頭」的任務為例,顯示兩種人群的使用情境:

【圖一】語音操作「銀行匯款」使用情境
enter image description here
資料來源:beBit

語音輸入功能所帶來的新商機

以往,高年齡層的使用者由於手機螢幕與文字鍵盤的限制導致部分使用者被排除在目標客群之外。透過調查,我們發現對於語音輸入功能的需求比較大的反而是「追求簡單」的高齡人群,根據beBit的使用者觀察,一旦開始使用語音輸入的使用者會漸漸遠離文字輸入,「是」、「否」等簡單的選項也開始偏好語音回答,剛開始對語音密碼有顧慮的使用者,漸漸毫不猶豫的朗誦自己的密碼,使用者似乎無法再從語音輸入回到文字輸入的模式。可見語音輸入功能可以降低這類高年齡層人群使用手機的障礙,增加使用手機服務或APP的動機。

2013年美國金融集團USAA將語音輸入系統導入手機網路銀行APP(如圖二)。該系統可以設定聲紋密碼,只要本人下令指示任務,APP便會連到銀行系統進行處理,完成後還會告訴你「已完成任務」。即便如網路銀行此等安全性要求如此高的APP,美國的金融機構皆已開始導入語音輸入功能,可見語音輸入在國外已經被相當重視,且增加語音輸入功能也是拓展網銀使用族群從較年輕化族群往更多高齡者邁進的做法,這樣的趨勢無論是手機開發商、APP開發者皆不可忽視的一股力量。

【圖二】USAA Voice Command Mobile App
enter image description here

(圖片來源:American Banker

為提供提升滿意度或開發差異化的新服務,語音輸入功能是個充滿前景的方向,然而語音輸入功能和文字輸入功能的使用者有很大的差異,對於資訊的輸入結構與服務呈現結構的需求也不同。一般來說,網路使用行為目的性高、自主性強,但是使用語音功能的行為傾向是被動的;例如語音輸入者在輸入後等待機器的審核及下一個指示,相較下,文字輸入者會主動地點擊按鍵。如果這些服務的結構設計或畫面不符合使用者需求,最終就只是白白浪費了投入的開發成本,或許有可能目前的技術限制根本就無法滿足使用者的需求,因此,在進行開發時,首先須從了解使用者的需求開始。

本文出自beBit

往下滑看下一篇文章
AI 智慧代理人時代來臨!三大導入階段, AI 落地企業不卡關
AI 智慧代理人時代來臨!三大導入階段, AI 落地企業不卡關

生成式 AI 帶動企業數位轉型浪潮持續升溫,各界不再滿足單一任務型的 AI 應用,而是期盼 AI 能真正成為具備主動決策與多工能力的「智慧代理人」(Agentic AI),在最少人為干預的情況下,自主推進工作流程、完成複雜任務。

但企業導入AI並非一蹴可幾,而是需要對AI有正確認識,並制訂循序漸進的導入流程,才能真正發揮AI功效。在2025台灣人工智慧年會中,cacaFly 聖洋科技技術副總吳振和提出三大導入關鍵階段,深入剖析企業如何從概念驗證(PoC)階段,逐步推進到實際上線(Production),並分享實務經驗與觀察。

延伸閱讀:生成式AI可以怎麼用?cacaFly現身說法,助企業應用GCP服務智慧轉型

解鎖 Agentic AI,企業邁向多任務智慧代理

「很多公司會問,One AI 要做什麼事?但實際上,若要讓 AI 回答公司內部政策或新法條的相關問題,僅靠基礎模型並不足夠。」吳振和指出,要讓 AI 真正成為能「做事」的智慧代理人,前提是它必須理解企業內部的脈絡與知識,並即時掌握外部變動的資訊。

企業必須先釐清內部規範是否與最新法規相符,這意味著系統必須具備持續爬取與解析最新資料的能力。為此,企業必須先截取與整理內容,再建構成專屬的知識庫(Knowledge Base),確保資料品質達到可用標準後,再透過檢索增強生成(Retrieval-Augmented Generation, RAG)技術,使 AI 能夠即時動態查詢並生成符合企業語境的回答。

延伸閱讀:從資料清洗到 RAG,大型語言模型的必需品,做出專屬企業的 AI 知識庫!

吳振和強調,這是一個動態循環的過程:從資料蒐集、品質控管、知識庫建構到生成應用,每一環節都息息相關,任何一處鬆動都會影響最終產出的準確性與可信度。

cacaFly 聖洋科技技術副總吳振和
圖/ cacaFly

破除「一次到位」迷思,從驗證到落地的三大關鍵階段

許多企業對 AI 寄予厚望,因此常將 PoC 視為年度計畫的重點,希望能「一次到位」做出具體成果。但吳振和提醒,若缺乏清楚的系統工程思維,PoC 容易淪為「概念展示」,難以真正走入組織的日常營運。

他將導入 Agentic 系統工程的歷程,分為三個關鍵階段:

1.第一階段:可行性評估(Feasibility Study)
企業必須在投入資源前,先明確界定「最需要被 AI 解決的關鍵問題」是什麼,並進一步設計可量化的驗證指標。這不僅包括評估技術實作的可行性,更要從商業目標出發,釐清導入 AI 的具體使用情境、預期成效與風險邊界,如此才能確保後續模型選型與資料蒐集方向正確對齊業務需求。

2.第二階段:系統設計與驗證(Design & PoC)
在確定導入方向後,必須規劃清楚資料蒐集與整理流程,確保知識庫的內容具備正確性、完整性與時效性。吳振和特別強調,這個階段不能只追求展示效果,而應以「產品化思維」來構築 PoC,使其具備可擴充性、可維護性及安全性,才能為後續上線打下基礎。

3.第三階段:產品化與營運(Production & Operation)
當 PoC 驗證完成後,進入正式上線階段,挑戰也隨之而來。除了需要整合企業內部系統與流程,還必須建立持續監控與維運機制,確保模型表現隨時間演進不會劣化,並能快速回應法規變動或資料更新的需求。吳振和指出,這往往是最容易被低估、但也是最考驗企業組織能力的關鍵環節。

cacaFly 聖洋科技技術副總吳振和
圖/ cacaFly

建立模型優化根基,打造高品質的黃金資料集

吳振和特別強調,要讓 Agentic 系統工程真正發揮效益,企業必須先建立一套高品質的「黃金資料集」(Golden Dataset),作為模型評估與優化根基。他指出,黃金資料集的價值在於能為模型選擇與前測提供客觀依據,讓團隊能針對不同任務挑選最適合的模型,避免導入初期就誤踩方向。

同時,黃金資料集也能協助團隊辨識模型的常見錯誤與脆弱點,進而快速回應「模型飄移」(Model Drift)的風險。吳振和說明,所謂模型飄移,指的是即使模型本身未經改版,效能也可能隨著環境與資料變動而突然下降,導致原本表現良好的模型出現偏差。透過持續比對模型預測與黃金資料集結果,團隊才能即時察覺效能衰退,並進行迭代更新,確保系統長期穩定運作。

從小規模應用起步,漸進擴展至核心業務

吳振和分享,在實際輔導企業導入 AI 的經驗中,最常見的挑戰來自於「期待落差」。許多企業誤認為概念驗證(PoC)階段即可呈現完整的產品原型,然而實際情況顯示,若企業未能建立完善的資料架構與流程基礎設施,即使短期內展現亮眼成效,也難以確保長期營運的穩定性與可持續性。

也因此他建議企業在規劃 AI 導入時,應採取漸進式策略,從小規模應用場景著手,逐步擴展至核心業務領域。企業應將 PoC 定位為整體產品開發生命週期的重要環節,而非獨立的一次性專案。

AI 的導入不僅是一場技術升級,更是企業組織文化與決策流程的轉型工程。唯有從資料治理、流程優化到人才培訓同步布局,才能確保 AI 能在企業內部真正「落地生根」,創造長期商業價值,成為真正的智慧代理人。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓