多了這項祕密武器,Google Assistant聽起來更有人味
多了這項祕密武器,Google Assistant聽起來更有人味

Google在今(5)日凌晨舉辦新品發表會,推出新的Pixel手機、Google Home、耳機Google Pixel Buds等,而這些裝置都有一個共通點,就是可以使用智慧語音助理Google Assistant,而Google也結合了新的技術,要讓語音助理的聲音聽起來更有「人味」。

1000倍的速度生成聲音,Google Assistant少了機械味

DeepMind的「WaveNet」系統,是去年Google推出了新的聲音生成工具,它並非靠著龐大的詞彙庫生成機械式聲音,而是使用深層神經網絡去建造聲音模型,模擬出來的聲音少了機械味更加自然,目前也導入最新版本的Google Assistant中。

目前建造語音助理聲音的主流做法,是由單個配音員錄製數個小時的語音檔案作為基底,再將這些錄音分割成小塊,依據需要組合成一個句子,因此聽起來會比較不那麼自然、連貫,過去WaveNet剛推出的時候,需要花上整整一秒才能產生0.02秒的聲音,所以一句兩秒鐘的「在仁愛路左轉」就需要花上快兩分鐘生成相當不實用;改良版的WaveNet可以在一秒鐘生成20秒的音檔,比原始方法快上1000倍,甚至還能以更高的採樣頻率建構聲音,每秒可以做出高達24,000個聲音樣本。

圖/ Deepmind

百度「Deep Voice 2」也能模仿人聲、口音

WaveNet使用卷積神經網絡去觀察語句中的結構,再去生成出新的樣本,特別的是生成出的新樣本都會考慮前一個樣本的屬性,因此產生出來的聲音、語調聽起來就連貫許多,也能大大減少機械感。因此未來如果想要語音助理講台灣口音不必辛苦的錄製檔案,只需要給WaveNet幾個小時台灣口音的樣本,它就能揣摩當中的細微之處,但目前新版本的Google Assistant僅支援美式英語與日語。

過去中國搜尋巨頭百度也曾研發一套能模仿人聲、口音的語音系統「Deep Voice 2」,能學習一個人聲音細微的差別,駕馭上百種不同口音,最厲害的是,Deep Voice 2只需要半小時的音檔資料就能完成學習。

目前百度的「Deep Voice 2」跟DeepMind的「WaveNet」都已經可以做到用深度學習的方式,讓傳統認為死板的機器語音增添個性,甚至形成一套風格,而一般較為熟悉的蘋果語音助理Siri,雖已可以做到模仿區域性口音,但是透過較傳統的方式,耗時上千小時的真人音檔錄製,且工程師還需花費較長時間做調校。

智慧語音助理除了要夠聰明,口音、語調能夠因地制宜也成為趨勢,除了用戶聽起來舒服外,透過不同的聲音來朗誦電子書、新聞,或許也是未來內容製作的新趨勢。

往下滑看下一篇文章
中華電信前進Meet大南方:以數位生態協創 引領AI時代競爭力
中華電信前進Meet大南方:以數位生態協創 引領AI時代競爭力

在新興科技快速發展的時代,企業的智慧轉型與產業的持續進化,仰賴跨域協創夥伴的協同合作。作為數位生態協創者的中華電信,近年來積極推動產業合作,並在2025 Meet Greater South亞灣新創大南方主題論壇「南方創新力:亞灣AI半導體經濟論壇」上,展示海地星空網路全面涵蓋、AI資料中心、AI運算與雲端資料庫等,彰顯其在AI時代的核心價值。此外,中華電信也分享了多項AI應用落地實績,示範如何透過Agentic AI的判斷與決策,以及各式客製化的創新流程,為產業注入新動能。

中華電信企業客戶分公司副總經理梁冠雄表示,公司自1996年民營化以來,持續深耕電信本業並大力拓展數位整合服務,如今已躍居台灣市值前十大公司。近年來更瞄準AI趨勢,積極與生態夥伴、垂直應用方案業者跨域合作,一路由電信服務提供者(CSP)、數位服務提供者(DSP)、數位服務賦能者(DSE)走向數位生態協創者(DEC)。透過不斷的業務轉型,中華電信展現了身為電信業者在數位時代的新價值,同時協助企業提升數位韌性與創新競爭力。

為此,中華電信將持續整合以AI為首的七項新興科技,包括智慧物聯網(AIoT)、大數據(BigData)、雲端(Cloud)、資訊安全(Data Security)、邊緣運算(Edge Compute)、5G(fifth Gen)及生成式AI(GenAI),為企業提供從AI基礎建設到創新應用的一站式服務,希望加速賦能百工百業發展AI應用、共同創造更大價值。

中華電信3
圖/ 數位時代

AI關鍵價值1》:海地星空與全光網路,為AI落地應用加速

梁冠雄指出,中華電信透過網路全面涵蓋、AI資料中心(AIDC)與雲平台的AI基礎建設,為企業帶來三大關鍵價值。

首先,中華電信透過「海地星空」網路,打造具高度韌性的連網環境,解決企業通訊中斷的痛點。除了全台第一的固網與行動網路外,中華電信更持續強化海纜建設,近年來投入大量資源發展衛星通訊,已具備低軌、中軌與高軌衛星的完整能量。藉此,無論國內外,中華電信都能透過海纜與衛星等高度韌性網路,為企業提供通訊雙重保障,確保暢通無虞。

同時,為因應AI大量資料傳輸的需求,中華電信亦積極佈局全光網路(All-Photonics Network,APN),2024年與日本NTT合作,以100 Gbps光傳輸頻寬進行跨國資料傳輸測試,資料往返時間僅需約為33.84毫秒,效率遠超過傳統單向傳輸需花費200~500毫秒。梁冠雄表示:「此次測試結果證明,全光網路有機會實現分散式AIDC的創新運作模式。」藉由全光網路超高速、低延遲和低功耗的傳輸特性,讓資料和運算資源可分散兩地,突破地點限制,賦予企業AI策略更高度的彈性。

中華電信4
圖/ 中華電信

AI關鍵價值2》:AI 資料中心升級,打造彈性高效的算力服務

在AI資料中心方面,中華電信已將既有的IDC升級為AIDC,並正式推出「hicloud AI算力雲」GPU雲端租賃服務,為有需求的企業提供AI算力雲租借服務。

梁冠雄強調,企業只需依照實際使用時間來支付費用,不必投入高額成本去購置硬體,即可滿足在AI高效能運算上的即時需求,大幅提升取得AI運算資源的靈活度與彈性,同時降低研發成本,快速搶佔技術先機。此外,考量到AIDC在耗能與散熱上的挑戰,中華電信亦規劃導入直接液冷與沉浸式等散熱技術,為大規模GPU部署提前做好準備。

AI關鍵價值3》:串聯台灣前四大公雲,提供AI特色服務與可靠雲端環境

中華電信完整布局公雲服務,除自有雲端品牌hicloud,亦是AWS、Azure及GCP三大國際公雲的重要合作夥伴,更自主研發各項雲平台特色服務,例如:雲網安整合的資安防護、CMX專屬電路直連雲端、CMP多雲管理平台及加密分持等,為企業打造更安全、穩定且高效的雲端運行環境。

舉例來說,企業可以透過CMP同時管理兩個以上的雲端環境,或透過加密分持服務,避免資料過度依賴單一雲端而導致的營運風險。梁冠雄說明,加密分持機制將企業的資料備份分切成三份,並分別儲存在不同公有雲上,日後若遇到資料毀損或系統停擺等情況,只要將三份資料集結起來就能恢得運作,達到高可用與高安全的效果。

此外,搭配自主研發的AI Factory平台,讓企業可以低代碼方式,開發AI模型與應用,並執行應用所需算力與雲資源。

中華電信1
圖/ 數位時代

Agentic AI應用》以數位韌性驅動智慧城市、交通與醫療創新

在AI基礎建設外,梁冠雄亦分享中華電信在智慧城市、智慧交通與智慧醫療的Agentic AI應用實例。

以智慧城市應用為例,中華電信打造的AI淹水預警及輔助決策系統,能根據影像監控自動判斷災害等級,並據此自動進行應對措施決策,例如抽水設備調度、避難指引、淹水示警等。在智慧交通管理上,中華電信結合VLM技術打造的交通壅塞預警及輔助決策系統,不僅能判斷道路壅塞或車站人潮擁擠的程度,還能偵測交通事故,並依事件的嚴重程度及提供決策建議。在智慧醫療領域,中華電信同樣投入大量心力,以AI完善病患從看診前、看診中到看診後的所有流程,不僅提升了醫療效率,也讓醫護人員能更專注於病患照護,真正展現智慧醫療的價值。

梁冠雄強調,未來中華電信將以數位韌性為核心,持續深化AI基礎建設與創新應用的雙軌布局,並期待與更多新創攜手合作,將創意與技術落地,共同打造多元共榮的產業生態系。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓