機器人講話也能帶感情,文字直接轉成聲音!NVIDIA展示AI語音合成技術成果
機器人講話也能帶感情,文字直接轉成聲音!NVIDIA展示AI語音合成技術成果

語音應用讓人與人之間的互動有了改變,也讓生活變得更加有趣。NVIDIA深度學習應用研究部門副總裁Bryan Catanzaro表示,NVIDIA一直在思索如何透過AI強化人與電腦的互動,而「語音」技術的強化,就是其中一個重要指標。

五年前Amazon Alexa智慧音箱的出現,重新定義了人與機器互動的方式,可以命令Alexa播放音樂、開冷氣,甚至和Alexa聊天,人們可以透過語音做更多的事情,在科技應用的重要性逐漸增加。

除了讓機器人聽懂人話,NVIDIA表示,下一步就是要賦予機器人帶有「感情」的說話能力,將人機介面帶往更高層次。

AI聲音技術加持,讓機器說話帶有「感情」

而這有賴於表達性語言合成技術,透過對話式人工智慧模型為角色、虛擬助理及個人化數位分身產生聲音。例如透過NVIDIA RAD-TTS技術,使用個人說話的聲音來訓練文字轉語音模型,即能將任何文字提示變成說話者的聲音。

此外,該技術還支援聲音轉換功能,例如影片中是 A 在說話 (甚至是唱歌),觀眾們聽到的卻是 B 的聲音。NVIDIA談到,RAD-TTS設計靈感是將人聲當成一種樂器,使用者便能夠逐幀微調合成聲音的音調、持續時間和能量。

例如應用在電影製作中,導演可錄製自己讀出影片腳本的聲音,接著用 AI 模型將說話內容變成女性旁白者的聲音。導演可以再運用這個基本的旁白內容,像配音員一樣指導 AI 並進行調整,讓合成出來的語音強調特定字眼、修改旁白節奏,以更貼切地表達影片的調性。

不只配音,其中文字轉語音的功能還能用在遊戲、協助聲音機能或語言機能障礙者,或幫助使用者用將自己的聲音翻譯不同語言;甚至還能重現著名歌手的表演,不僅可以配合歌曲旋律,還能配合人聲背後所表達的情感。

圖/ NVIDIA

表達性語言合成只是NVIDIA Research 團隊在對話式 AI 的其中一項研究,這個領域還包括自然語言處理、自動語音辨識、關鍵字偵測、音訊增強等。這項先進研究成果的部分內容已透過 NVIDIA NeMo 工具套件成為開放原始碼,可以在 NGC 容器及其它軟體中心取得,並經最佳化調整,能在 NVIDIA GPU 上高效執行。

不過他也透露,目前AI語音最大挑戰在於延遲性問題,由於機器回應的速度不夠即時,連帶會影響人機互動的感受,讓對話看起來較沒有這麼自然。該公司也正積極努力克服這項技術挑戰,隨著技術的更迭與數據資料的累積、分析,相信這個問題將很快會被解決。

【熱門焦點】

麥當勞APP首度改版!3大功能亮相,點點卡變行動版、免帶卡就能賺積分

取件「得來速」、維修致敬「鼎泰豐」,微星旗艦展服中心下一步要做什麼?

最新9月號雜誌《2021年台灣網紅生態全解析》馬上購:傳送門
「電子雜誌」輕鬆讀:傳送門

責任編輯:錢玉紘

關鍵字: #Nvidia
往下滑看下一篇文章
從邊界防護走向全域零信任:HPE Networking 如何打造 AI 時代的企業網路安全架構?
從邊界防護走向全域零信任:HPE Networking 如何打造 AI 時代的企業網路安全架構?

隨著越來越多的企業開始擁抱AI ,以及雲端與混合辦公的快速發展,企業內部各項應用程式與機敏資料大規模向多雲及 SaaS 環境遷移,傳統以「邊界防禦」為核心的資安堡壘正在失效。當企業邊界因遠距協作、邊緣運算及爆發式成長的 IoT 非受管設備而變得模糊,攻擊面隨之急遽擴大,讓過往依賴 VPN 與單點式防火牆的防護機制,在面對分散式 IT 環境時顯得捉襟見肘。

這種環境的破碎化,為企業帶來了前所未有的治理挑戰:IT 團隊不僅難以精準掌握「誰」正在「何地」存取「哪些」資源,更面臨各據點間安全控管標準不一的困境。一旦駭客突破薄弱的邊緣節點,傳統缺乏細緻控管與整體可視性的架構,將使其能輕易在網路內部橫向移動,讓企業曝露於巨大的商業風險之中。

面對 AI 時代日益複雜的威脅,建立一套從邊緣到雲端、從使用者到應用程式皆能覆蓋的整體性網路安全架構,已成為企業轉型的關鍵課題。

HPE Networking 以「全域零信任」重塑資安防禦架構

面對 AI 驅動的工業化網路犯罪,傳統「檢查清單式」防禦已難以應對具備專業分工的全球化攻擊組織,因為如今駭客透過人工智慧技術將攻擊手段自動化、精準化與規模化。HPE Networking 台灣區總經理林蒲英指出,資安已從技術選項轉變為企業生存準則。隨著企業IT架構日益分散,安全防護不能再是事後補強或附加的功能,而是必須內建於網路架構的核心。為此,HPE Networking 結合 AIOps 與零信任架構的安全網路戰略布局,協助企業深度融合網路連線與安全性,將防禦重心從脆弱的傳統邊界防護轉向「全域零信任」與「自主防禦」的堅實基礎。

建構全方位防禦矩陣:從存取控管到核心資料中心的安全實踐

HPE Networking 透過整合式安全架構,從使用者入口、傳輸連線到資料中心內部,提供層層遞進的防護力,協助企業打造真正可落地的零信任防護架構。

首先,針對最前線的身分與裝置權限,HPE Networking 提供基於雲端的網路存取控制解決方案Central NAC與Mist Access Assurance,透過自動識別並驗證所有連線裝置的身分,統一控管使用者與裝置的網路存取權限,避免未授權連線成為資安破口。相較傳統地端 NAC 架構,企業透過雲端管理模式,得以簡化存取策略與維運流程。

當流量離開終端進入傳輸階段,HPE Networking提供的SASE解決方案則扮演了連線安全的守護者。此單一雲端原生平台整合SD-WAN 與 SSE,讓使用者無論身處家中或外部據點,皆能安全存取企業應用。而透過集中化策略管理,企業也能在跨據點與多雲環境中維持一致性的安全防護與使用體驗。這種將資安功能移至雲端邊緣的做法,不僅大幅降低了傳統 VPN 造成的延遲,更確保了存取應用程式時的資料安全。

針對最具商業價值的資料中心與多雲環境,HPE Networking 則有 HPE Aruba Networking CX 10000 與 HPE Juniper Networking SRX 等關鍵解決方案,除具備東西向流量檢測外,亦能透過微分段(Micro-segmentation)技術,有效降低威脅在內部網路橫向擴散的風險,這就像是在建築內部加裝了無數道防火門,即便駭客僥倖攻破某一節點,也會被限制在極小的範疇內,無法在內部橫向移動,化解核心資產遭竊的風險。

此外,為了建立全面防禦基礎,HPE Juniper Networking SRX次世代防火牆則提供從分支、園區到資料中心與雲端的一致性防護能力,並整合 AI 驅動的進階威脅防護、安全情報與零信任機制等,能主動偵測並攔截潛在攻擊,為企業打造出兼具廣度與深度的現代化網路安全防線。

阿根廷娛樂度假村以 AI 驅動的零信任網路,推動智慧營運升級

HPE Networking 的解決方案已在全球多個場域,驗證其價值。以阿根廷綜合娛樂度假村 City Center Rosario 為例,為因應數位支付與 IoT 應用的聯網需求,該度假村需將原本封閉的賭場網路,轉型為高效能且高安全的對外連線架構。

透過導入 HPE Aruba Networking CX 10000交換器,利用內建狀態式防火牆實現微分段,該度假村得以提供更細緻的資料安全防護,讓賭場裝置能安全串接SaaS支付應用,並省下巨額傳統防護成本。此外,結合 HPE Aruba Networking Central 的 AIOps 管理與 ClearPass 的動態分段,該園區成功實現自動化身分識別與權限控管;此AI 驅動的整合架構不僅確保全天候營運韌性,更讓 IT 團隊能從繁雜維護中解放,轉而專注於最佳化賓客的個人化數位體驗。

網路與資安深度融合架構,支撐網路全方位防護的關鍵基礎

力麗科技經銷事業部總經理劉濬瑋指出,隨著企業數位轉型深化,資安已從單一防護機制,轉變為支撐營運的關鍵基礎。透過 HPE Networking 兼具效能與安全的全方位網路解決方案,結合 AI 驅動的自動化管理與智慧偵測,企業能建立從邊緣到雲端一致的防護策略,有效降低風險,確保在 AI 浪潮的快速迭代中,強化企業營運韌性,提升競爭優勢。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓