新聞

白話科技

前端科技

產業應用

數位生活

服務消費

企業職場

時事焦點

電動車／交通科技

半導體與電子產業

雲端運算與服務

遊戲／電競

影音／新媒體

教育／人文

行銷與MARTECH

職場／工作術

深度專題

影音新聞

Podcast

影音

專家觀點

社群

未來商務

創業小聚

活動課程雜誌

熱門新聞專題影音活動

有了DeepMind這個技術，機器說話將會更像人

2016.09.10 | AI與大數據

有了DeepMind這個技術，機器說話將會更像人

繼用人工智慧下圍棋、節省電費、醫療應用後，Google旗下人工智慧公司DeepMind的最新一步是——讓機器說話更像人。

＃人工智慧＃DeepMind

有了DeepMind這個技術，機器說話將會更像人

2016.09.10 | AI與大數據

繼用人工智慧下圍棋、節省電費、醫療應用後，Google旗下人工智慧公司DeepMind的最新一步是——讓機器說話更像人。

Google DeepMind日前發表了最新研究成果WaveNet，這個深度生成模型可以模擬任何人類的聲音，而且比現有的文本轉語音（Text-to-Speech）系統聽起來更自然，讓電腦所生成的語音，與人類聲音之間的差距減少50％。

會說話的機器

「讓人類跟機器交談，是人機互動領域一直以來的夢想。」

DeepMind指出，過去幾年來，歸功於深度類神經網絡（deep neural networks），電腦已經革新對自然語音的理解能力，例如Google語音搜尋。

不過，目前透過電腦生成語音，通常是透過語音合成（speech synthesis）或是文本轉語音（TTS）。舉例來說，是先由單一個人錄製數個短語音片段，集成一個大量的資料庫後，再把這些字詞組合成完整的一句話。但這也使得修改語音變得困難，像是無法切換成一個不同的說話者，或改變語音的強調音節或說話情緒等。

WaveNet的技術則是直接將音頻信號的原始波形建模，一次處理一個樣本。這讓WaveNet能夠產出聽起來較為自然的聲音，也意味著可以建模幾乎任何類型的音頻，包括音樂。

DeepMind的WaveNet技術無疑是電腦合成語音領域的一大突破。不過這套系統需要強大的運算能力來合成語音，因此短時間內還不會應用到現實情境，或是Google產品當中。「我們很期待看到未來我們可以拿它來做什麼。」DeepMind表示。

關鍵字：＃人工智慧＃DeepMind

即時熱門文章

1 不用再複製貼上了！Gemini一鍵輸出Word、Excel、PDF等10種格式，連簡報Slides都能直出 2 快一個月了，凱娜克咖啡還是大排長龍！最擅長資本戰的巨獸來台，路易莎真能老神在在嗎？ 3 跨境電商連5年衰退、十年縮水21%！台灣出口包裹只剩540萬件，賣家為何卡在原地？

4 蝦皮拿掉一個紙箱，多了4種效益！「無包裝配送」為什麼讓momo、酷澎心癢癢? 5 軟體工程時代翻盤！類比IC工程師年薪中位數171萬元霸榜，這3類職位晉升百萬俱樂部 6 全聯壓力再升級！統一入主台灣LOPIA，「對手成親家」背後各自盤算為何？

即時熱門文章

1 不用再複製貼上了！Gemini一鍵輸出Word、Excel、PDF等10種格式，連簡報Slides都能直出 2 快一個月了，凱娜克咖啡還是大排長龍！最擅長資本戰的巨獸來台，路易莎真能老神在在嗎？ 3 跨境電商連5年衰退、十年縮水21%！台灣出口包裹只剩540萬件，賣家為何卡在原地？

4 蝦皮拿掉一個紙箱，多了4種效益！「無包裝配送」為什麼讓momo、酷澎心癢癢? 5 軟體工程時代翻盤！類比IC工程師年薪中位數171萬元霸榜，這3類職位晉升百萬俱樂部 6 全聯壓力再升級！統一入主台灣LOPIA，「對手成親家」背後各自盤算為何？

登入數位時代會員

開啟專屬自己的主題內容，

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能，

請先登入數位時代會員

開啟訂閱文章分類功能，

請先登入數位時代會員

登入看看

我還不是會員，註冊去！

追蹤我們

AI全球100+台灣20

© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許，不得轉載。
106 台北市大安區光復南路102號9樓