多了這項祕密武器,Google Assistant聽起來更有人味
多了這項祕密武器,Google Assistant聽起來更有人味

Google在今(5)日凌晨舉辦新品發表會,推出新的Pixel手機、Google Home、耳機Google Pixel Buds等,而這些裝置都有一個共通點,就是可以使用智慧語音助理Google Assistant,而Google也結合了新的技術,要讓語音助理的聲音聽起來更有「人味」。

1000倍的速度生成聲音,Google Assistant少了機械味

DeepMind的「WaveNet」系統,是去年Google推出了新的聲音生成工具,它並非靠著龐大的詞彙庫生成機械式聲音,而是使用深層神經網絡去建造聲音模型,模擬出來的聲音少了機械味更加自然,目前也導入最新版本的Google Assistant中。

目前建造語音助理聲音的主流做法,是由單個配音員錄製數個小時的語音檔案作為基底,再將這些錄音分割成小塊,依據需要組合成一個句子,因此聽起來會比較不那麼自然、連貫,過去WaveNet剛推出的時候,需要花上整整一秒才能產生0.02秒的聲音,所以一句兩秒鐘的「在仁愛路左轉」就需要花上快兩分鐘生成相當不實用;改良版的WaveNet可以在一秒鐘生成20秒的音檔,比原始方法快上1000倍,甚至還能以更高的採樣頻率建構聲音,每秒可以做出高達24,000個聲音樣本。

圖/ Deepmind

百度「Deep Voice 2」也能模仿人聲、口音

WaveNet使用卷積神經網絡去觀察語句中的結構,再去生成出新的樣本,特別的是生成出的新樣本都會考慮前一個樣本的屬性,因此產生出來的聲音、語調聽起來就連貫許多,也能大大減少機械感。因此未來如果想要語音助理講台灣口音不必辛苦的錄製檔案,只需要給WaveNet幾個小時台灣口音的樣本,它就能揣摩當中的細微之處,但目前新版本的Google Assistant僅支援美式英語與日語。

過去中國搜尋巨頭百度也曾研發一套能模仿人聲、口音的語音系統「Deep Voice 2」,能學習一個人聲音細微的差別,駕馭上百種不同口音,最厲害的是,Deep Voice 2只需要半小時的音檔資料就能完成學習。

目前百度的「Deep Voice 2」跟DeepMind的「WaveNet」都已經可以做到用深度學習的方式,讓傳統認為死板的機器語音增添個性,甚至形成一套風格,而一般較為熟悉的蘋果語音助理Siri,雖已可以做到模仿區域性口音,但是透過較傳統的方式,耗時上千小時的真人音檔錄製,且工程師還需花費較長時間做調校。

智慧語音助理除了要夠聰明,口音、語調能夠因地制宜也成為趨勢,除了用戶聽起來舒服外,透過不同的聲音來朗誦電子書、新聞,或許也是未來內容製作的新趨勢。

往下滑看下一篇文章
健細胞科技攜手中興大學,推出「Cancell Insight」醫療AI 輔助決策平台,消弭醫療數位鴻溝
健細胞科技攜手中興大學,推出「Cancell Insight」醫療AI 輔助決策平台,消弭醫療數位鴻溝

為打破醫療 AI 高昂的算力與人力門檻,健細胞科技與國立中興大學資管系蔡孟勳教授團隊產學合作,正式推出「Cancell Insight 醫療 AI 模型平台」(https://insight.cancell.ai)。該平台以 SaaS(軟體即服務)模式提供一站式託管,讓先進的醫療 AI 資源不再侷限於大型醫學中心,有效消弭基層與城鄉間的醫療數位鴻溝。

軟體硬實力:打通 AI 落地最後一哩路

過去,許多由學術或生技單位開發的優秀模型因缺乏部署工具,往往淪為「實驗室孤兒」;而中小型醫院也常因 IT 建置成本對 AI 望之卻步。

健細胞科技創辦人周子堯Victor憑藉其UIUX規劃、程式開發技術背景,親自領軍AI 模型研發團隊,建構 Cancell Insight 平台。他強調,智慧醫療落地必須具備「無感化部署」、「持續性反覆運算」與「大眾化使用」三大要素。Cancell Insight 包辦了從數據清潔、標註到模型訓練與部署的底層工程,醫療機構僅需提供去識別化數據,繁瑣技術難題全由平台解決,讓 AI 真正回歸醫療「輔助」本質。

專為高壓臨床環境設計,七大核心優勢重新定義臨床運作效率

健細胞科技
Cancell Insight提供涵蓋數據清洗、精準標註、模型訓練至部署託管的一站式解決方案
圖/ 健細胞科技

【行動化與 LINE 整合】 支援 LINE 一鍵登入,醫師可直接透過官方帳號上傳檔案呼叫模型並查閱紀錄,實現真正的醫療行動化。

【隨選模型與高相容性】 提供多元 AI 模型庫供彈性訂閱。每組模型具備獨立 API Key,可無縫串接醫院現有 HIS 系統或 APP。

【團隊協作共享】 首創以「團隊」為服務單位,跨科別成員可同步共享模型權限、數據分析與歷史紀錄,提升研究協調效率。

【自動化數據處理】 支援模板批次上傳,內建自動校準系統,若格式不符將自動轉檔、去識別化與重構,大幅解放 IT 人力。

【雙模態 AI 解析】 深度整合 Dr.Cell AI (Gemini) 多模態能力,不僅輸出預測結果,更提供進階臨床解說與治療準則問答,提升決策參考價值。

堅守醫療嚴謹性,推動醫療平權與永續商業價值

在追求科技創新的同時,Cancell Insight 嚴格把關醫療安全性。平台所有 AI 模型輸出結果均定位為「臨床決策輔助」與「研究檢測輔助」,透過「非直面病患」的機制,確保所有 AI 建議皆由專業醫療人員進行最終判讀。

透過 SaaS 專案訂閱模式,Cancell Insight 成功以合理經費取代了傳統的高額硬體採購,讓中小型醫院與偏鄉診所也能具備同等的診斷實力,落實真正的醫療平權。對研發端而言,平台不僅是加速醫療科技商用化、縮短變現週期的推進器,其高度結合日常工作流的特性,更有效減少了醫護的行政負荷,緩解當前醫療量能短缺的危機。

【進階部署】啟動臨床試驗,Docker 地端部署確保資安與時效

為進一步驗證臨床效益並符合醫療機構對資訊安全的高標準,Cancell Insight 即將與各大醫療機構攜手展開「臨床研究計畫」。針對有高度資安控管需求的醫院,平台提供彈性的 Docker 地端模型部署(On-premise Deployment) 方案。第一線的醫師與護理師可直接在院內本機端快速啟動 AI 模型,安全地注入病患臨床數據後,即可「零時差」取得預測結果。此舉不僅確保了敏感醫療數據「不出院」,完美符合嚴格的醫療法規與病患隱私要求,更能實際驗證 Cancell Insight 在真實高壓的臨床場域中,能即時、有效地提供精準的決策輔助。

健細胞科技
部署輕量化模型於地端,支援離線模式使用模型,完善保護企業敏感資料
圖/ 健細胞科技

展望未來,擴大智慧醫療生態圈

透過 SaaS 模式取代高額硬體採購,Cancell Insight 致力落實醫療平權。未來,健細胞科技將以此平台為樞紐,尋求跨界深度合作:

醫療機構: 提供各級別醫院隨選即用的 AI 助理及地端部署選項。
學術/生技: 協助實驗室模型落地,並優化新藥研發與臨床試驗的數據處理效率。
商業保險: 整合 AI 評估工具,提供更精準的健康管理與風險控管服務。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓