用AI聽你想聽的聲音,Google能在吵雜影片中偵測特定人聲
用AI聽你想聽的聲音,Google能在吵雜影片中偵測特定人聲
2018.04.16 | Google

人類有一項特殊的能力,能夠在眾多吵雜的聲音中,辨識出我們熟悉、想聽的聲音,「過濾」掉其他雜訊,專注在說話的對象上,而機器要做到這樣的程度,在過去一直被認為是一件相對困難的事。

最近Google研究人員,利用深度學習、影像模型打造出一套系統,能夠辨識出畫面中說話人物的聲音,依照需求強化特定人士的聲音,消除其他人聲、環境音,這項功能將來可以應用在多人的電話、視訊會議中,或者在多人爭辯的政論節目中,幫助我們清楚聽見特定人士的觀點。

利用深度學習,分離不同聲音來源

「人們很擅長在吵雜的環境中,將注意力放在特定的人身上,心理上將其他人與背景聲音靜音。」Google軟體工程師Inbar Mosseri 、Oran Lang認為,這是人類一項先天的能力,可以將眾多聲音區分成各種音源,但過去許多研究都認為,這對電腦來說仍是一項重大挑戰。

根據最新一份叫「Looking to Listen at the Cocktail Party」研究,研究人員透過深度學習,同步分析影片中的影像與聲音,能單從說話者的臉部表情,就辨別出是誰在說話,觀眾只要點選畫面中特定人臉,就能聽見想聽的聲音來源。研究人員使用10萬支、總長度達2,000小時的單一講者影片,訓練系統辨識個別聲音,接著混入其他影片增加背景雜音,一步一步教懂AI辨別不同音軌,最後會產生一套模型。

完成訓練後,這套系統只要偵測到任何影片中有嘴巴在動,系統會去抓取該來源的音檔,並將其他雜音去除。而這套系統之所以厲害,是因為不僅可以去除環境中的雜音,更可以在多人大聲、激烈交雜談話的同時,還能將目標的聲音細緻地分析出來,即便過程中說話的人麥克風不小心遮住嘴型,這套系統依然可以不受干擾的執行。

聽清楚想聽的意見,政論節目將能改善閱聽品質

Google表示,目前仍在探索一切應用的可能,「我們相信這項軟體可以有許多應用,特別是在有許多人說話的吵雜環境,例如增強影片聲音辨識、視訊會議、改良助聽器。」

若這項軟體真的普及,將能改善許多生活中痛苦的經驗,Google可以將這套軟體導入自家Hangouts、Duo這類語音視訊軟體,多人會議時就能過濾背景雜音,增加理解效率,甚至也能改善傳統助聽器無法分離聲音的缺點,未來自動翻譯軟體也能因此受惠。

Google官方釋出了一段影片,畫面中兩位主播激烈的針對議題爭論,聲音重疊時幾乎難以聽清楚任何一方的意見,透過軟體強化左邊主播聲音後,就能清楚聽見單方意見。台灣今年是選舉年,各種議題的辯論將會大量出現,不論是電視政論節目、廣播、網路直播、Podcast,往後若能應用這套軟體,想必能幫助更多閱聽人舒服、有效率的,吸收各種不同的討論內容。

資料來源:EngadgetDigitaltrendsGoogle

關鍵字: #機器學習
往下滑看下一篇文章
台灣普立茲克獎建築最新群聚地!台中如何打造「世界級質感城市」?
台灣普立茲克獎建築最新群聚地!台中如何打造「世界級質感城市」?

建築界最高榮譽「普立茲克獎」(Pritzker Architecture Prize)得主作品齊聚台中,成就質感新版圖!除了揚名國際的東海大學路思義教堂(貝聿銘設計)、台中國家歌劇院(伊東豊雄設計)外,今年12月將迎來妹島和世、西澤立衛的「綠美圖」開館,安藤忠雄的「童書之森.台中」也預計於明年啟用!

目前台中已累積10件普立茲克獎建築,近期除了綠美圖、童書之森開花結果,還有民間企業及大學,邀請理查.邁爾、RCR 建築事務所、法蘭克.蓋瑞等大師到台中揮灑靈感,共同打造詩意的城市。究竟台中市府如何突破傳統、打造新世代的質感城市?讓我們一起來揭開世界建築大師作品選擇台中的關鍵!

競圖制度開啟建築新紀元 重塑城市新風貌

1963年,貝聿銘為東海大學設計了一座極具象徵性的「路思義教堂」,種下了與世界建築對話的種子,讓台中成為台灣面向現代國際建築的門戶。

半世紀後,伊東豊雄設計、被視為全球最難蓋的建築 「台中國家歌劇院」,歷時約10年終於完工。這座建築,不僅成為城市新地標,讓全世界重新認識台中,也象徵公共建築思維邁入新階段,展現市府採行國際競圖制度的決心。

由市府主導的國際競圖模式,逐漸成為台中重大建設的常態。開放、競爭的機制,讓建設不取決於預算、成本的妥協,而是讓世界建築大師願意在台中激發火花,讓創意真正落地。透過嚴謹的國際評審制度、公開徵選流程,也讓建築品質受到層層把關,建立起公共建築與市民的信任關係。

圖片3_0.jpg
「童書之森.台中」以「為未來孵的蛋」為核心概念設計,象徵未來主人翁的孵育。
圖/ 台中市政府

市府跨局處動員 讓最好的公共建築生根茁壯

台中氣候宜人、工商業蓬勃發展、地理位居台灣南來北往的樞紐,持續吸引人口移入。適當的土地分區規劃,使台中的空間尺度得宜,不顯擁擠,也不感疏離。在水文、綠意串聯的城市網格中,建築不僅是功能性的設施,還能思考、對話、共感而生長其中;這樣的城市環境,也讓建築師願意與台中對話。

位於水湳經貿園區的「台中綠美圖」今年底即將開幕,這座由日本代表性雙人建築師組合──妹島和世、西澤立衛所創立的 SANAA 事務所設計,以輕盈、通透 的語彙串聯八棟建築,並巧妙融合建築與綠意、風與光的周邊環境。

此外,由安藤忠雄設計的「童書之森.台中」,今年5月正式動工,並預計明年完工。這座圖書館坐落於台灣大道秋紅谷旁約1,600坪的精華基地,以「為未來孵的蛋」為核心概念設計,運用安藤忠雄代表性的清水模與極簡線條,融入森林地景;內部以環繞式書牆設計,打造360度的知識森林。

這兩座由普立茲克獎公共建築的誕生,背後仰賴台中市府團隊多年的通力合作!包含文化局的長期規劃與溝通、都市發展局的都市設計與土地整合、建設局的工程統籌等,各局處戮力合作,體現出台中對城市建設的高度企圖,並致力讓最好的建築在這座城市生根茁壯。

atl_25711_20250504133434_237_0.jpg
今年動工的中醫大美術館,將為台中創造更豐沛的藝術能量。
圖/ 中國醫藥大學

市府團隊領航 讓「大師建築」成為市民日常

當市府持續引入國際建築語彙,民間也逐漸興起風潮!亞洲大學邀請安藤忠雄設計「現代美術館」,已成為大學美術館的指標。中國醫藥大學則分別邀請「普立茲克建築教父」法蘭克.蓋瑞(Frank Gehry)及西班牙 RCR 建築事務所設計水湳校區的「美術館」、「體育館」,讓學院建築不僅擁有理性機能,更融合藝術帶來新面貌。

此外,富邦集團先後邀請伊東豊雄、理查.邁爾(Richard Meier)設計「天空樹」、「台中文心辦公大樓」、「市政富邦」等,讓國際建築語彙融入商辦、住宅設計,讓「設計感」不再只是公共建築的專利,而是逐漸滲入日常,改變市民的生活樣貌。

國際級大師鉅作匯聚台中 讓世界看見城市新高度

近年來,不僅普立茲克建築大師作品匯聚台中,還有隈研吾國際建築大師,打造「台中巨蛋」、「勤美術 館」等代表性地標,台中國際級建築版圖不斷擴大!隨著綠美圖、童書之森、中醫大美術館等地標接連誕生,從孩童的第一本童書、到長者的藝文散步,台中城市的每個角落都被美學悄悄改寫。

台中不只是頻獲國際建築作品的城市,更在一棟棟建築中,實踐著市長盧秀燕「幸福宜居」的願景。未來,這座城市將持續以藝術與建築為媒介,讓美感成為生活的一部分,也讓世界看見台中的溫度、深度與嶄新的高度。

[台中市政府新聞局廣告]

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓