視訊時蓬頭垢面也能靠AI掩蓋!NVIDIA發表Maxine平台新進度,要解決哪些痛點?
視訊時蓬頭垢面也能靠AI掩蓋!NVIDIA發表Maxine平台新進度,要解決哪些痛點?

在疫情期間,許多企業透過視訊會議交流工作已漸成人們常態,思科、微軟等企業也都在發展AI輔助的視訊會議功能。GPU可說是NVIDIA橫掃市場的強大武器,對此黃仁勳也曾表示過:可從兩種角度來解釋,一個是視覺方面,另一個是AI應用領域。

首先回顧一下去年末的GTC大會上,NVIDIA宣布推出雲端AI視訊串流平台Maxine誕生,基於GPU和{{{生成對抗網路}}}的技術,能從多方面改善傳統的視訊體驗。

Maxine平台的誕生,主要用於和Google Cloud、AWS、微軟合作,能夠讓使用者不須擁有強大效能的電腦,就能達到解析度提升、消除背景噪音和糾正偏誤的角度等等。甚至,還能夠結合另一款Jarvis SDK的對話式AI,整合模型進行語音辨識,就能產生對話紀錄、即時字幕翻譯等功能。

a443ef7d-e335-47e6-becd-9164741129af
NVIDIA在去年GTC大會上,推出使用雲端GPU加持的人工智慧視訊會議平台Maxine。
圖/ NVIDIA

Maxine平台新模型誕生,將發展成開發套件

在居家辦公的每一天,視訊會議頻頻上演,也許NVIDIA推出的最新視訊會議技術,可以讓視訊體驗更舒適,在家辦公睡過頭、來不及打扮也不怕!

將視覺和AI應用合二為一,NVIDIA又端出什麼新應用?在本週的國際電腦視覺與模式識別會議上(CVPR)上,NVIDIA研究團隊發表了最新研究論文,宣布推出Maxine平台最新的Vid2Vid Cameo的深度學習模型,同樣採用生成對抗網絡(GAN)的技術,能將一個人的2D照片合成至談話影像中。據悉,這個模型未來也將開發成開發套件,供開發商使用。

1624521639030
從NVIDIA提交的論文來看,可看出從原始影像到不同角度影像的轉換過程。
圖/ NVIDIA

延伸閱讀:生態圈再擴大!NVIDIA宣布啟動AI LaunchPad計畫,要幫企業簡化AI開發工作

NVIDIA研究團隊指出,透過這項功能,只需在視訊會議前提交參考影像,無論是真實照片或是卡通形象;再透過AI模型捕捉,就可將人的即時動作、表情應用到靜止的影像,同時也能即時匹配主體的轉向角度,讓與會者看起來直接面對鏡頭。這樣一來,只要上傳身著正裝的照片,即使頭髮凌亂、身著睡衣,也能得體地出現在視訊會議中。

NVIDIA指出,該模型在大規模人工智慧架構的DGX系統上開發,研究團隊採用了多達180,000個高品質的談話影像數據進行訓練,讓模型學會識別關鍵點(像是眼睛、嘴巴、鼻子等位置)後並擷取,通話者的圖片可以事先發送給其他參與視訊會議的人,或從過往的會議中重複使用。如此一來,視訊會議平台只需發送說話者臉部關鍵點的動作資料,而不用在每一個與會者之間發送龐大的即時視訊串流內容。

研究團隊解釋道,透過壓縮和傳輸頭部位置的關鍵點,而不是完整的影像畫面,可以為頻寬縮小10倍,就可以擁有流暢的視訊體驗。且對接收者來說,GAN模型在接收端使用這些資訊來合成一個模仿參考圖片外觀的視訊內容;也能夠自由調整頭部的談話視角,更能應用在處理靜止影像的編輯工作中。

NVIDIA Vid2Vid Cameo Mission AI Possible_ NVIDIA R
網絡頻寬太小也不怕,AI技術能夠自動判斷參考影像、生成模型並生成清晰的影像。
圖/ NVIDIA

團隊在線上說明會指出,這項深度學習模型的底層技術,還可用於協助動畫師、影像編輯和遊戲開發者的工作。在說明會中,也實際展示了Vid2Vid Cameo的功能,從官方提供的影片來看,不僅能夠讓人「衣冠端正」,還能為與會者重新定向面部角度、產生動畫替身和壓縮數據產生更好影像,這些都為視訊會議帶來了新意。

據悉,Maxine平台目前已可運用影像降噪、畫質提升等功能;而今日推出的Vid2Vid Cameo功能,目前也已可在NVIDIA AI Playground上測試使用,其開發套件也將在不久後推出,讓開發人員可以運用優化後的訓練模型,為視訊、直播串流強化效果。

最新6月號雜誌《高價值企業100強》馬上購:傳送門
單期「電子雜誌」輕鬆讀:傳送門

責任編輯:錢玉紘

關鍵字: #Nvidia #AI
往下滑看下一篇文章
商用地產成熱門焦點,方睿科技攜手希睿創新置業以數據科技助開發商搶佔先機
商用地產成熱門焦點,方睿科技攜手希睿創新置業以數據科技助開發商搶佔先機

台灣住宅市場過去10年屢創新高,不動產開發商習慣以戶型規劃、坪數配置、生活機能及家庭型態等邏輯銷售商品。然而,隨著住宅不動產買氣降溫、營建成本持續攀升、政策影響加劇,不動產開發商開始將焦點轉向長期被忽略的商用地產市場。

商用地產市場崛起,不動產開發商須掌握全新市場邏輯

商用地產的客戶是企業或商辦投資人,決策依據遠比住宅複雜,包括產業特性、營運流程、設備承載、動線規劃、能源效率、甚至法規合規等細節,如果不動產開發商沒有在一開始釐清目標客群的產業需求、法規規範、實際坪數與空間規劃,很容易陷入規劃誤區,甚至在完工後才發現市場不買單,甚至造成數十億以上的高額成本浪費。

為協助不動產開發商與商用地產投資人解決上述挑戰,方睿科技除推出商用地產智慧平台,整合大樓、投資、區域、交通與政策等多元數據資料、生成全維度分析報告,協助不動產開發商與投資人做出精準決策,更以集團經營的方式,於今(2025)年9月成立希睿創新置業,由其提供含括規劃、執行與銷售的一站式代銷服務,幫助不動產開發商快速切入商用地產市場。

方睿科技執行長吳健宇指出:「有別於住宅不動產是以感性行銷方式影響買家,商用地產客戶則是倚賴數據進行理性決策,如產業趨勢、聚落發展、租金區間、企業規模、產業上下游動態、大樓的設備承載與機電裝置等,而不是感覺或經驗法則,而這也是方睿科技努力的方向。」

方睿科技
方睿科技執行長吳健宇、希睿創新置業總經理蔡焦緯
圖/ 數位時代

「多維數據分析不僅是開拓商用地產市場的關鍵,也讓希睿成為不動產開發商最可靠的合作夥伴。」擁有豐富不動產經驗的希睿創新置業總經理蔡焦緯如是總結。

三大優勢加持,希睿成不動產開發商耕耘商用地產市場的最佳夥伴

過去不動產開發商在銷售住商混合建案時,常遇到商業空間長期閒置的困境,原因在於傳統代銷只熟悉住宅邏輯,希睿正是要來填補商用地產代銷市場長期缺口。

希睿之所以能快速成為商用地產市場的領跑者,以罕見的市場競爭力成為不動產開發商與企業客戶的最佳夥伴,與其擁有「專業團隊」、「數據科技」與「企業潛在客戶名單」三大優勢,以及跟方睿科技進行深度合作有關:

在專業團隊方面,希睿的團隊成員擁有超過20年的不動產經驗,以及近10年的數據驅動數位行銷實務經驗,可以理性數據分析協助不動產開發商規畫設計不動產,以及精準溝通目標客群,更好媒合企業客戶與投資人。

在數據科技領域,方睿科技的商用地產智慧平台整合「重點區域分析」、「大樓資料」、「區域資料」與「圖像資料」等多維度資訊,無論是協助不動產開發商規劃商用地產,還是幫助企業客戶與投資人尋找合適標的,都能提供最適切且全方位的支援。

蔡焦緯表示:「透過平台,我們甚至能告訴不動產開發商某區段的商用地產租金或售價的未來成長幅度,加快決策與動工,搶先掌握市場商機,更重要的是,當市場環境、政治決策快速變動,我們都能即時更新分析,而不是拿著一年前的產業報告來賭四年後的市場,讓效益發揮最大價值。」

方睿科技
希睿創新置業總經理蔡焦緯
圖/ 數位時代

在潛在客戶名單方面,希睿會透過產業動能分析模型追蹤企業年增員工數、資本額變化以及產業重大訊息動態等等,預判企業於商用空間的需求,深度解析市場,獲取各個區段的商用地產潛在客戶名單,在協助不動產開發商完成規劃設計後提供銷售支援,真正做到從規劃到成交的一站式服務。

商用地產決策不僅會影響企業營運績效,更左右城市未來發展格局。希睿將以專業團隊、產業動能分析與完整買方追蹤系統,提供從規劃、企劃到銷售的一站式服務,幫助不動產開發商在前期階段就搶先掌握商用市場機遇,同時促進企業、不動產開發商與城市的共好發展;此外,也會將第一手的市場訊息回饋給方睿科技、持續優化商用地產智慧平台,希睿將致力提供最具科技力的代銷服務,打造生態體系共贏的市場新標準。

方睿科技
左起,希睿創新置業協理楊彥宏、副總經理黃士芳、總經理蔡焦緯
圖/ 數位時代

方睿科技:https://www.funraise.com.tw/

希睿創新置業:https://www.facebook.com/ONERAISE

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓