視訊時蓬頭垢面也能靠AI掩蓋!NVIDIA發表Maxine平台新進度,要解決哪些痛點?
視訊時蓬頭垢面也能靠AI掩蓋!NVIDIA發表Maxine平台新進度,要解決哪些痛點?

在疫情期間,許多企業透過視訊會議交流工作已漸成人們常態,思科、微軟等企業也都在發展AI輔助的視訊會議功能。GPU可說是NVIDIA橫掃市場的強大武器,對此黃仁勳也曾表示過:可從兩種角度來解釋,一個是視覺方面,另一個是AI應用領域。

首先回顧一下去年末的GTC大會上,NVIDIA宣布推出雲端AI視訊串流平台Maxine誕生,基於GPU和{{{生成對抗網路}}}的技術,能從多方面改善傳統的視訊體驗。

Maxine平台的誕生,主要用於和Google Cloud、AWS、微軟合作,能夠讓使用者不須擁有強大效能的電腦,就能達到解析度提升、消除背景噪音和糾正偏誤的角度等等。甚至,還能夠結合另一款Jarvis SDK的對話式AI,整合模型進行語音辨識,就能產生對話紀錄、即時字幕翻譯等功能。

a443ef7d-e335-47e6-becd-9164741129af
NVIDIA在去年GTC大會上,推出使用雲端GPU加持的人工智慧視訊會議平台Maxine。
圖/ NVIDIA

Maxine平台新模型誕生,將發展成開發套件

在居家辦公的每一天,視訊會議頻頻上演,也許NVIDIA推出的最新視訊會議技術,可以讓視訊體驗更舒適,在家辦公睡過頭、來不及打扮也不怕!

將視覺和AI應用合二為一,NVIDIA又端出什麼新應用?在本週的國際電腦視覺與模式識別會議上(CVPR)上,NVIDIA研究團隊發表了最新研究論文,宣布推出Maxine平台最新的Vid2Vid Cameo的深度學習模型,同樣採用生成對抗網絡(GAN)的技術,能將一個人的2D照片合成至談話影像中。據悉,這個模型未來也將開發成開發套件,供開發商使用。

1624521639030
從NVIDIA提交的論文來看,可看出從原始影像到不同角度影像的轉換過程。
圖/ NVIDIA

延伸閱讀:生態圈再擴大!NVIDIA宣布啟動AI LaunchPad計畫,要幫企業簡化AI開發工作

NVIDIA研究團隊指出,透過這項功能,只需在視訊會議前提交參考影像,無論是真實照片或是卡通形象;再透過AI模型捕捉,就可將人的即時動作、表情應用到靜止的影像,同時也能即時匹配主體的轉向角度,讓與會者看起來直接面對鏡頭。這樣一來,只要上傳身著正裝的照片,即使頭髮凌亂、身著睡衣,也能得體地出現在視訊會議中。

NVIDIA指出,該模型在大規模人工智慧架構的DGX系統上開發,研究團隊採用了多達180,000個高品質的談話影像數據進行訓練,讓模型學會識別關鍵點(像是眼睛、嘴巴、鼻子等位置)後並擷取,通話者的圖片可以事先發送給其他參與視訊會議的人,或從過往的會議中重複使用。如此一來,視訊會議平台只需發送說話者臉部關鍵點的動作資料,而不用在每一個與會者之間發送龐大的即時視訊串流內容。

研究團隊解釋道,透過壓縮和傳輸頭部位置的關鍵點,而不是完整的影像畫面,可以為頻寬縮小10倍,就可以擁有流暢的視訊體驗。且對接收者來說,GAN模型在接收端使用這些資訊來合成一個模仿參考圖片外觀的視訊內容;也能夠自由調整頭部的談話視角,更能應用在處理靜止影像的編輯工作中。

NVIDIA Vid2Vid Cameo Mission AI Possible_ NVIDIA R
網絡頻寬太小也不怕,AI技術能夠自動判斷參考影像、生成模型並生成清晰的影像。
圖/ NVIDIA

團隊在線上說明會指出,這項深度學習模型的底層技術,還可用於協助動畫師、影像編輯和遊戲開發者的工作。在說明會中,也實際展示了Vid2Vid Cameo的功能,從官方提供的影片來看,不僅能夠讓人「衣冠端正」,還能為與會者重新定向面部角度、產生動畫替身和壓縮數據產生更好影像,這些都為視訊會議帶來了新意。

據悉,Maxine平台目前已可運用影像降噪、畫質提升等功能;而今日推出的Vid2Vid Cameo功能,目前也已可在NVIDIA AI Playground上測試使用,其開發套件也將在不久後推出,讓開發人員可以運用優化後的訓練模型,為視訊、直播串流強化效果。

最新6月號雜誌《高價值企業100強》馬上購:傳送門
單期「電子雜誌」輕鬆讀:傳送門

責任編輯:錢玉紘

關鍵字: #Nvidia #AI
往下滑看下一篇文章
新創看過來!2025亞灣新創大南方8/22在高雄:半導體、AI技術⋯10大專區徵展中
新創看過來!2025亞灣新創大南方8/22在高雄:半導體、AI技術⋯10大專區徵展中

由《數位時代》與高雄市政府聯合主辦、Meet創業小聚策劃執行的年度指標性創新創業盛會「2025 Meet Greater South亞灣新創大南方」,將於2025年8月22日至23日在高雄展覽館北館盛大舉行。

隨著台積電、超微(AMD)、輝達(NVIDIA)等國際大廠紛紛進駐,高雄正迎來前所未有的產業升級契機,特別在半導體、人工智慧、電動車、智慧製造與綠能科技等領域,這股發展浪潮為新創團隊帶來巨大的潛力與市場機會。

「Meet Greater South亞灣新創大南方」,早已不僅是一個展會,它已成為新創團隊眼中加速成長、鏈結關鍵資源、拓展市場版圖的戰略要塞,同時也為成熟企業尋找轉型升級的創新動能。

聚焦十大關鍵應用,打造AI賦能產業盛景

本次以融合創新科技、推動產業升級為核心,規劃十大關鍵應用專區,其中包括5G與雲端、人工智慧、智慧城市與物聯網、數位資產與新金融、綠色商機、數位內容與體驗科技、行銷科技、新零售、醫療與健康科技、地方創生及創新與新商業等主題。

展會不僅是技術與產品的展示平台,展區本身的互動與交流,除了是促成商業合作的關鍵,透過大會的整合行銷等多重管道,新創更能直接向業界領袖、潛在客戶及合作夥伴展示自身價值,有效提升品牌能見度並直接觸達潛在客戶。

多元活動賦能新創,實質效益口碑相傳

為促進實質交流,「Meet Greater South亞灣新創大南方」在展會期間精心策劃了多場精彩活動,旨在全方位賦能參展新創團隊。其中,「創業家開講」為新創提供了絕佳的舞台,透過分享創新解決方案與獨特市場策略,與業界專家進行深度點評互動。曾有「創新與新商業展區」新創表示,有10多家廠商正接洽進一步的合作機會。

不僅如此,大會亦高度重視為新創精準對接資本市場,加速其募資進程的目標。核心活動「投資媒合會」便致力於為新創與企業、投資人搭建一對一的精準對接平台,深入發掘潛在投資機會,為新創的快速成長注入關鍵動能。

最後,作為產業領袖交流思想、拓展合作的關鍵場域,展會亦規劃新創交流之夜及各類交流活動,有效促進與會者與來自產官學各界領袖建立穩固的合作關係。

Meet創業小聚
投資人媒合會藉由一對一洽談對話,讓團隊得以有機會獲得更多資源。
圖/ Meet創業小聚

5萬人次參與,成功促成超過250組以上的精準商機媒合

Meet創業小聚憑藉多年深耕台灣新創生態系的經驗,已成功將「Meet Greater South亞灣新創大南方」打造成南台灣最具指標性的新創盛會。五年來已累積逾50,000人次觀展,促成250組以上的商機媒合,並鏈結超過20個政府、企業及生態系夥伴。

「2025 Meet Greater South亞灣新創大南方」參展報名活動自即日起正式啟動,並將於2025年7月2日(三)截止。本次特別推出超早鳥優惠方案,凡於2025年6月5日(四)前完成報名並符合資格的新創團隊,將可享有最低2折的參展價格。歡迎符合資格團隊踴躍報名,共同點燃屬於這座城市的創新引擎,一同邁向更廣闊的國際舞台。

招商資訊

徵展報名頁面:https://meetgreatersouth.tw/
報名時間:即日起至7/2(三)止
參展方式:採報名審核制,填完表單後靜待審核通知(將用Email信件通知是否通過)攤位數有限欲報名從速。主辦單位保有最終修改變更活動解釋及取消本活動之權利。

本文授權轉載自:創業小聚

延伸閱讀:AI能代替心理諮商嗎?當ChatGPT變成「情緒樹洞」:絕不插話、永遠懂你,卻暗藏危機?
川普關稅戰踢鐵板!美聯邦法院認定「越權」:發生什麼事?為何法官們不挺川普?

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
電商終局戰
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓