繼AI作畫之後,下一步只要文字就能做影片?Meta團隊的重大突破
繼AI作畫之後,下一步只要文字就能做影片?Meta團隊的重大突破

日前,由AI圖片生成系統Midjourney製作的畫作奪得藝術大賽首獎的事件引爆熱議,人工智慧生成圖片的道德問題與藝術價值,都讓大眾相當熱烈的討論。在各界得出一個共識之前,Facebook母公司Meta的機器學習部門率先推出了新的AI生成系統Make-A-Video,可以以簡短的字句,來生成一部無聲的短影片。

雖然這些影片可以明顯是假的,有的會模糊失焦,也有的形狀扭曲,但這都無法否認這是AI內容生成領域的重大發展。

「AI生成的研究給予人們簡單快速的工具來創造新的內容,進一步推動創作的表現方式,」Meta在宣布此項工作的文章這樣說,「只需要幾句話或幾行文字,Make-A-Video就可以將想像力帶入生活,創造出生動多彩的獨特影片。」

雛形尚未成熟,過程卻不簡單

從文字生成影片的技術,這可以視為是先前從文字生成圖片AI系統(例如DALL-E和前面提到的Midjourney)的擴展版本。只是,雖然對人腦而言,把靜止圖像想像成會動的影片並非難事,但在機器學習模型中卻沒那麼簡單了。這個系統使用「擴散」技術來創建圖像,意思就是從靜態圖像,逆向朝目標字眼來生成短影片。

Meta目前只發表了一篇關於Make-A-Video模型的論文,也表示他們將會發布此系統的操作演示,但沒有說明什麼時候或將會如何開放使用。

但研究人員表示,他們還在對Make-A-Video用更多的圖像、文字說明以及影片剪輯進行訓練,包含內容數百萬支剪輯,共超過數十萬小時的影片。而這些內容也有來自Shutterstock等網站提供的片段。

研究人員在論文中也提及,除了鏡頭模糊和模型扭曲之外,這些模型還有許多技術上的問題。比如說,他們的訓練方式無法教會Make-A-Video一些人類才能判斷的問題,例如在「揮手」影片中,手要向右揮還是向左揮。其他需要克服的障礙包括,無法生成超過5秒的短片、無法切換多個場景或事件、也還無法有更高的畫質(Make-A-Video目前以64 x 64像素的畫質輸出16幀短片,然後使用另外的AI模型將其大小提升到768 x 768)。

大數據生成潛藏隱憂,帶有偏見且可能被惡意使用

雖然Meta在貼文當中指出,影片生成工具對於「創作者和藝術家」來說可能會非常重要,但與圖像生成模型一樣,也不免令人擔憂。

Meta的團隊指出,就像所有利用網路擷取數據來訓練的AI 模型一樣,Make-A-Video已經「學習並可能會放大社會偏見,包括有害的歧視」。這在許多文字生成圖像的模型已經發生,且相當容易強化社會偏見
。例如讓模型生成「恐怖分子」的圖像,就可能會生成出戴著頭巾的人,從而指涉相關衣著文化的人,目前此模型還尚未開放外界使用,所以還無從判斷Meta的模型是否也會嚴重反映偏見。

這些輸出影像的工具也可能在未來被用於假新聞或是惡意宣傳,更有可能的是,就像我們在AI圖像系統和Deep Fake中看到的情況,可能會被用於騷擾和恐嚇的非自願色情內容。

延伸閱讀:靠Deepfake製作不雅片,網紅小玉遭逮捕!高嘉瑜批評數位性暴力

不過Meta表示,他們「正在與社群公開分享此次人工智慧生成研究和結果,以徵求大眾的回饋,並將繼續使用我們可靠的人工智慧框架,來改進和發展我們對這項新技術的研究。」

元宇宙趨勢:AI生成與驅動

Meta征服元宇宙領域的野心,雖然在日前釋出的VR遊戲《Horizon World》被全球網民酸過了一輪,但此次AI生成影視的研究,也可以被視為實現元宇宙所需大量內容的基礎。

矽谷知名創投公司Andreessen Horowitz旗下的媒體《Future from a16z》,在2020年底一篇名為《與我在元宇宙中相見》的文章提到,現在內容創造有4大階段:專業人士創造、使用者自行創造、AI輔助創造、AI獨立創造,但是要進到最後一個階段,才符合元宇宙所需的內容規模。

透過大數據與機器學習結合,元宇宙中的許多領域將會需要AI系統。首先會讓營運流程自動化,驅動所有線上的活動,也包含異常檢測和因果事件判定等等。

大規模的虛擬或模擬環境當中,由文字生成圖像的人工智慧系統也可以發揮用處,除了生成環境的樣貌,也已有系統(如NVIDIA的Omniverse)可以生成3D組件。

同時AI也可以協助元宇宙系統「更具包容性」,例如協助視覺障礙人士的圖像識別、自動翻譯等等,提供更完善的「沉浸式體驗」,或者以聊天機器人或其他形式的自然語言與使用者互動;或是藉由演算法,提供遊戲玩家更客製化的難度與體驗。

資料來源:The VergeTechCrunch

關鍵字: #人工智慧 #AI
往下滑看下一篇文章
從新零售到新商務,騰雲科技以兩大策略打造新世代成長引擎
從新零售到新商務,騰雲科技以兩大策略打造新世代成長引擎

騰雲科技持續展現強勁成長,不僅連續五年維持雙位數的營收增幅,更於 2025 年前三季累計營收來到 5.47 億元、淨利 1.03 億元,年成長率高達 67%,顯示騰雲科技已從智慧零售解決方案供應商擴展成為智慧社區、智慧城市解決方案供應商,並持續發揮高毛利、高成長、以智慧場域資料為核心驅動的代理式 AI 解決方案全方位供應商。

騰雲科技是怎麼辦到的?

騰雲科技董事長暨總經理梁基文不藏私分享兩大關鍵:「首先是以 AI 賦能的產品與服務,協助客戶提升效率、優化營收;其次是透過騰雲孵化器與其生態系中新創夥伴協作,打造零售、不動產、製造與數位保險等產業所需的新商務服務。」

以 AI 賦能全產品線,強化客戶黏著度、深化長期關係

梁基文表示:「AI 不是單一產品或立即變現的技術,要能有效消除資訊不對等,需協助企業先將散落的資料整合成數據資產,才能找出能驅動決策的洞察。」因此,要讓 AI 真正落地,需要同時理解產業現況與營運痛點的夥伴,才能把技術與數據轉化為具體價值,成為企業成長的新引擎。

有鑑於此,騰雲科技的策略是推出 AI Agent 平台 –TrendVotex,由深耕百貨零售、商業不動產等產業的專業團隊協助打造符合場景需求的 AI 代理服務。

例如,為百貨零售打造的「AI 品牌行銷專家」透過市場輿論進行趨勢及同業動態分析、以口碑行銷進行品牌塑造、針對會員數據進行自動化文案生成及傳播、針對行銷成果進行效益分析等自動化決策,「AI 招商助理」則能整合商圈熱度、樓層營運狀態等資訊,提出精準的櫃位調整與招商策略。至於針對複合式商業不動產管理場景推出「AI 能源智慧管理」服務,導入 AIoT 終端裝置佈署並運用其感測數據與歷史異常紀錄,預測設備故障風險,協助排程維修,降低停機時間,大幅提升營運績效。

梁基文補充說明:「除了協助企業打造專屬 AI 代理與串接代理式工作流程(Agentic Workflow),我們也推出 Marketing、Content、Sales、Manufacturing 等跨產業可重複使用的 AI 代理模組,加速零售、不動產、製造、旅遊與數位保險服務等產業的導入腳步。」

值得注意的是,為真正發揮、極大化 AI 價值,騰雲科技不僅提供技術,也協助企業梳理流程、整合分散數據,打造可支撐多場景的數據驅動營運中台。

梁基文表示,不只零售業正加速虛實通路整合,製造與金融服務業也十分重視「全通路數據」,例如製造業需要即時掌握生產過程關鍵數據指標與庫存狀況以確保良率及產能、數位保險業則積極深化對顧客旅程的掌握以完善服務能量等,騰雲科技推出「隨開即用」、雲地整合的 AI 平台,讓企業能在多場景中無縫串接數據並兼顧資訊安全,充分展現「From Insight to Intelligence」價值。

例如,協助數位保險整合顧客的「線上資料(如客戶資料、風險判斷」與「線下數據(如客戶活動數據、場域營運數據)」,透過 AI 進行產品推薦、簡化內部核保作業流程,並提供更加順暢的一致體驗,讓保險也能像零售一樣真正做到懂顧客。

「接下來,我們會把在百貨零售與商業不動產驗證過的技術,進一步擴大到製造、數位保險等產業,讓價值放到最大。」梁基文如是說道。

騰雲科技
騰雲科技董事長暨總經理梁基文
圖/ 數位時代

五大技術、四大產業,騰雲科技以孵化器成就下一個十年

梁基文表示:「過去 10 年,我們專注在『新零售・新生活』;接下來將延伸至『新商務・新生活』,透過收購、合資、投資等方式與外部夥伴共創新的成長動能。」

具體做法是以 ABCDE(AI、Blockchain、Cloud、Data、Experience)五大技術為核心,鎖定零售、不動產、製造與金融服務四大產業,透過外部合作與孵化機制強化解決方案的廣度與深度:整合現場設備、門市裝置、POS、排隊系統、取貨流程、感測器與後勤運作,推出 AIoT 智慧場域管理方案,滿足跨場域、跨產業與跨國企業的需求。

例如,協助泰國五星級酒店導入 AIoT 智慧場域管理方案以優化能源設備管理、降低營運成本並提升使用者體驗等。明(2026)年,騰雲科技計畫將 AIoT 智慧場域管理方案推向製造業廠房,協助客戶管理冷氣、燈光等能源設備並進行碳管理,同時,透過監控產線設備的振動與溫度等數據,提供 AI 預判的設備維修時機(Preventive Maintenance),擴大數位與綠色雙軸轉型的綜效。

除以集團力量推廣 AIoT 智慧場域管理方案,騰雲科技亦積極擴大相應的生態體系發展:首先是與跨業夥伴一同延伸 AIoT 智慧場域管理方案 的應用範疇,如與保險業者合資成立數位保險公司以提供 AI-Ready 數位應用方案;其次是建立消費者生態體系以發揮「新商務‧新生活」的相互影響綜效。例如,騰雲科技子公司騰加數位將擴大 AIoT 平台運營版圖,深入零售、商辦與飯店等多元場景,並以此為載體整合數位支付、會員數據與數位內容傳播等應用,藉此強化場域的智慧化能力,以及拓展騰雲解決方案的落地深度與廣度。

「透過 AIoT 智慧場域管理方案、營運中台與 TrendVotex 等產品與服務,我們不僅能更精準回應台灣、日本與東南亞市場在流程自動化、營運效率提升上的需求,也能同步改善大眾的日常體驗,真正落實『新商務・新生活』的共好價值。」關於未來的發展,梁基文如是總結。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓