繼AI作畫之後,下一步只要文字就能做影片?Meta團隊的重大突破
繼AI作畫之後,下一步只要文字就能做影片?Meta團隊的重大突破

日前,由AI圖片生成系統Midjourney製作的畫作奪得藝術大賽首獎的事件引爆熱議,人工智慧生成圖片的道德問題與藝術價值,都讓大眾相當熱烈的討論。在各界得出一個共識之前,Facebook母公司Meta的機器學習部門率先推出了新的AI生成系統Make-A-Video,可以以簡短的字句,來生成一部無聲的短影片。

雖然這些影片可以明顯是假的,有的會模糊失焦,也有的形狀扭曲,但這都無法否認這是AI內容生成領域的重大發展。

「AI生成的研究給予人們簡單快速的工具來創造新的內容,進一步推動創作的表現方式,」Meta在宣布此項工作的文章這樣說,「只需要幾句話或幾行文字,Make-A-Video就可以將想像力帶入生活,創造出生動多彩的獨特影片。」

雛形尚未成熟,過程卻不簡單

從文字生成影片的技術,這可以視為是先前從文字生成圖片AI系統(例如DALL-E和前面提到的Midjourney)的擴展版本。只是,雖然對人腦而言,把靜止圖像想像成會動的影片並非難事,但在機器學習模型中卻沒那麼簡單了。這個系統使用「擴散」技術來創建圖像,意思就是從靜態圖像,逆向朝目標字眼來生成短影片。

Meta目前只發表了一篇關於Make-A-Video模型的論文,也表示他們將會發布此系統的操作演示,但沒有說明什麼時候或將會如何開放使用。

但研究人員表示,他們還在對Make-A-Video用更多的圖像、文字說明以及影片剪輯進行訓練,包含內容數百萬支剪輯,共超過數十萬小時的影片。而這些內容也有來自Shutterstock等網站提供的片段。

研究人員在論文中也提及,除了鏡頭模糊和模型扭曲之外,這些模型還有許多技術上的問題。比如說,他們的訓練方式無法教會Make-A-Video一些人類才能判斷的問題,例如在「揮手」影片中,手要向右揮還是向左揮。其他需要克服的障礙包括,無法生成超過5秒的短片、無法切換多個場景或事件、也還無法有更高的畫質(Make-A-Video目前以64 x 64像素的畫質輸出16幀短片,然後使用另外的AI模型將其大小提升到768 x 768)。

大數據生成潛藏隱憂,帶有偏見且可能被惡意使用

雖然Meta在貼文當中指出,影片生成工具對於「創作者和藝術家」來說可能會非常重要,但與圖像生成模型一樣,也不免令人擔憂。

Meta的團隊指出,就像所有利用網路擷取數據來訓練的AI 模型一樣,Make-A-Video已經「學習並可能會放大社會偏見,包括有害的歧視」。這在許多文字生成圖像的模型已經發生,且相當容易強化社會偏見
。例如讓模型生成「恐怖分子」的圖像,就可能會生成出戴著頭巾的人,從而指涉相關衣著文化的人,目前此模型還尚未開放外界使用,所以還無從判斷Meta的模型是否也會嚴重反映偏見。

這些輸出影像的工具也可能在未來被用於假新聞或是惡意宣傳,更有可能的是,就像我們在AI圖像系統和Deep Fake中看到的情況,可能會被用於騷擾和恐嚇的非自願色情內容。

延伸閱讀:靠Deepfake製作不雅片,網紅小玉遭逮捕!高嘉瑜批評數位性暴力

不過Meta表示,他們「正在與社群公開分享此次人工智慧生成研究和結果,以徵求大眾的回饋,並將繼續使用我們可靠的人工智慧框架,來改進和發展我們對這項新技術的研究。」

元宇宙趨勢:AI生成與驅動

Meta征服元宇宙領域的野心,雖然在日前釋出的VR遊戲《Horizon World》被全球網民酸過了一輪,但此次AI生成影視的研究,也可以被視為實現元宇宙所需大量內容的基礎。

矽谷知名創投公司Andreessen Horowitz旗下的媒體《Future from a16z》,在2020年底一篇名為《與我在元宇宙中相見》的文章提到,現在內容創造有4大階段:專業人士創造、使用者自行創造、AI輔助創造、AI獨立創造,但是要進到最後一個階段,才符合元宇宙所需的內容規模。

透過大數據與機器學習結合,元宇宙中的許多領域將會需要AI系統。首先會讓營運流程自動化,驅動所有線上的活動,也包含異常檢測和因果事件判定等等。

大規模的虛擬或模擬環境當中,由文字生成圖像的人工智慧系統也可以發揮用處,除了生成環境的樣貌,也已有系統(如NVIDIA的Omniverse)可以生成3D組件。

同時AI也可以協助元宇宙系統「更具包容性」,例如協助視覺障礙人士的圖像識別、自動翻譯等等,提供更完善的「沉浸式體驗」,或者以聊天機器人或其他形式的自然語言與使用者互動;或是藉由演算法,提供遊戲玩家更客製化的難度與體驗。

資料來源:The VergeTechCrunch

關鍵字: #人工智慧 #AI
往下滑看下一篇文章
資本市場迎來新氣象!簡立峰:從「臺灣人的亞洲」轉向「世界的亞洲」,主動招募國際互補性新創
資本市場迎來新氣象!簡立峰:從「臺灣人的亞洲」轉向「世界的亞洲」,主動招募國際互補性新創

金融監督管理委員會聯手臺灣證券交易所、證券櫃檯買賣中心共同推動「亞洲創新籌資平臺」,象徵臺灣資本市場邁向新局面。此平臺鎖定重點產業、法規鬆綁及強化推動策略等重點項目,面對此布局,擁有產業導師、獨立董事及投資者等多元角色的簡立峰,分享他的觀點與建議。

簡立峰開門見山直言,現在是臺灣資本市場加速前進的「好時機」。從量化角度來看,臺灣上市櫃公司總市值規模達94.9兆元,國家別排名全球第8名;特別是資通訊與半導體產業,目前已有四家企業(台積電、鴻海、台達電、聯發科)進入世界市值500大。受惠科技群山加持的優勢,讓打造「亞洲NASDAQ」的願景有厚實的底氣。

此外,簡立峰相當肯定本次針對創新版的制度優化,提供更鬆綁、具有創意的做法,大幅提高了國際團隊來臺上市的便利性。不過,除了擴大投資規模與流通性,簡立峰也提出三個策略觀點,鼓勵亞洲創新籌資平臺多家善用制度優勢,設定更宏大的發展目標。

觀點一:深化內部資本市場創新動能,鼓勵「小金雞」早期上市

這幾年臺灣的新創趨勢,簡立峰指出一個現象:現今成功的上市櫃案例,多半是大型集團的「小金雞」(子公司或孫公司),但集團通常傾向在小金雞獲利穩定並能確保控股後,才會在市場上釋出少數股份(25%)允許其上市。此情況容易造成臺灣的資本市場動能不足,甚至讓國際以為臺灣缺乏新創的誤解。

對此,簡立峰認為創新板的價值,即是鼓勵小金雞能提早登板的腳步,一來展現創新能量、翻轉產業典範;二來邁向資本市場不只是需要募資,更重要是上市後的經營策略,知道自身優勢所在,將營運方向隨時調整更貼近資本市場的需求。

因應簡立峰的觀察,本次創新板的新制,即是讓本國公司的股票集保期間從二年縮短為一年,並免除三年的承銷商保薦。此舉有助於降低集團小金雞提早進入市場的法規門檻,讓企業能更快速、更早實現「面對市場」的目標。

觀點二:強化產業聚落思維,主動招募國際上與臺灣互補的新創

亞洲創新籌資平臺成立的重要訴求之一,便是要成為亞洲NASDAQ。簡立峰直言,「如果是以此為願景,那它就不應該只是『臺灣人的亞洲』,而是成為『世界的亞洲』,也就是主動吸引更多國家的創新企業來臺上市,那麼招商策略必須從被動等待,轉為主動積極洽談。」

至於招商的目標該如何鎖定?簡立峰認為臺灣資本市場最重要的價值,在於其聚落現象,因此建議可瞄準能與臺灣產業有高度互補的區域國家或技術領域。讓臺灣的供應鏈業者與他們成為戰略夥伴關係,共同分享這些國外企業來臺上市後所創造的利潤。

如果是區域國家,簡立峰拿「以色列」為例,該國新創擁有強大的創意和軟硬整合能力,但缺乏生產製造基地,若考慮來臺灣上市或募資,將有利於他們與臺灣的製造商建立關係,增加其信賴度,並容易找到供應商。至於前瞻技術方面,簡立峰認為矽光子、3D封裝/先進封裝、AI資料中心冷卻等,與臺灣半導體產業有緊密合作關係,可借助資本市場吸引這些企業來臺投資、上市,不僅是實體的產業聚落,更有助於形成虛擬的資本市場聚落。

簡立峰的論述,也呼應亞洲創新籌資平臺鎖定的重點產業,涵蓋半導體、人工智慧、智慧製造、數位雲端、機器人、次世代通訊等前瞻新經濟領域。另外國際企業來臺上市的門檻,證交所也優化了既有制度,針對主要營運地或股東結構均未涉及陸港澳地區之外國企業,調整臺籍董事席次過半規範,僅須設置臺籍獨立董事至少二席。

觀點三:吸引國際分析師、產業媒體,成為亞洲NASDAQ絕佳觀測站

最後,簡立峰認為一個能持續有活水挹注的國際籌資平臺,成功上市是手段,但真正關鍵的目的,是能持續獲得投資並取得市場關注的聲譽。要獲得聲量,具體的執行策略是提高國際能見度,吸引國際級分析師的關注。

簡立峰以當時Appier在日本上市為例,他提到上市對Appier的最大益處並非來自本益比,而是被國際金融機構的分析師看到,並獲得他們的分析與報導。「這些報導對於B2B企業來說,是最紮實的行銷加分,能極大化取得業界客戶的信賴。」

簡立峰認為亞洲創新籌資平臺的下一步,可主動規劃一些登板的亮點案例,形成「標竿」進而產生群聚效應。對此,證交所回應未來將以多元行銷策略,配套措施包括加強外國公司資訊揭露,提高法人說明會的召開頻率,藉此提升企業國際知名度,為國際分析師提供更充足的資訊來源,助力更多指標的企業打響全球名氣。

國家發展委員會副主任委員詹方冠在亞洲創新籌資平臺啟動典禮上提到,臺灣經濟發展已從勞動密集、資本密集階段,進入到創新驅動的全新里程。最後簡立峰肯定表示,「亞洲創新籌資平臺的成立後,期待它的角色能槓桿資本市場的力量,讓『臺灣人的產業』轉變為『臺灣人主導的產業』,仰賴國際企業壯大臺灣的人才庫,同時也為臺灣創造新的經濟發展動能。」

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓