重點一: Google 發布 Veo 3 影音生成引擎,其極度逼真的影片與同步音訊,使 AI 生成內容真偽難辨,引發對不實資訊的擔憂。
重點二: Veo 3 顯著提升影片畫質,畫面更清晰、細節更豐富,進一步增強了生成內容的真實感與欺騙性。
重點三: Google Labs 推出 Flow 工具,允許用戶無縫合併 AI 短片,製作具連續性的長篇影片,擴展了 AI 影片的應用潛力。
Google 近期在其 I/O 開發者大會上,發表了全新一代影音生成引擎 Veo 3,該技術生成的影片品質已達到令人不安的逼真程度,搭配精準的同步音訊,足以讓多數人難以分辨其與真實拍攝影片的差異。
這項突破性的進展,雖然展示了 AI 技術的飛躍,但也立即引發了各界對於不實資訊將更易製造與傳播的憂慮。甚至有網友在X平台指出,「逼真程度令人不安。」
而Veo 3 之所以引人注目,關鍵在於其兩大核心升級。 首先,是同步音訊的加入。過去,音訊與畫面是否同步,一直是分辨 AI 生成內容與真實影片的重要指標之一;然而,Veo 3 成功克服了此一障礙,允許創作者替作品添增聲音,像是城市街景中的交通噪音,公園裡的鳥叫聲,甚至是角色之間的對話,使生成內容更加豐富多元。
其次, 影片本身的生成品質也獲得顯著提升 ,畫面幀數更為清晰,細節描繪也更加豐富入微。這些改進共同作用,使得 Veo 3 產出的內容真實感大增,大大提高了辨識其為 AI 生成的難度。
Flow 工具賦能:影片創作彈性大增
除了 Veo 3 引擎本身,Google Labs 推出的 Flow 工具亦為 AI 影片創作帶來更多可能性。 Flow 允許使用者如同操作虛擬故事板一般,將多個由 AI 生成的短片無縫地合併起來。
透過此工具,即便單個 AI 生成片段的長度目前(根據原文)可能限制在八秒左右,使用者依然能夠藉由場景的巧妙拼接,創作出具有連續性敘事、甚至如同電影般鋪陳的長篇影片。
對於專業創作者而言,Veo 3帶來的是工作流程的革命性變化。 以往需要通過複雜工作流製作的內容,如各種填充YouTube影片的示意畫面,現在能用Veo 3就能一鍵直出,不管是「街訪畫面」、「脫口秀演出畫面」,生成結果幾乎看不出瑕疵,彷彿是真實實拍的素材。
例如以下這支短片,提示詞為「如果AI角色意識到他們生活在虛擬世界中」,生成的結果令人十分驚艷,包括情節、對白、運鏡,都有科幻影集的既視感。
也有網友利用 Veo3 生成一段警方攻堅、與歹徒駁火的片段,片段十分逼真,讓網友直呼「歡迎來到電影製作的新時代。」
回頭來說,這項功能無疑為內容創作者提供了更強大的工具,但也同時為潛在的惡意使用者降低了製作複雜不實資訊的門檻。
因此,隨著Veo 3的發布,對深偽(deepfake)技術可能帶來的風險也引發了更多討論。為了應對這些潛在風險,Google DeepMind表示,將運用其專有的SynthID浮水印技術,在Veo 3生成的影片幀中嵌入不可見的標記,以協助辨識AI生成內容。
Veo 3 目前僅開放美國用戶
目前,Veo 3只對訂閱了每月249.99美元(折合新台幣約7,500元)「Google AI Ultra」方案的美國用戶開放,其提供了完整的Googleo技術生態系整合服務,具體包括以下權益:
- Veo 3優先使用權:可生成帶環境音效與角色對話的8秒影片,每月80次生成額度。
- 30TB雲端儲存空間:相當於單獨訂閱Google One 30TB方案,月費要價4995元。
- YouTube Premium服務:去除廣告的影音平台體驗,價值199元新台幣/月。
- Flow電影製作工具:整合Gemini、Imagen與Veo模型的專業創作套件。
- Deep Think模式:增強版推理功能,可處理複雜數學與程式設計任務。
延伸閱讀:直擊Google I/O|AI搜尋重磅更新!8大亮點搶先看:虛擬試穿、代購票券,Veo 3 還懂配音
OpenAI砸65億美元收購AI裝置新創io!攜手IPhone設計之父Jony Ive:首款產品2026發布
資料來源:9to5Google、CNBC、Google
本文初稿為AI編撰,整理.編輯/ 李先泰