重點一:OpenAI 推出 Sora 2,影片與音效生成更「物理正確」、可精準控制多鏡位與場景狀態,並支援同步對話與音效。
重點二:推出 iOS 社交 App「Sora」,以「cameos(本人來演)」為核心,可將本人影像與聲音精準置入生成影片,目前仍採邀請制,並僅於美加地區開放。
重點三:OpenAI 將提供 Sora 2(含 Pro)於網站與未來 API,初期免費但有算力限制。
OpenAI 宣布推出旗艦級影片與音訊生成模型 Sora 2,訴求相較前一代具更高的「物理世界理解」與可控性。官方指出,Sora 2 能在多段鏡位間維持一致的世界狀態,並生成逼真的背景聲音、對話與音效,強調「同步」與「寫實」。
簡單來說,過往影片模型容易為了滿足指令而「扭曲物件」或「違反物理」不同,Sora 2在失誤情境的處理更貼近真實物理,例如籃球未進框會正常反彈而非瞬移至籃框。
OpenAI 將此定位為影片生成的「GPT‑3.5 時刻」,展現更成熟的世界模擬能力,適用於寫實、電影感與動漫風格等多樣敘事。
社交 App「Sora」啟動:cameos 強化「本人參與」
OpenAI 同步推出社交 iOS 應用「Sora」,以「cameos(本人來演)」為核心互動: 使用者可在 App 內完成一次性的影音驗證,之後即可將本人形象與聲音準確置入任何 Sora 場景。 官方表示,此功能是團隊內測期間最受歡迎的功能,讓同事之間因互相出演而更有互動。
產品策略上,OpenAI稱不以「停留時間」優化,改以鼓勵創作為目標;推薦系統由自家大型語言模型驅動,允許用自然語言調整個人化偏好,並定期詢問使用者福祉以主動引導調整。
針對青少年族群,App 預設限制每天在動態牆可見的生成數量,cameos 權限更嚴格;並提供透過 ChatGPT 的家長控管,包括關閉個人化、管理訊息與覆蓋無限捲動限制。首波將以邀請制於美國與加拿大上線,使用者可於 App 內登記開通通知;取得邀請後亦可在 sora.com 使用。
根據《華爾街日報》報導,OpenAI推出「AI原生」社群產品的直接目標,是讓其 Sora 2 影片生成能力進入短影音的主戰場,與TikTok、YouTube Shorts、Instagram Reels正面競爭。
從戰略角度來看,這可讓OpenAI不再只依賴外部平台,把生成內容的分發、互動、社群網路效應留在自家生態,提升留存與品牌心佔率;同時,社交互動(觀看、評論、偏好)可形成高頻回饋,亦可優化推薦與生成品質。
Sora 2 限時免費,暫不導入廣告商模
在供應面,Sora 2 初期於網站與 App 提供免費使用、但受算力約束;ChatGPT Pro 用戶可於 sora.com 試用「Sora 2 Pro」的較高品質版本,之後也將在 App 開放,並計畫推出 API。既有的 Sora 1 Turbo 將持續可用,過往作品保留在個人庫。
OpenAI 同時公開「Feed Philosophy」與「Sora 2 Safety」的設計思路,包括同意與肖像來源控管:使用者可完全掌控自己的 cameo 使用權,隨時撤銷或移除含有本人 cameo 的影片,且含有本人 cameo 的所有影片(含他人草稿)皆可由本人檢視。
為減少主流社交平台常見的成癮與演算法問題,OpenAI 強調現階段無廣告導向的商模,僅在需求過高、算力不足時,可能提供付費以生成額外影片;並擴編人工審核團隊,快速處理霸凌等違規。
官方表示,影片模型快速進步將推動「通用世界模擬」與具實體行動能力的 AI,Sora 2 是邁向該目標的重要一步,期望以更健康的方式促進娛樂與創作。
本文初稿為AI編撰,整理.編輯/ 李先泰