重點一:Google 同日推出影像模型 Nano Banana 2 Lite 與影片模型 Gemini Omni Flash。
重點二:Nano Banana 2 Lite 主打速度成本,Google 稱文字生圖約 4 秒、每張 1K 圖 0.034 美元(約新台幣 1.1 元),是家族中最快最省的一款。
重點三:Gemini Omni Flash 首度以公開預覽對開發者開放,支援文字、圖片、影片輸入的影片生成與對話式編輯,每秒影片輸出 0.10 美元。
Google 同一天推出兩款生成式媒體模型:影像模型 Nano Banana 2 Lite 與影片模型 Gemini Omni Flash。前者主打「快與省」、已對開發者開放;後者把 Gemini 的多模態推理能力延伸到影片生成與編輯,目前以公開預覽形式在 Gemini API 與 Google AI Studio 提供,尚未進入正式版(GA)。
Google 的算盤是讓開發者能把兩者串起來,打造從生圖到成片的一條龍多媒體工作流。(文中美元對新台幣換算,均以 1 美元兌新台幣 32 元粗估。)
| 模型 | 類型 | 模型代號 | 狀態 | 價格/限制 |
|---|---|---|---|---|
| Nano Banana 2 Lite | 圖片 | gemini-3.1-flash-lite-image | 已開放 | 每張 1K 圖 0.034 美元(約新台幣 1.1 元);Google 稱約 4 秒 |
| Gemini Omni Flash | 影片 | gemini-omni-flash-preview | 公開預覽 | 每秒影片輸出 0.10 美元(約新台幣 3.2 元);目前最長 10 秒 |
Nano Banana 2 Lite:家族中最快最省的一款
Nano Banana 2 Lite(模型代號 gemini-3.1-flash-lite-image)主打高速與低成本,專為講求速度、成本的快速發想與高吞吐量開發流程設計。
官方給出兩個關鍵數字:文字生圖 Google 稱約 4 秒(此為 Google 公布的延遲表現,非服務保證);收費則是每張 1K 解析度圖片 0.034 美元(約新台幣 1.1 元),換算下來,生成 1,000 張約 34 美元(約新台幣 1,100 元)。
但即使以速度為優先,它仍維持可靠的提示詞遵循度、穩定的角色一致性,以及清晰的圖中文字。Google 建議目前還在用初代 Nano Banana 的開發者直接換上這一款。
在消費端,Nano Banana 2 Lite 屬「開始陸續推出」,而非一次全面上線,將陸續登上搜尋的 AI Mode、Gemini App、NotebookLM、Google Photos、Stitch、Google Flow 與 Google Ads 等產品。
至於 Nano Banana 家族的分工,可簡單記成三段:2 Lite 補上「要求極速」的一端,面向近即時、高流量、對延遲敏感的工作流;Nano Banana Pro(Gemini 3 Pro Image)守住「要求精準」的另一端。
至於 Nano Banana 2(Gemini 3.1 Flash Image)則是效能與成本最平衡的萬用選項。
Gemini Omni Flash:用自然語言做影片、改影片
另一款主角 Gemini Omni Flash(模型代號 gemini-omni-flash-preview)最早在 Google I/O 亮相,這次首度透過 Gemini API 與 Google AI Studio 對開發者開放,狀態為「公開預覽」。
它原生支援以文字、圖片、影片的任意組合作為輸入,進行影片生成與「對話式編輯」,也就是用自然語言下指令來修改影片。定價為每秒影片輸出 0.10 美元(約新台幣 3.2 元),與 Veo 3.1 Fast 同價。
Omni Flash 的主要強項,包括以自然語言對話式修改影片、結合圖片與文字與影片等多模態參照以維持畫面一致性、援引 Gemini 對真實世界知識來建構影片,以及讓文字與圖形、影片動作同步。
不過依 Omni 官方文件,現階段仍有明確限制:目前僅能生成最長 10 秒的影片(官方稱更長時長即將到來);Gemini API 尚不支援上傳音訊參照與場景延伸;長度 3 秒以內的影片參照雖被 API 接受,但模型目前無法正確處理;切換場景或鏡頭平移時,角色一致性仍有待加強。
此外,官方文件也註明,以使用者上傳影片進行編輯的功能並非所有地區皆可使用,開發者須留意地域限制。
在消費端,Omni Flash 登上 Gemini App 與 Google Flow,暫未如 Nano Banana 2 Lite 那樣進入搜尋的 AI Mode。
兩款串接,生圖到成片一條龍
Google 強調,真正的威力在於把兩款模型串起來:先用 Nano Banana 2 Lite 高速生圖,再把圖餵給 Gemini Omni Flash 動畫化成影片。搭配 Interactions API,開發者還能在多輪操作中保留工作階段的脈絡,讓使用者最多堆疊三次連續編輯。
Google 也一併釋出三款可直接改用的示範應用:Anywhere(上傳自拍或照片,瞬移到各地知名地標,再由 Omni Flash 動畫化)、Space Lift(室內設計改造)與 Omni product studio(將靜態圖轉為電商影片)。
平台、狀態與浮水印
兩款模型的開放狀態不一,逐一整理如下:
Nano Banana 2 Lite:在 Google AI Studio、Gemini API 與 Gemini Enterprise Agent Platform 對開發者開放(已正式開放);消費端正陸續推出。
Gemini Omni Flash:在 Gemini API、Google AI Studio 與 Gemini Enterprise Agent Platform 以「公開預覽」開放;消費端登上 Gemini App 與 Google Flow,影片編輯功能有地域限制。
在安全與透明度上,Gemini Omni Flash 與 Nano Banana 2 Lite 皆採用 SynthID 浮水印技術,使用者可透過 Gemini App、Chrome 或搜尋中的 Gemini 驗證內容是否由 AI 生成。
資料來源:Google 官方公告、Gemini API 文件:影像生成、Gemini API 文件:Omni Flash 影片、Google Cloud 公告、Gemini 定價、Gemini 適用地區
本文初稿為AI編撰,整理.編輯/ 李先泰
