Nano Banana 為 Google 全新推出的圖像生成模型,全名為 Google Gemini 2.5 Flash Image Preview。官方將此模型匿名為「Nano Banana」,投入參與公開的 AI 圖像生成平台 LMArena 進行盲測競賽,隨後即憑藉穩定的圖像生成品質榮登排行榜首,引爆社群討論。最終 Google 揭露該模型的身分,成功創造話題。
憑藉角色一致性,讓 AI 圖像從單張驚艷走向連續敘事
Nano Banana 掀起社群廣泛討論的關鍵在於:解決 AI 繪圖長期以來的核心痛點(如:角色一致性)。該模型可以實現精準的局部編輯(如:把沙發換成藍色)、組合構圖( 將多個元素無縫融合在一張圖中)、風格轉換(將一張圖的風格、材質或設計,換成另一種)與邏輯推理(理解圖像中的因果關係,並生成合乎邏輯的後續畫面),使 AI 圖像從單張獨立且個別的圖像,邁向「連續敘事」與「商業實用」。
此外,所有透過 Nano Banana 生成的圖片,都內建了 Google 自家開發的一項關鍵技術—— SynthID 浮水印,具可追溯性,強化 AI 技術的責任與透明度。其主要目的並非限制創作,而是為內容的來源提供一個可靠的追溯途徑,藉此幫助平台與使用者辨別內容真偽,共同應對不實資訊的挑戰。
Nano Banana 整合在 Gemini 之中,提供圖像生成與編輯能力,並可於 Google AI Studio、Vertex AI 、Lovart AI 等平台使用。作者將從以下三大情境:生活、專業設計、商業行銷,示範如何使用 Nano Banana。
一、生活篇:個人與創意應用
1.個人形象改造: 如虛擬試穿、髮型預覽、生成專業形象照。
💡作者觀點:這次網路上最多的案例之一就是形象照,原因當然是簡單好應用且實用,但作者覺得這次改變的確很明顯對攝影造成影響。
假設今天需要拍照,除非這個攝影師在動作指導、穿搭、技術上有什麼特色,不然真的很難找到好理由拍照,甚至只要拍個清晰大頭照再搭配 AI 就很好用了。
當然不是說攝影無用,而是純粹人像攝影這件事的被取代性大大提升了
2. 創意攝影與合成: 與朋友、家人甚至偶像「雲合照」,將自己置身於任何想像中的場景。
💡作者觀點:假照片會變得更難區分,未來建議大家都要保持懷疑,且對於照片的判斷不能單純從照片是否看起來真實判斷,應該要從更多地方來判斷,例如拍攝地點看起來合理嗎?這個人真的有機會拍到這樣的照片?未來甚至可以用一些 AI 偵測工具辨識一下是否有隱藏浮水印。
3. 照片後製: 修復低畫質、破損、黑白的舊照片;修正拍攝不佳(角度、光線)的照片。
💡作者觀點:這個效果也非常好,尤其是天氣調整的應用,過去 PS 有出過天空取代功能,當時就覺得實用,但比起現在 AI 的應用就輸很多了,現在天氣變化不止是天空,且還能改變氣候跟環境,拍攝天氣不好的狀況好解決多了。
4. 社群內容生成: 快速製作梗圖、YouTube 影片封面、風格化頭像。
💡作者觀點:梗圖應該是一般人應用很棒的用法,可以用來玩很多有趣的。
這邊補上一個 YT 影片封面的案例,設計好後換表情真的很實用,可以測試不同的效果,也不需重新設計圖片。
二、專業設計篇:顛覆設計師的工作流程
1.提案視覺化: 產品設計、包裝 Mockup、室內風格預覽、家具搭配,便於與內部或客戶溝通。
💡作者觀點:提案類型的內容是作者覺得 AI 很適合的應用場景,因為不直接是成果,所以 AI 品質與版權等問題就比較小。
但對於內部或跟客戶討論上都會很方便,因為過去這類討論,都只能靠想像,頂多找類似參考圖,但現在可以讓各種想像變成視覺化,這對於溝通來說會非常方便。
2.角色與 IP 設計: 快速生成角色 IP,且能生成多視圖 (Character Turnaround)、3D效果,甚至保持 IP 在不同場景中的一致性。
💡作者觀點:的確用 AI 生成很便利,但對於 IP 打造來說,作者更把這樣的應用當作一種概念的參考,原因在於一個吸引人的 IP 需要有故事,甚至是畫家的特色,這其實沒有那麼容易靠 AI 去展示,另外很重要的是,大家並不是那麼喜歡 AI 產生的 IP 角色。
補充: 擅用工具輔助人物動作生成,利用這類工具我們可以更好的去控制角色的動作,比起文字描述會更精準,除了人外,人形的角色也適合使用。
Pose (https://galshir.com/pose-app/)
Pose 是一款買斷付費服務,可以製作角色各種動作的展示,作者最早買來是用來當繪畫參考用,現在發現 AI 生成也有一點參考作用。
磨法人偶 (https://anyposes.com/)
這是一款 3D 版 POSE 工具,免費就有蠻多動作可以使用,還支援道具、光線調整、外觀調整等功能。
這工具是中國網友製作,進階版買斷價格是 39 元人民幣,進階版提供更多動作、道具等選擇。
💡作者觀點:GPT 之前穩定性變高時,使用模型來搭配控制生成動作這件事就變得更可行,但過去 GPT 在外觀上還是會有變動,但這次 Nano Banana 讓這個問題被很好的解決了。
3.敘事與分鏡: 製作動畫、影片、漫畫的故事板,確保主角與場景的連貫性。
💡作者觀點:用來製作分鏡討論會很方便,等於是能透過 AI 製作出一份無限接近成品畫面的分鏡稿。
4.材質與風格探索: 把插畫變成 3D、為 3D 素模快速上材質、將圖片轉換為模型或娃娃等應用。
下圖即是將作者的插畫變成實體的範例:
還可以模擬真實的情境
💡作者觀點:這次在使用上,作者發現過去希望讓案例可以穩定呈現總是有明顯破綻,或是無法讓同一位模特來去展示,但現在可以使用同一模特、場景做不同動作的展示,這讓商業價值大大提升。
三、商業行銷篇:低成本創造商業與創意內容
1.電商產品攝影: 讓模特手持指定產品、更換產品背景、實現高難度或高成本的拍攝場景。
2.創意類平面廣告: 過去一些需要複雜合成類型的廣告,將變得更容易去產出。
3.產品+創意結合:也能讓產品與創意直接做結合,可以發現這次 Nano Banana 的穩定度很好,過去產品生成最擔心的文字、LOGO 變形已經看不出來了。
本文授權轉載自《創作邦》