Nano Banana Pro實測|6種生成提示一次看:漫畫、注音文都能搞定,奈米香蕉變中文怪物了!
Nano Banana Pro實測|6種生成提示一次看:漫畫、注音文都能搞定,奈米香蕉變中文怪物了!

重點一Google 發布 Nano Banana Pro,強調結合 Gemini 3 Pro 的推理與即時知識,提升圖像生成與編修的準確性與可用性。

重點二:新模型可在單張圖中生成更準確、可讀的多語言文字(繁中字形清晰),並強化局部編修、鏡位與光線調整,支援 2K/4K 解析度與多種比例。

重點三:消費者、專業用戶、開發者與企業,現可在 Gemini app、Google Ads、Workspace、Gemini API/AI Studio、Vertex AI、Flow 等產品上使用;所有生成媒體皆嵌入 SynthID。免費與 Pro 版保留可見浮水印,Ultra 與 AI Studio 用戶可移除可見水印。

Google 宣布推出影像生成與編修的旗艦級模型Nano Banana Pro。其建構於 Gemini 3 Pro,主打「進階推理」與「真實世界知識」的結合,可輸出更具脈絡的視覺內容。例如,教育用的圖解、依據用戶提供資料或真實世界事實生成的資訊圖表,並可連結 Google Search 的知識庫,快速視覺化食譜、天氣或運動賽事等即時資訊。

相較先前的 Nano Banana(Gemini 2.5 Flash Image),Pro 版定位於複雜構圖與高品質需求,讓使用者能更可靠地將抽象概念轉為具體視覺成果,涵蓋從原型設計到數據視覺化、手寫筆記轉流程圖等多元場景。

Nano Banana Pro實測|繁中字體不再「鬼畫符」,一次最多可生成 14 圖

Nano Banana Pro 強化在影像中直接生成文字的品質與可讀性,並支援多語言文本與在地化翻譯。憑藉 Gemini 3 對語意與深度的理解,模型能在海報、樣張或分鏡草圖中,生成更細緻的字型、材質與書法風格。

一致性方面,Pro 版可在複雜構圖中融合最多 14 張輸入圖像,並在合成場景中維持最多 5 位人物的相貌一致,適合品牌素材套用、草圖轉商品視覺、藍圖轉擬真 3D 結構等任務。

在創作控制上,則提供更精細的局部編修能力。例如,可選取、細修並轉換影像局部,調整鏡位與焦點、進行高階色彩分級,甚至改變場景光線(例如由白天變夜晚或製造散景)。輸出端也支援多種長寬比,並支援 2K/4K 解析度,便於從社群到印刷的多平台投放。

Google 全線導入!NotebookLM 新增「簡報生成」功能

Google 在多條產品線同步導入 Nano Banana Pro,提供用戶選擇原始 Nano Banana(快速、趣味編修)或 Nano Banana Pro(複雜、高品質構圖)。 在 Gemini app 中選擇「建立圖像」並使用「思考型」模型即可使用;免費用戶有額度限制,超過後將回退至原始 Nano Banana;Google AI Plus、Pro、Ultra 訂閱者享有較高額度。

在 Google 搜尋的「AI 模式」中,Nano Banana Pro 於美國提供給 Google AI Pro 與 Ultra 訂閱者(經測試,台灣的 AI 模式不支援生圖)。

官方也強調,NotebookLM 全球訂閱者亦可使用。據《數位時代》觀察,NotebookLM 的生成選項新增「資訊圖表」與「簡報」兩項,應為導入 Nano Banana Pro 的最新功能。

NoteBookLM的資訊圖表功能
在Nano Banana Pro發布後,NoteBookLM新增了「資訊圖表製作」;圖為示意畫面。
圖/ NoteBookLM

在專業端,Google Ads 的影像生成升級至 Pro 版;並開始向 Workspace 用戶在 Google Slides 與 Vids 推出;在開發者與企業端,Pro 版正導入 Gemini API 與 Google AI Studio,以及 Google Antigravity(用於豐富的 UI 版面與樣張設計)。

創作者端,Pro 版也將提供給 Google AI Ultra 訂閱者於 Flow(AI 影片工具)中使用,以獲得更精細的分鏡與場景控制。

延伸閱讀:NotebookLM重磅更新,可一鍵生成簡報和資訊圖表!新功能怎麼用?實測教學一次看

6個題目實測Nano Banana Pro,究竟有多懂繁中?

先前 Nano Banana 推出時,已實測其強大的生圖能力,目前 Threads 社群上也出現大量 Nano Banana Pro 生成結果。 因此,本次測試將專注於「繁體字形」的適用性程度,畢竟這是上一代模型的硬傷(繁中多為鬼畫符),也是 AI 生圖能否廣泛應用於教育、廣告等專業領域的一大指標。

題目一:繁體字形與異體字分辨

  • 目標:檢驗繁簡分辨、字形結構與筆畫還原度
  • 指令示例:請生成一張宣傳海報(現代極簡設計、白底黑字、無襯線風格),主標為:「Meet Taipei 開創臺灣新創里程碑」,副標與段落文字必須全為繁體中文,必須正確呈現下列字詞且避免簡體:臺/台(用「臺」)、裡(不用「里」)、祕(不用「秘」)、彙(不用「汇」)、骯、鬱、纜、啟、於。版面包含主標、副標、三行段落文字與一行日期。
Gemini文字生成能力
Nano Banana Pro的文字生成能力的升級十分明顯。
圖/ Gemini

小結 :仍有部分異體字無法正確分辨,例如「祕」的部首。部分標點符號出現全形與半形混用,但整體可讀性已大幅提升。

Nano Banana文字生成能力
作為對比,這是相同Prompt使用Gemini 2.5 Flash Image的生成結果。
圖/ Gemini

題目二:直排版與標點規範(單圖)

  • 目標 :檢驗垂直排版能力與中文標點位置、字距
  • 指令示例 :請生成一本書封面(傳統文學風、直排),書名為「山海之間」,副題為「一段關於創新的長旅——在臺北、東京與札幌」,需包含直排的逗號、頓號、破折號、引號、書名號。背景簡潔、主色墨黑。
Nano Banana Pro 的書封排版範例
Nano Banana Pro 對直式的書封排版有一定的生成能力。
圖/ Gemini

小結 :此題亮點在於,提示詞包含多餘要求時,AI 仍會最佳化生成內容,未加入不必要符號,能聚焦完成該提示的主要任務。

題目三:注音、註記與字體風格(單圖)

- **目標 :檢驗文字層級與註記呈現能力
- 指令示例 :請生成詩頁設計(繁體中文直排),正文五行,每行至少含 2 個有上方註記的詞,註記可為注音(ㄅㄆㄇㄈ)或拼音(Hanyu Pinyin),例如:「創新(ㄔㄨㄤˋ ㄒㄧㄣ)」或「臺北(Táiběi)」。版面需同時呈現正文字與註記字,註記字號較小且對齊到位。**

Nano Banana Pro對中文符號的範例
Nano Banana Pro 不僅可以生成正體繁體中文,包括注音及拼音也可以勝任。
圖/ Gemini

小結 :最大發現是 AI 在文字符號生成上的精細程度,已可掌握注音或拼音。除了「ㄔ」有變體外,整體仍具可讀性;以拼音為主的系統,完成度更高了。

題目四:多圖一致性(4 圖)

  • 目標 :檢驗多圖生成的風格與版面一致性
  • 指令示例 :請一次生成四張社群系列海報,主題一致、每張主標不同(分別為「科技」「創新」「永續」「人才」),要求:相同網格系統(如三欄)、相同字重與字距風格、相同主色(深藍),每張各含一段繁體中文說明文字。
Nano Banana Pro生成多圖的範例
Nano Banana Pro可一次生成多圖。但若提示模糊,可能導致文字模糊。
圖/ Gemini

小結 :可見要求越空泛,生成內容也越空泛。相較上一題有明確目標「生成注音與拼音」,本題的說明文字變形機率更高,但整體仍可讀。

題目五:漫畫分鏡故事板(6 圖)

  • 目標 :檢驗跨多圖的內容一致性與中文招牌/對白字形穩定
  • 指令示例 :請生成六格漫畫分鏡(同一角色與場景),每格含繁體中文對白框與同一店名招牌「臺北小館」。要求主角姓名與店名在六格中保持一致(字形不變形、無簡化),對白框位置與字距規格一致。劇情大致為:主角與朋友在街頭上演一段愛與冒險的旅程。
Nano Banana Pro生成多格漫畫
Nano Banana Pro的漫畫生成效果頗佳。
圖/ Gemini

小結 :雖然情節較為鬆散(提示本來就很模糊),相信在有提供腳本的情況下,約 4 至 6 格的短篇漫畫,確實可交由 AI 處理。

題目六:咖啡沖煮攻略

  • 目標 :檢驗對粗略筆記的理解能力,以及將步驟拆解並視覺化的能力。
  • 指令示例 :生成一張圖,解釋手沖咖啡的步驟,資訊如下:

    2 人份單點注水法
    粉量 40 g
    水溫 90℃
    悶蒸 80 cc/30 s
    中心給水至 300 cc
    400 cc
    500 cc
    600 cc

悶蒸 80 cc/30 s
小繞圈 240 cc
340 cc
440 cc
540 cc
大繞圈補 50–60 cc

Nano Banana Pro生成教學配件圖示
Nano Banana Pro可以頗完整的生成教學類型圖示。
圖/ Gemini

小結 :此題亮點在於,輸入僅為記事本中的粗略筆記,但 AI 能在提示後理解意涵,並視覺化成教學圖示。

結論:Google 擺明沒有要給新創活路

經過一連串實測,Nano Banana Pro 的實用性大幅提升;在原本圖形處理就強悍的基礎上,又強化了繁體中文的生成能力。

在生成強度上可觀察到:即使在相對極端的狀況(一次生成多圖、未提供 AI 文字內容),內文仍會出現「變體」,但整體已從「鬼畫符」進化為可讀狀態。

本次測試皆在 Gemini App(網頁版)中完成。實務上,AI 偶爾仍會誤判使用者欲生成圖片的意圖,而直接生成文字;需要反覆提醒(例如「所以我說圖呢?」)才會繼續生成,但不至於影響整體使用體驗。

值得注意的是,若要在 Google AI Studio 使用 Nano Banana Pro,系統會要求串接付費 API key(本次為企業版 Google AI Pro 帳號)。 一般用戶欲體驗,建議使用 Gemini App 或 NotebookLM。

在產業競爭面上,Gemini 的此次進化,對眾多主打 AI 生成的新創服務具不小殺傷力。例如 Gamma、Canva 等可生成 AI 簡報的服務,未來恐需更專精於「差異化」,如更精細的優化選項、更可調的 UI 介面,否則大眾化市場恐怕仍是 Google 的天下。

OpenAI要再加把勁了。

延伸閱讀:
Google Antigravity是什麼?AI代理開發平台好用嗎?

從Netscape歷史慘痛經驗解析最新AI大戰:OpenAI掰了?Google終將占領城池?

責任編輯:李先泰

關鍵字: #Google #Gemini

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓