重點一:Google 發布 Nano Banana Pro,強調結合 Gemini 3 Pro 的推理與即時知識,提升圖像生成與編修的準確性與可用性。
重點二:新模型可在單張圖中生成更準確、可讀的多語言文字(繁中字形清晰),並強化局部編修、鏡位與光線調整,支援 2K/4K 解析度與多種比例。
重點三:消費者、專業用戶、開發者與企業,現可在 Gemini app、Google Ads、Workspace、Gemini API/AI Studio、Vertex AI、Flow 等產品上使用;所有生成媒體皆嵌入 SynthID。免費與 Pro 版保留可見浮水印,Ultra 與 AI Studio 用戶可移除可見水印。
Google 宣布推出影像生成與編修的旗艦級模型Nano Banana Pro。其建構於 Gemini 3 Pro,主打「進階推理」與「真實世界知識」的結合,可輸出更具脈絡的視覺內容。例如,教育用的圖解、依據用戶提供資料或真實世界事實生成的資訊圖表,並可連結 Google Search 的知識庫,快速視覺化食譜、天氣或運動賽事等即時資訊。
相較先前的 Nano Banana(Gemini 2.5 Flash Image),Pro 版定位於複雜構圖與高品質需求,讓使用者能更可靠地將抽象概念轉為具體視覺成果,涵蓋從原型設計到數據視覺化、手寫筆記轉流程圖等多元場景。
Nano Banana Pro實測|繁中字體不再「鬼畫符」,一次最多可生成 14 圖
Nano Banana Pro 強化在影像中直接生成文字的品質與可讀性,並支援多語言文本與在地化翻譯。憑藉 Gemini 3 對語意與深度的理解,模型能在海報、樣張或分鏡草圖中,生成更細緻的字型、材質與書法風格。
一致性方面,Pro 版可在複雜構圖中融合最多 14 張輸入圖像,並在合成場景中維持最多 5 位人物的相貌一致,適合品牌素材套用、草圖轉商品視覺、藍圖轉擬真 3D 結構等任務。
在創作控制上,則提供更精細的局部編修能力。例如,可選取、細修並轉換影像局部,調整鏡位與焦點、進行高階色彩分級,甚至改變場景光線(例如由白天變夜晚或製造散景)。輸出端也支援多種長寬比,並支援 2K/4K 解析度,便於從社群到印刷的多平台投放。
Google 全線導入!NotebookLM 新增「簡報生成」功能
Google 在多條產品線同步導入 Nano Banana Pro,提供用戶選擇原始 Nano Banana(快速、趣味編修)或 Nano Banana Pro(複雜、高品質構圖)。 在 Gemini app 中選擇「建立圖像」並使用「思考型」模型即可使用;免費用戶有額度限制,超過後將回退至原始 Nano Banana;Google AI Plus、Pro、Ultra 訂閱者享有較高額度。
在 Google 搜尋的「AI 模式」中,Nano Banana Pro 於美國提供給 Google AI Pro 與 Ultra 訂閱者(經測試,台灣的 AI 模式不支援生圖)。
官方也強調,NotebookLM 全球訂閱者亦可使用。據《數位時代》觀察,NotebookLM 的生成選項新增「資訊圖表」與「簡報」兩項,應為導入 Nano Banana Pro 的最新功能。
在專業端,Google Ads 的影像生成升級至 Pro 版;並開始向 Workspace 用戶在 Google Slides 與 Vids 推出;在開發者與企業端,Pro 版正導入 Gemini API 與 Google AI Studio,以及 Google Antigravity(用於豐富的 UI 版面與樣張設計)。
創作者端,Pro 版也將提供給 Google AI Ultra 訂閱者於 Flow(AI 影片工具)中使用,以獲得更精細的分鏡與場景控制。
6個題目實測Nano Banana Pro,究竟有多懂繁中?
先前 Nano Banana 推出時,已實測其強大的生圖能力,目前 Threads 社群上也出現大量 Nano Banana Pro 生成結果。 因此,本次測試將專注於「繁體字形」的適用性程度,畢竟這是上一代模型的硬傷(繁中多為鬼畫符),也是 AI 生圖能否廣泛應用於教育、廣告等專業領域的一大指標。
題目一:繁體字形與異體字分辨
- 目標:檢驗繁簡分辨、字形結構與筆畫還原度
- 指令示例:請生成一張宣傳海報(現代極簡設計、白底黑字、無襯線風格),主標為:「Meet Taipei 開創臺灣新創里程碑」,副標與段落文字必須全為繁體中文,必須正確呈現下列字詞且避免簡體:臺/台(用「臺」)、裡(不用「里」)、祕(不用「秘」)、彙(不用「汇」)、骯、鬱、纜、啟、於。版面包含主標、副標、三行段落文字與一行日期。
小結 :仍有部分異體字無法正確分辨,例如「祕」的部首。部分標點符號出現全形與半形混用,但整體可讀性已大幅提升。
題目二:直排版與標點規範(單圖)
- 目標 :檢驗垂直排版能力與中文標點位置、字距
- 指令示例 :請生成一本書封面(傳統文學風、直排),書名為「山海之間」,副題為「一段關於創新的長旅——在臺北、東京與札幌」,需包含直排的逗號、頓號、破折號、引號、書名號。背景簡潔、主色墨黑。
小結 :此題亮點在於,提示詞包含多餘要求時,AI 仍會最佳化生成內容,未加入不必要符號,能聚焦完成該提示的主要任務。
題目三:注音、註記與字體風格(單圖)
- **目標 :檢驗文字層級與註記呈現能力
- 指令示例 :請生成詩頁設計(繁體中文直排),正文五行,每行至少含 2 個有上方註記的詞,註記可為注音(ㄅㄆㄇㄈ)或拼音(Hanyu Pinyin),例如:「創新(ㄔㄨㄤˋ ㄒㄧㄣ)」或「臺北(Táiběi)」。版面需同時呈現正文字與註記字,註記字號較小且對齊到位。**
小結 :最大發現是 AI 在文字符號生成上的精細程度,已可掌握注音或拼音。除了「ㄔ」有變體外,整體仍具可讀性;以拼音為主的系統,完成度更高了。
題目四:多圖一致性(4 圖)
- 目標 :檢驗多圖生成的風格與版面一致性
- 指令示例 :請一次生成四張社群系列海報,主題一致、每張主標不同(分別為「科技」「創新」「永續」「人才」),要求:相同網格系統(如三欄)、相同字重與字距風格、相同主色(深藍),每張各含一段繁體中文說明文字。
小結 :可見要求越空泛,生成內容也越空泛。相較上一題有明確目標「生成注音與拼音」,本題的說明文字變形機率更高,但整體仍可讀。
題目五:漫畫分鏡故事板(6 圖)
- 目標 :檢驗跨多圖的內容一致性與中文招牌/對白字形穩定
- 指令示例 :請生成六格漫畫分鏡(同一角色與場景),每格含繁體中文對白框與同一店名招牌「臺北小館」。要求主角姓名與店名在六格中保持一致(字形不變形、無簡化),對白框位置與字距規格一致。劇情大致為:主角與朋友在街頭上演一段愛與冒險的旅程。
小結 :雖然情節較為鬆散(提示本來就很模糊),相信在有提供腳本的情況下,約 4 至 6 格的短篇漫畫,確實可交由 AI 處理。
題目六:咖啡沖煮攻略
- 目標 :檢驗對粗略筆記的理解能力,以及將步驟拆解並視覺化的能力。
- 指令示例 :生成一張圖,解釋手沖咖啡的步驟,資訊如下:
2 人份單點注水法
粉量 40 g
水溫 90℃
悶蒸 80 cc/30 s
中心給水至 300 cc
400 cc
500 cc
600 cc
悶蒸 80 cc/30 s
小繞圈 240 cc
340 cc
440 cc
540 cc
大繞圈補 50–60 cc
小結 :此題亮點在於,輸入僅為記事本中的粗略筆記,但 AI 能在提示後理解意涵,並視覺化成教學圖示。
結論:Google 擺明沒有要給新創活路
經過一連串實測,Nano Banana Pro 的實用性大幅提升;在原本圖形處理就強悍的基礎上,又強化了繁體中文的生成能力。
在生成強度上可觀察到:即使在相對極端的狀況(一次生成多圖、未提供 AI 文字內容),內文仍會出現「變體」,但整體已從「鬼畫符」進化為可讀狀態。
本次測試皆在 Gemini App(網頁版)中完成。實務上,AI 偶爾仍會誤判使用者欲生成圖片的意圖,而直接生成文字;需要反覆提醒(例如「所以我說圖呢?」)才會繼續生成,但不至於影響整體使用體驗。
值得注意的是,若要在 Google AI Studio 使用 Nano Banana Pro,系統會要求串接付費 API key(本次為企業版 Google AI Pro 帳號)。 一般用戶欲體驗,建議使用 Gemini App 或 NotebookLM。
在產業競爭面上,Gemini 的此次進化,對眾多主打 AI 生成的新創服務具不小殺傷力。例如 Gamma、Canva 等可生成 AI 簡報的服務,未來恐需更專精於「差異化」,如更精細的優化選項、更可調的 UI 介面,否則大眾化市場恐怕仍是 Google 的天下。
OpenAI要再加把勁了。
責任編輯:李先泰
