Nano Banana實測|AI生圖神器怎麼用?修圖、合成、多輪修改,一句提示就搞定?
Nano Banana實測|AI生圖神器怎麼用?修圖、合成、多輪修改,一句提示就搞定?

Nano Banana(奈米香蕉)是 Google 最新推出的圖像生成與編輯模型,正式名稱為 Gemini 2.5 Flash Image。它的主要特色是能夠在多次編輯後,維持人物或物件的外觀一致性,並支援多張圖片融合、局部編輯,以及自然語言指令操作。

簡單來說,Nano Banana 讓用戶可以用自己的照片,快速更換背景、衣服、髮型,或將多張圖片合成一張,且不需寫程式,只要用文字描述需求即可。《數位時代》本次將透過4大題來實測Nano Banana的生圖實力。

延伸閱讀:Nano Banana提示詞是什麼?超實用Prompt架構大公開:6大元素讓生圖更有質感

如何使用 Nano Banana?

一般用戶可以透過以下3種方式使用Nano Banana:

1.Google Gemini 應用程式
◦ 開啟 Gemini,選擇「2.5 Flash」模型,進入圖像功能。
◦ 上傳照片,輸入自然語言指令(如「換背景為海邊」、「衣服改成藍色」),即可生成新圖像。

2.Google AI Studio
◦ 前往 Google AI Studio
◦ 在模型選擇中選擇「Gemini 2.5 Flash Image Preview」(Nano Banana)。
◦ 上傳圖片,輸入提示詞(Prompt),如「將角色變成 1/7 比例的公仔,放在電腦桌上」等,即可生成目標圖片。

3.LMArena 網站
◦ 進入 LMArena
◦ 在Direct Chat模式下點擊Generate Images,並選擇gemini-2.5-flash模型。
◦ 上傳照片並輸入指令,即可體驗 Nano Banana 生成效果。

實測Nano Banana:Google殺手鐧有多猛?

測試一:圖片優化

1.上傳模糊原圖,並請AI「銳利化」。

素材1(原圖).jpg
圖為360p原圖,明顯較為模糊。
圖/ 翻攝自巴哈姆特電玩瘋
圖片優化:銳利化
比對flux 1 kontext的過度銳化,Nano Banana的效果更加自然。
圖/ LMArena
銳利化(nano-banana).jpg
Nano Banana的圖片銳利化成果。
圖/ LMArena

2.請AI將圖片的彩度及明暗對比提高。

提高彩度 (nano-banana).jpg
經過nano-banana調整後,彩度與對比度明顯更高。
圖/ LMArena

測試二:人像一致性

1.將所有人物衣著改成「打赤膊穿泳褲」,背景換到沙灘。

泳褲.jpg
要求AI將角色衣著改成「打赤膊穿泳褲」,但只有左一成功。可見NanoBanana在識別物件上仍有限制。
圖/ LMArena

2.將4位角色換穿夏威夷衫。

換穿夏威夷衫.jpg
這次所有角色都有換裝,僅有右2失敗。
圖/ LMArena

3.讓每一位角色都手拿mojito調酒。

拿調酒.jpg
僅左1跟右1成功,中間2名並未調整。
圖/ LMArena

4.加墨鏡於頭頂。

加墨鏡.jpg
這個環節,僅左2角色沒有套上墨鏡。右2角色的墨鏡略顯不太自然。
圖/ LMArena

5.背景改室內咖啡館、左側打光。

室內咖啡館.jpg
在未提供素材的情況下,NanoBanana也能順利置換場景。
圖/ LMArena

6.加入背景人物:在吧台的咖啡師,以及在窗邊面向窗戶,正在喝咖啡的顧客。

加入咖啡師.jpg
只要指令明確,NanoBanana就能生成出背景人物。
圖/ LMArena

測試三:多圖合成

1.人像+商品圖插入(請圖內人物自然握持球棒)。

黑人與球棒.jpg
為了測試多圖合成效果,需要提供人物與物件的素材。
圖/ LMArena
Generated Image September 01, 2025 - 4_28PM.jpeg
只要下達指令,就能合成出「合理的畫面」。
圖/ LMArena

2.請調整成全身照,並加入地面真實接觸陰影

全身照.jpg
請AI生成全身照,但因為缺乏素材,所以比例很奇怪。
圖/ LMArena

3.加入參考動作調整角色

prompt參考.jpg
加入參考素材之後,AI就可以順利生成指定的姿勢。
圖/ LMArena

4.消除多餘的線

球棒成品.jpg
最後,請AI消除多餘的素描線條,就出現了乾淨的成品照。
圖/ LMArena

5.將角色置入指定背景

置入背景.jpg
最後,提供素材就能把修改過後的角色放入指定畫面。
圖/ LMArena

測試四:物理與文字細節

1.將人物置入背景,並添加素材「夜雨街景」,要求濕地反射。

cyberpiunk.jpg
除了置入指定背景以外,也可以要求AI生成環境要素,例如「下雨」,就會有地上積水的效果。
圖/ LMArena

2.加入奢華飾品,色調更黑暗,並強調燈光照射在人物上的明暗效果。

加手錶.jpeg
只要指定色調或燈光明暗,就能調整視覺氛圍。
圖/ LMArena

3.在圖片右下角加入字樣。

加入字樣.jpeg
NanoBanana可以順利至入英數符號,但目前對中文辨識仍有問題。
圖/ LMArena

延伸閱讀:Nano Banana生圖攻略|專業形象照、網路梗圖、創意廣告怎麼做?3大應用場景實作教學

結論:堪用可靠!指令明確就能準確生成

總結這次四項測試,Nano Banana在一致性、真實感、可控性,以及生成效率上都有不錯的表現。原則上,只要提示明確,並提供適切的素材,Gemini就能輸出可靠的結果。

但要注意的是,圖片中若有複數以上的人物或角色,在替換衣著、指定物品等細部調整上仍有限制,即使在可以重複編輯指令的情況下,還是會有無法順利調整的情況。

此外,Nano Banana在生成繁體中文上仍能力不足,會有變成畸形字體的可能。

但可以想像,Nano Banana已經可以可將商品、人物、場景合成,模擬商品在不同環境下的擺放效果。例如:家電、家具、服飾、配件等,應對電商或小型業者的宣傳需求很有幫助。

延伸閱讀:全球100大AI出爐!Google大艦隊成贏家:除了ChatGPT,還有哪些好用AI工具?

此外,由支援多輪精細編輯,能快速生成多版本廣告素材、YouTube 縮圖、社群貼文圖、員工識別證、交易卡等,並可根據需求調整細節,提升設計流程效率。

目前,Nano Banana除了文章前段提及的3種平台,也已整合進Adobe Firefly、Adobe Express 等主流平台,並支援 API 付費串接,預期將推動更多第三方應用、工具、平台的創新。

延伸閱讀:生態系戰爭開打!拆解谷歌「Nano Banana」的戰略意義:廣告投放遲早全面AI化,OpenAI如何求生?

Google推出Gemini 2.5 Flash Image!AI修圖不再「走鐘」,還支援多圖融合:5大亮點一次看

資料來源:Google

本文初稿為AI編撰,整理.編輯/ 李先泰

往下滑看下一篇文章
看見「電話」的數位轉型契機:有河科技3大優勢,打造AHOY雲端總機服務
看見「電話」的數位轉型契機:有河科技3大優勢,打造AHOY雲端總機服務

數位轉型人人都在談,但你有想過,辦公室裡那支「電話」,升級了嗎?

隨著數位轉型成為企業生存的基本功,中小企業紛紛導入各式雲端服務,包括 ERP、CRM 到協作平台等,卻常常忽略最基本、卻最高頻的工具——通訊系統。事實上,當行動、遠距與多據點辦公成為常態,傳統總機不僅建置與維護成本高、佈線不易,更無法滿足企業靈活運作的需求,成為數位轉型中最容易「卡關」的一環。

也因此,雲端總機迅速崛起,成為企業溝通的新基礎設施。它不只是把「打電話」這件事搬上雲,更讓企業擁有隨時、隨地、跨裝置的溝通能力,真正落實以效率為核心的數位轉型。

很早便洞察此一趨勢的有河科技,以自行研發的 AHOY 雲端總機服務切入市場,短短幾年內便累積近 3,000 家企業用戶,其中高達六到七成來自客戶主動推薦——顯示其服務品質與系統穩定性深受用戶肯定。2025 年上半年,營收更較去年同期成長 16%,在競爭激烈的 B2B SaaS 市場中穩步擴張,展現出強勁的產品實力與市場潛力。

從底層架構開始,打造真正為中小企業而生的雲端總機

提及當初切入雲端總機市場的原因,其實是有河科技創業團隊從實務觀察出發,轉化為產品創新的成果。

「父親本來就在電信領域,而我們一家都有宅男基因,兄弟三人從小就對寫程式很有興趣。」有河科技創辦人 Hank 開玩笑的說,也因此創業初期便以異業合作開發模式,雖能發揮電信系統專長、案件金額相對高,卻也受限於合作方技術本身的瓶頸,或是發展方向的不一致。

為此,有河科技開始思考下一步發展,「我們想跳脫客製化電信系統開發的框架,打造能直接面對市場與客戶的產品。」Hank 坦言,這樣的想法促使他們決定結合父親多年來在電信領域累積的經驗,切入雲端總機領域,發展可長期經營的 SaaS 服務。

有河科技02.JPG
有河科技 Hank
圖/ 有河科技

有河科技另一位共同創辦人 Henry 進一步說明,當時市場上雖已有部分業者推出雲端總機服務,但多半是傳統電話總機的延伸應用。這些業者將國外第三方開源軟體整合至自家的電話交換機產品中,讓客戶可以透過手機接聽公司電話。

「但這些廠商本身擅長的是硬體,不具備軟體開發能力,無法提供完整、穩定的雲端解決方案。」Henry 說,更關鍵的是,企業仍需購買硬體交換機與佈線,才能使用行動分機、內外線錄音等雲端總機功能。「這對新創公司或小微型企業其實很不友善。」Henry 坦言,許多中小企業其實只是希望客戶來電時,可以有一段簡單的語音歡迎詞,建立專業形象,但傳統總機高昂的設備與維運成本,卻讓這些簡易需求難以實現。

有河科技03.JPG
有河科技 Henry
圖/ 有河科技

正因如此,有河科技決定從底層架構開始出發,打造一套高品質、易上手且低成本的雲端總機服務,企業不必添購任何硬體設備,也無需佈線,透過 app 或瀏覽器就能即時接聽與撥打公司電話,實現真正的雲端通訊轉型。

為了實現此一理念,有河科技從底層架構到前端應用,皆選擇自行研發,並在過程中建立起三大關鍵優勢,成為其在市場中脫穎而出的基礎。

優勢1》從硬體到軟體的一條龍架構,確保通訊品質

「建構一套語音系統並不難,難的是讓它穩定、清晰、不中斷,」有河科技共同創辦人 Ian 舉例指出,通話中偶爾出現的海浪聲、波浪聲等,不是單靠軟體就能解決,必須有足夠的電信產業 Know-how 和技術,才知道如何排除問題。

有河科技植基於一代在電信領域的技術、經驗與人脈,結合新一代的軟體開發工程概念,不僅奠定自身在雲端通訊系統的穩固基礎,更能打造從伺服器、後台到前端 app 的一條龍架構,確保每一個環節都能做到最佳化整合。

這種從基礎建設到應用層的全面掌控,不只是技術整合能力的展現,更讓有河科技在眾多雲端總機服務中,建立起一道高品質、高彈性的競爭壁壘。

優勢2》從零打造前端 app,用戶需求即產品動力

在前端 app 上,有河科技選擇從底層開始重新構建 app,而非像多數同業僅使用既有開源軟體或代理第三方軟體,確保未來在功能擴充與版本更新上的自主性與彈性。

「我們很多功能其實都是客戶給的建議,」 Ian 分享,只要客戶提出功能需求,內部就會評估是否具有普遍性,若評估後發現可以滿足八成以上客戶的使用需求,就會主動投入開發並進行系統更新,提供給所有客戶使用。

這種用戶驅動的產品設計思維,不僅讓功能更貼近實務需求,也讓有河科技可以將開發資源集中在最具價值的地方,持續強化系統的共用性與延展性,打造出真正能隨企業成長而調整的雲端通訊平台。

優勢3》彈性 API 整合,支援多元通訊情境

有河科技的軟體研發能力,不只能夠與時俱進的更新產品,還能根據企業需求彈性整合 CRM 等各種系統或客製化開發特殊服務,打造多元化通訊場景。

舉例來說,外送或代駕媒合平台希望提供號碼遮罩(Number Masking)機制,保障司機與用戶的個資安全,有河科技便為此進行開發,當司機在與客戶聯繫時,客戶手機上只會顯示公司的代表號,之後若客戶回撥,AHOY 也能將來電導至接單司機,達到保護隱私又不中斷溝通的雙重目標。

又或是與 LINE API 整合,可以將既有官方帳號商家的通話,直接升級成專業雲端總機系統等級、甚至可以一併介接各家不同特色的 AI 文字客服以及 AI 語音客服,即時產生逐字稿並進行服務品質情緒分析。

在許多企業還將總機視為「基礎設施」時,有河科技早就運用 AHOY 雲端總機服務,重新定義企業與客戶、內部團隊之間的溝通方式。

隨著企業通訊越來越重視彈性與效率,有河科技運用 SaaS 模式與與技術實力,悄悄搶下這波通訊革新的先機。未來,有河科技將聚焦在 WebCall 網頁電話整合介接與 AI 客服兩大應用場景,不僅讓用戶能在 LINE 官方帳號或網站上直接使用 AHOY 通話,也希望藉由異業合作導入更多元 AI 應用,提升服務效率與回應品質,打造更聰明、更好用的智慧通訊平台。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓