實測|ChatGPT Images 大更新!官方稱生圖快4倍「臉孔不走鐘」,有追上Nano Banana Pro車尾燈?
實測|ChatGPT Images 大更新!官方稱生圖快4倍「臉孔不走鐘」,有追上Nano Banana Pro車尾燈?

重點一:OpenAI 推出 ChatGPT Images 更新,影像生成與編輯更精準、速度最高快4倍。

重點二:新版本支援多輪細節維持(如光線、構圖、人物樣貌),並可生成較多且較小的文字。

重點三:ChatGPT添加「圖像」專屬入口,加速與Google旗下Nano Banana Pro等競品抗衡。

OpenAI宣布為 ChatGPT 推出影像生成功能更新「ChatGPT Images」,官方稱生成速度最高提升至4倍,同時在影像編輯與細節控管上更為精準;現在用戶可直接在App與網站內點擊左側邊欄新增的「圖像」入口,即可進入生圖介面。

官方表示,新版 ChatGPT Images 以「gpt-image-1.5」為核心強化了「可控性」與「一致性」。使用者不僅能將風格在寫實與水彩之間切換、為影像中的人物加入帽子等元素, 更關鍵的是,模型能在多次編修後依然維持光線、材質與構圖連貫,避免既有生成模型常見的「跨步驟失真」。

ChatGPT images 支援分支編輯
ChatGPT images 更新後,現在可以選擇在另一個聊天視窗進行編輯,不會跟原圖搞混。
圖/ LMArena

此外,文字渲染能力顯著提升,能處理更細小字級與更長篇幅內容,改善過去圖中文字易失真、可讀性差的問題,進一步擴大在商務素材、行銷圖像與教育資訊圖表上的使用範圍。

全新的 ChatGPT Images 來了

OpenAI應用業務執行長費姬.西莫(Fidji Simo)指出,ChatGPT正從「純文字對話」轉向「全生成式介面」,把影像、視覺化與可操作元件整合到答案與工作流程中,因次本次更新的一大重點是推出 ChatGPT 中專用的影像入口,「運作方式更像一間創意工作室。」

她也預告, 「即將推出的更新中,答案會開始突顯重要的人物、地點與產品,你可以點擊即時取得更多資訊,而不必再追問。」

亡羊補牢奏效!ChatGPT Images 評分壓過 nano banana

OpenAI本次更新被視為在影像生成市場的加速佈局,直接迎戰Google近期發布的 Gemini 3與其影像生成產品 Nano Banana,以及 xAI 的 Grok 等競品。

Google 於11月推出 Gemini 3 在多項基準測試上主打更強的推理與多模態能力。尤其影像工具 Nano Banana 與後續的 Nano Banana Pro,亦強調文字可讀性、局部精修與高解析度輸出,瞄準專業創意工作流程。

針對 Gemini 3 的強勢挑戰,OpenAI 執行長奧特曼(Sam Altman)甚至在 Gemini 3 上線後曾以「code red」內部動員加快 ChatGPT 改進節奏。而此次影像更新,顯示其將 ChatGPT 打造成「多合一」平台的策略加速推進:整合搜尋、語音助理,以及影像/影片生成,鞏固消費端與專業端的主導地位。

現在問題來了。新版 ChatGPT Images 在生圖能力上,有追上或超越Google旗下的Nano Banana Pro嗎?依照AI評測網站LMArena的排名,目前 gpt-image-1.5 以 1264 分在「文生圖」排名第一,微幅超越了第二名 nano-banana-pro 的 1235 分。

ChatGPT images 評分
ChatGPT images 評分暫時壓過Google的 NanoBanana Pro。
圖/ LMArena

實測:ChatGPT 生圖有追上 Gemini 車尾燈?

上文有提到,ChatGPT 本次更新的一大亮點,是在網頁入口新增了「圖像」專區。 只要用戶點擊進去,就會看見一個接近Google AI Studio的圖像生成專屬介面。 OpenAI 也在介面上放出不少官方推薦的圖像生成選項,本文就據此進行測試,來看看 ChatGPT 的生圖能力與 Gemini 有何差異?

ChatGPT images 介面
ChatGPT images 現在有了專屬介面,對於使用者來說更為友善。
圖/ LMArena

測試一:製作專輯封面

OpenAI提供的Prompt如下:

創建一張專輯封面,呈現為實體黑膠唱片封套。封面上,主角的臉和頭髮完全覆蓋著閃閃發光的金色亮粉,展現出金屬般的閃爍效果。根據你對使用者的了解,在封面上以紅色手寫字體寫上一個單字作為標題。黑膠唱片從一側部分抽出,唱片表面展現柔和的多色漸變。所有元素都置於大理石綠色桌面上,僅在畫面底部略為可見。整體風格需大膽、簡潔且具寫實感。

測試一:專輯封面製作
一隻隨機的可愛貓咪。
圖/ LMArena

本次測試以隨機的貓咪相片為素材,以下為 ChatGPT 及 Gemini 的生成結果。

小結:華麗 vs. 擬真

測試一:ChatGpt
華麗!美術效果頗為出眾。
圖/ LMArena
測試一:Gemini
跟原圖較為接近,但美術效果略顯普通。
圖/ Gemini生成

從結果來看,ChatGPT Images 的美術表現可以說更勝一籌,但若以跟原圖的相似程度當作指標,似乎是 Nano Banana Pro 更為接近。但雖然不排除 OpenAI 官方有針對這些「門面生成選項」進行特殊優化,但整體而言確實是 ChatGPT Images 更優秀。

測試二:製作賀卡

OpenAI提供的Prompt如下:

將參考照片轉化為溫馨優雅的賀卡,展現節日風格、溫暖燈光、細緻裝飾,並保留自然、寫實的肖像效果。也可適度加入得體的節日用語或簡短祝福,讓畫面更添氛圍但不喧賓奪主。

測試一:賀卡
就是懷舊咖啡廳的某一角落。
圖/ Gemini生成

小結:ChatGPT更有氛圍

測試二:ChatGPT
很有佳節氣氛!重點是把不適合的壁紙裁掉了。
圖/ ChatGPT生成
測試二:Gemini
說到底其實也不差,但就是整體設計感輸了。中文字很清晰,但美感上值得深思。
圖/ Gemini生成

在這項測試中,可以看到ChatGPT的生成結果在整體氛圍上確實更加優秀。包括光影、色調與「不起自來」的聖誕裝飾,都能產現出它在創作上的能力。Gemini 並不是說不好,但對於主體之外的多餘素材(例如不甚美觀的壁紙)並不如ChatGPT有巧妙裁切掉的巧思。

測試三:製作攝影棚肖像照

OpenAI提供的Prompt如下:

請參考所提供的主體照片,創作一張乾淨、寫實的攝影棚肖像照,風格參考新鮮人求職照的視覺慣例。如照片中有人,請準確保留其面部特徵、比例和樣貌,絕不美化或更改其臉部。如無人物,請同樣使用克制的棚燈、素淨背景和正式框架呈現物品或場景。主體需置中面向鏡頭,穿著保守、初階商務服裝,整潔儀容並呈現中性、禮貌的表情。採用平均平光棚燈,減少陰影並強調清晰度,背景為淺藍色、淺灰色或純白色。構圖需正式、對稱且緊密裁切,整體氛圍嚴謹、真誠,展現職業感與應徵者的準備態度。

測試三:專業攝影棚照
就是一張隨處可見的網路迷因。
圖/ 網路迷因

小結:ChatGPT沒走鐘

測試三:ChatGPT
ChatGPT的沒走鐘。
圖/ ChatGPT生成
測試三:Gemini
超高清!但是長相有點變了。
圖/ Gemini生成

這是一拍兩瞪眼的結果。很意外的在提供一張側臉照的情況下,ChatGPT的生成結果更為可信,而 Gemini 生成的長相顯然不太一樣。

測試四:製作資訊圖卡

測試Prompt如下:

一張乾淨、明亮的教育資訊圖表插畫,採扁平化設計風格,解釋地球的自轉與公轉。中心是一個風格化的黃色太陽,標籤為「太陽」。
一顆藍色的地球沿著一條巨大的虛線橢圓軌道繞著太陽移動,有一條巨大的彎曲箭頭指示路徑和方向,標籤為「公轉週期:1年」。
同時,地球本身顯示傾斜的軸心,周圍有一條較小、緊密的圓形箭頭顯示其旋轉,標籤為「自轉週期:24小時」。
附近的一個文本框指向整個系統,標籤為「關係:自轉同時也在公轉」。另一個區域有葉子、太陽、雪花和花朵的小圖標,標籤為「影響:季節更替」。所有標籤均為繁體中文。

小結:ChatGPT的硬傷仍在變形字

測試四:資訊圖卡
沒問題,清晰可見。
圖/ Gemini生成
測試四:ChatGPT
圖很棒,但字體變形。
圖/ ChatGPT生成

這項測試的重點在於對繁體中文字形的重現能力。依照結果而言,ChatGPT與Gemini的美術表現在同一水明,但是很明顯的ChatGPT的字體變形仍嚴重,而Gemini的字形屬清晰可見。

總結:ChatGPT Images 小幅超越,但繁中字體完敗

簡單來說評測的結論。在「純圖像」的應用領域內,例如專業大頭照、賀卡、趣圖生圖方面,ChatGPT Images的表現的確略勝 nano banana pro 一籌。可以理解成,nano banana pro能做得大致上ChatGPT Images也都能辦到,在美術表現上尤其如此;但不難發現,在資訊應用上,文字生成能力的表現仍是ChatGPT Images的最大弱點。例如企業簡報、教學等需要精確文字展現的應用場景,ChatGPT Images恐怕還不能勝任。

至此可以說,ChatGPT確實追到車尾燈了,但是能領先多久?下次更新能夠克服字體的硬傷嗎?恐怕這才是正式領先 nano banana pro 的關鍵分水嶺。

延伸閱讀:台灣也能用了!實測Gemini「動態檢視」新功能,J人級儀表板怎麼做?提示詞一次收

資料來源:OpenAI彭博社

往下滑看下一篇文章
AI代理時代已至!國泰金控以GAIA 2.0框架加速AI應用百花齊放
AI代理時代已至!國泰金控以GAIA 2.0框架加速AI應用百花齊放

AI正以驚人速度重塑世界樣貌,金融產業也不例外。國泰金控作為台灣最大的金融控股公司之一,不僅積極擁抱創新變革,更透過開放分享促進產業共好:在「2025國泰金控技術年會」中分享「GAIA 2.0技術框架」,揭示多代理(Multi-Agent)雲端協作架構,讓AI從知識問答助理進化成可以自主推論、規劃與協作的夥伴,拉開以人為中心的金融科技新世代序幕。

以GAIA 2.0技術框架為基礎,加速集團應用百花齊放

GAIA是國泰金控為實現AI即服務(AI as a Service)提出的關鍵技術框架,歷經一年的發展,不僅成功建立超過200種資料類別的知識庫、彙整50多種生成式AI模型的Model Hub、設有70道安全防護檢查點的AI護欄。

國泰金控
國泰金控副總暨國泰世華銀行數據長梁明喬分享GAIA 2.0技術框架與集團GenAI應用案例
圖/ 數位時代

國泰金控副總經理暨國泰世華銀行數據長梁明喬指出:「隨著代理式AI技術崛起,我們在今年提出GAIA 2.0技術框架,目標是讓AI助理(Assistant)進化成AI Agent,可以跨單位整合工具、數據與分工,實現真正的智慧協作。」

舉例來說,為深化集團員工運用AI提升工作效率,我們打造員工AI助手—Agia,協助同仁進行知識查詢、資料摘要等任務,提升效率與生產力;另外,透過AI自助開發平台—GAIA Studio,讓員工以No Code工具,連結內部知識庫,並以視覺化介面或Prompt快速自主開發,打造業務場景所需的生成式AI服務與工具。GAIA Studio 上線三個月已有28個部門自助開發超過40支內部應用AI服務(包含行銷文案、各類產品知識、趨勢摘要等)。

在技術面,具體作法是透過GAIA 2.0框架下的四個模組,包含負責統籌AI Agent任務分配與協作流程的「Agent Core核心框架」、提供安全自主運作環境的「Agent Workspace可控環境」、連結Agent間共通語言的「Agent Protocol串接協定」,以及集中管理AI工具與元件的「Agent Marketplace整合市集」,以加速AI Agent應用研發與部署。

梁明喬表示:「接下來,我們將以GAIA為引擎,打造通用型、業務型、IT型與服務型AI應用,如Vibe Coding、CUBE Intelligence等服務,一步一腳印擴展集團的AI Agent生態圈,型塑智慧金融新格局。」

舉例來說,隨著生成式AI普及,客戶對於數位(助理)服務的期待更高,國泰世華銀行數位品牌CUBE推出「CUBE Intelligence」兩項新服務,包含「升級版」智能助理–阿發,滿足客戶詢問複雜問題的需求,無論客戶提出什麼問題,都可以完整步驟與適當的情緒價值強化與客戶的連結,讓服務更智慧、貼心且符合期待。

國泰金控
國泰金控副總暨國泰世華銀行數位長陳冠學展示「CUBE Intelligence」兩項新服務
圖/ 數位時代

國泰金控副總經理暨國泰世華銀行數位長陳冠學表示:「除了升級版阿發,另一新服務是我們也在CUBE App新增『對話式功能搜尋(CUBE Search)』,就像把行員放到CUBE App一樣,讓客戶可以用自然語言輕鬆找到想要的服務,讓服務體驗變得更聰明、更人性也更懂你。」兩項CUBE Intelligence新服務即將在年底正式上線。

跨界合作推動台灣大型語言模型落地,加速生成式AI發展

大型語言模型具備強大的語意理解與內容生成能力,是生成式AI快速發展的關鍵推力。國立政治大學金融科技研究中心主任王儷玲指出:「金融產業因為有獨特的金融語境、法規語意以及在地化的繁體中文知識,國際通用模型並不適用,必須建構本土知識庫、標準化模型機制、AI 法規沙盒及在地算力平台,發展台灣企業共同主導與管理的大型語言模型,方能讓更多金融業者透過微調打造適用模型、加速可信賴的AI Agent服務落地。」

國泰金控數數發中心數據暨人工智慧發展部副總經理劉浩翔進一步補充:「本地大型語言模型的成功關鍵,不僅是掌握充足且高品質的數據,還要透過後訓練微調與人類回饋強化學習的訓練方式去微調出適用的AI模型,藉此提升答案的精準度,尤其是需要跨法規、多層邏輯的嚴謹金融專業知識。」

AI要成功,除了應用場景、模型,算力也扮演至關緊要角色,對此,鴻海科技集團亞灣超算執行長姚延宗表示:「本土算力是支持本土大型語言模型落地的關鍵。」不過,他也強調,AI算力快速迭代且進入門檻高,不是每一間企業都可以自建算力,因此,亞灣超算與NVIDIA合作啟用超算中心,讓金融等台灣企業可以按需租賃所需算力,解決資料共享等敏感問題,加速金融AI應用的多元發展。

國泰金控
產業與學界專家於國泰金控技術年會交流生成式AI如何在台落地應用,左起為:國泰金控副總經理施君蘭、政治大學金融科技研究中心主任王儷玲、國泰金控數數發中心副總經理劉浩翔、鴻海科技集團亞灣超算執行長姚延宗
圖/ 數位時代

總的來說,從GAIA 2.0技術框架的推出、生成式AI的落地應用、到積極參與本土大型語言模型建置等行動,可以清楚看到,國泰金控正由內而外推動全面AI創新:強化內部流程效率與治理能力、以智慧化服務提升客戶體驗,並透過技術開放與跨域合作,為金融產業的數位與AI智慧轉型注入新動能。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓