重點一:OpenAI 推出 ChatGPT Images 更新,影像生成與編輯更精準、速度最高快4倍。
重點二:新版本支援多輪細節維持(如光線、構圖、人物樣貌),並可生成較多且較小的文字。
重點三:ChatGPT添加「圖像」專屬入口,加速與Google旗下Nano Banana Pro等競品抗衡。
OpenAI宣布為 ChatGPT 推出影像生成功能更新「ChatGPT Images」,官方稱生成速度最高提升至4倍,同時在影像編輯與細節控管上更為精準;現在用戶可直接在App與網站內點擊左側邊欄新增的「圖像」入口,即可進入生圖介面。
官方表示,新版 ChatGPT Images 以「gpt-image-1.5」為核心強化了「可控性」與「一致性」。使用者不僅能將風格在寫實與水彩之間切換、為影像中的人物加入帽子等元素, 更關鍵的是,模型能在多次編修後依然維持光線、材質與構圖連貫,避免既有生成模型常見的「跨步驟失真」。
此外,文字渲染能力顯著提升,能處理更細小字級與更長篇幅內容,改善過去圖中文字易失真、可讀性差的問題,進一步擴大在商務素材、行銷圖像與教育資訊圖表上的使用範圍。
OpenAI應用業務執行長費姬.西莫(Fidji Simo)指出,ChatGPT正從「純文字對話」轉向「全生成式介面」,把影像、視覺化與可操作元件整合到答案與工作流程中,因次本次更新的一大重點是推出 ChatGPT 中專用的影像入口,「運作方式更像一間創意工作室。」
她也預告, 「即將推出的更新中,答案會開始突顯重要的人物、地點與產品,你可以點擊即時取得更多資訊,而不必再追問。」
亡羊補牢奏效!ChatGPT Images 評分壓過 nano banana
OpenAI本次更新被視為在影像生成市場的加速佈局,直接迎戰Google近期發布的 Gemini 3與其影像生成產品 Nano Banana,以及 xAI 的 Grok 等競品。
Google 於11月推出 Gemini 3 在多項基準測試上主打更強的推理與多模態能力。尤其影像工具 Nano Banana 與後續的 Nano Banana Pro,亦強調文字可讀性、局部精修與高解析度輸出,瞄準專業創意工作流程。
針對 Gemini 3 的強勢挑戰,OpenAI 執行長奧特曼(Sam Altman)甚至在 Gemini 3 上線後曾以「code red」內部動員加快 ChatGPT 改進節奏。而此次影像更新,顯示其將 ChatGPT 打造成「多合一」平台的策略加速推進:整合搜尋、語音助理,以及影像/影片生成,鞏固消費端與專業端的主導地位。
現在問題來了。新版 ChatGPT Images 在生圖能力上,有追上或超越Google旗下的Nano Banana Pro嗎?依照AI評測網站LMArena的排名,目前 gpt-image-1.5 以 1264 分在「文生圖」排名第一,微幅超越了第二名 nano-banana-pro 的 1235 分。
實測:ChatGPT 生圖有追上 Gemini 車尾燈?
上文有提到,ChatGPT 本次更新的一大亮點,是在網頁入口新增了「圖像」專區。 只要用戶點擊進去,就會看見一個接近Google AI Studio的圖像生成專屬介面。 OpenAI 也在介面上放出不少官方推薦的圖像生成選項,本文就據此進行測試,來看看 ChatGPT 的生圖能力與 Gemini 有何差異?
測試一:製作專輯封面
OpenAI提供的Prompt如下:
創建一張專輯封面,呈現為實體黑膠唱片封套。封面上,主角的臉和頭髮完全覆蓋著閃閃發光的金色亮粉,展現出金屬般的閃爍效果。根據你對使用者的了解,在封面上以紅色手寫字體寫上一個單字作為標題。黑膠唱片從一側部分抽出,唱片表面展現柔和的多色漸變。所有元素都置於大理石綠色桌面上,僅在畫面底部略為可見。整體風格需大膽、簡潔且具寫實感。
本次測試以隨機的貓咪相片為素材,以下為 ChatGPT 及 Gemini 的生成結果。
小結:華麗 vs. 擬真
從結果來看,ChatGPT Images 的美術表現可以說更勝一籌,但若以跟原圖的相似程度當作指標,似乎是 Nano Banana Pro 更為接近。但雖然不排除 OpenAI 官方有針對這些「門面生成選項」進行特殊優化,但整體而言確實是 ChatGPT Images 更優秀。
測試二:製作賀卡
OpenAI提供的Prompt如下:
將參考照片轉化為溫馨優雅的賀卡,展現節日風格、溫暖燈光、細緻裝飾,並保留自然、寫實的肖像效果。也可適度加入得體的節日用語或簡短祝福,讓畫面更添氛圍但不喧賓奪主。
小結:ChatGPT更有氛圍
在這項測試中,可以看到ChatGPT的生成結果在整體氛圍上確實更加優秀。包括光影、色調與「不起自來」的聖誕裝飾,都能產現出它在創作上的能力。Gemini 並不是說不好,但對於主體之外的多餘素材(例如不甚美觀的壁紙)並不如ChatGPT有巧妙裁切掉的巧思。
測試三:製作攝影棚肖像照
OpenAI提供的Prompt如下:
請參考所提供的主體照片,創作一張乾淨、寫實的攝影棚肖像照,風格參考新鮮人求職照的視覺慣例。如照片中有人,請準確保留其面部特徵、比例和樣貌,絕不美化或更改其臉部。如無人物,請同樣使用克制的棚燈、素淨背景和正式框架呈現物品或場景。主體需置中面向鏡頭,穿著保守、初階商務服裝,整潔儀容並呈現中性、禮貌的表情。採用平均平光棚燈,減少陰影並強調清晰度,背景為淺藍色、淺灰色或純白色。構圖需正式、對稱且緊密裁切,整體氛圍嚴謹、真誠,展現職業感與應徵者的準備態度。
小結:ChatGPT沒走鐘
這是一拍兩瞪眼的結果。很意外的在提供一張側臉照的情況下,ChatGPT的生成結果更為可信,而 Gemini 生成的長相顯然不太一樣。
測試四:製作資訊圖卡
測試Prompt如下:
一張乾淨、明亮的教育資訊圖表插畫,採扁平化設計風格,解釋地球的自轉與公轉。中心是一個風格化的黃色太陽,標籤為「太陽」。
一顆藍色的地球沿著一條巨大的虛線橢圓軌道繞著太陽移動,有一條巨大的彎曲箭頭指示路徑和方向,標籤為「公轉週期:1年」。
同時,地球本身顯示傾斜的軸心,周圍有一條較小、緊密的圓形箭頭顯示其旋轉,標籤為「自轉週期:24小時」。
附近的一個文本框指向整個系統,標籤為「關係:自轉同時也在公轉」。另一個區域有葉子、太陽、雪花和花朵的小圖標,標籤為「影響:季節更替」。所有標籤均為繁體中文。
小結:ChatGPT的硬傷仍在變形字
這項測試的重點在於對繁體中文字形的重現能力。依照結果而言,ChatGPT與Gemini的美術表現在同一水明,但是很明顯的ChatGPT的字體變形仍嚴重,而Gemini的字形屬清晰可見。
總結:ChatGPT Images 小幅超越,但繁中字體完敗
簡單來說評測的結論。在「純圖像」的應用領域內,例如專業大頭照、賀卡、趣圖生圖方面,ChatGPT Images的表現的確略勝 nano banana pro 一籌。可以理解成,nano banana pro能做得大致上ChatGPT Images也都能辦到,在美術表現上尤其如此;但不難發現,在資訊應用上,文字生成能力的表現仍是ChatGPT Images的最大弱點。例如企業簡報、教學等需要精確文字展現的應用場景,ChatGPT Images恐怕還不能勝任。
至此可以說,ChatGPT確實追到車尾燈了,但是能領先多久?下次更新能夠克服字體的硬傷嗎?恐怕這才是正式領先 nano banana pro 的關鍵分水嶺。
