實測|GPT-4o生圖全網擠爆,免費版要等等了!如何生成「吉卜力風」?比Grok更厲害嗎?
實測|GPT-4o生圖全網擠爆,免費版要等等了!如何生成「吉卜力風」?比Grok更厲害嗎?

重點一OpenAI於3月26日更新旗下語言模型GPT-4o,使其能夠依照提示,實現精確、準確、逼真的圖像生成。

重點二 :先前OpenAI的模型難以在圖像中生成清晰可讀的文字段落,但新版 GPT-4o 已能辦到。

重點三 :GPT-4o成ChatGPT預設圖像模型,原開放免費及付費用戶,但由於使用人數超乎預期,奧特曼表示將推遲向免費用戶發布這項功能。

OpenAI近日發表 GPT-4o 的更新版本,顯著提升了圖像生成的逼真度。這項成果來自為期一年、結合人類訓練員的努力,新版 GPT-4o 現已取代 DALL-E 3,成為旗下聊天機器人 ChatGPT 預設的圖像生成模型。

OpenAI原先表示,無論是 ChatGPT 的免費用戶,或是 Plus、Team 和 Pro 方案的訂閱者,現在皆可使用此更新功能。

但OpenAI執行長Sam Altman週三宣布,ChatGPT 新推出的AI圖像功能將推遲向免費用戶開放,原因是需求量遠高於公司預期:「ChatGPT 中的圖像功能比我們預期的還要受歡迎(而且我們原本的預期已經相當高)。」

截至目前,GPT-4o的生圖新功能己在各大社群網路暴紅,尤其是「吉卜力風格」圖像,就連馬斯克、奧特曼都紛紛上傳新頭像。

延伸閱讀:曾說AI圖「極度噁心」的宮崎駿,吉卜力風卻變全網熱點!生成特定風格圖片究竟有沒有侵權?

AI更懂人話了!關鍵是一群「人類訓練員」

此次 GPT-4o 圖像生成能力提升的背後,關鍵在於一群「人類訓練員」的貢獻。該計畫首席研究員 Gabriel Goh 指出,這些訓練員負責標註訓練數據,指出 AI 生成圖像中的拼寫錯誤、異常的手部或臉部等瑕疵。透過這種被稱為「人類回饋強化學習」(Reinforcement Learning from Human Feedback, RLHF) 的常見技術,AI 模型學會更精確地遵循人類指示,從而生成更準確、實用的圖像。

OpenAI 透露,約有略多於100名人類工作者參與了此次的強化學習過程。Goh 強調:「基礎模型本身已具備智慧,而 RLHF 過程則能引導並提煉這種智慧。」

OpenAI 表示,隨著 GPT-4o 研究的進展,ChatGPT 的圖像生成功能對消費者和企業而言實用性大增。例如,先前的模型難以在圖像中生成清晰可讀的文字段落,但新版 GPT-4o 已能辦到。

藍色電鋸.jpg
OpenAI於官網示範,生成清晰的藍色電鋸圖片。
圖/ OpenAI
切火雞.jpg
若進一步要求Gpt-4o生成帶有標題的廣告,AI也能順利生成。
圖/ OpenAI

ChatGPT 多模態產品負責人 Jackie Shannon 補充,新模型還能創建透明背景,讓企業得以製作標誌或其他圖像識別元素,甚至能依據使用者上傳的品牌風格指南生成圖像。

延伸閱讀:Gamma免費版怎麼用?30秒生成簡報、網頁,還能一鍵製作社群圖卡!完整攻略一次收

實測!GPT-4o比Grok更厲害嗎?

在GPT-4o強化生圖能力之前,馬斯克旗下xAI所開發的Grok是相對生圖友善的語言模型。因此,《數位時代》以下接逐一實測相同的生圖Prompt(相對複雜的圖片,將利用Gemini 2.5 Pro生成),來比較能力差異。

題目1:單一物件清晰度(貓)

首先從最簡單的開始。提示是:

「請生成一隻逼真的貓咪圖像。」

從結果來看,Gpt-4o在清晰度上略勝一籌。

Gpt-4o

首先以Gpt-4o來說,可以從貓身上的毛髮分岔看出具備更高的解析度,但只有生成一張。

GPT貓咪.jpg
4o的生成結果相對清晰,但只有一張。
圖/ OpenAI

Grok

Grok生成的貓咪圖案解析度也不俗,優勢是一次兩張,選擇更多。

GROK貓咪.jpg
Grok生成的貓圖其實也頗為清晰,但略輸給Gpt-4o。
圖/ Grok

題目2:圖片結合文字(貓罐頭廣告)

延續第一題,要求AI在原本的生成結果上加入更複雜的概念與文字標題,具體提示為:

「我需要據此結果進一步生成『有標題』的貓罐頭廣告,畫面是貓咪正在吃罐頭,標題文案是 『沒有一罐不能解決的問題。如果有,就兩罐。』

Gpt-4o

就結果而言,GPT-4o確實有生成出指定的文字標題,雖然中文字體有點奇怪,但在品質與概念上符合提示要求。

4o貓罐頭.jpg
GPT-4o確實有完成文字標題生成。
圖/ OpenAI

Grok

Grok的圖片清晰度沒問題,但對於「貓罐頭」的理解不如GPT-4o精準,左圖比較像人類的英國焗豆罐頭,右圖則是「貓飼料」,而且沒有文字標題。

GROK貓咪罐頭.jpg
Grok並未生成出文字標題。
圖/ Grok

題目3:按照範例圖片生成

第三題,按照一般人使用習慣,上傳一張範例圖片給AI,並請AI依照指定風格重新生成圖片。本次以臉書創辦人祖克伯的照片為範例,具體提示如下:

將圖片轉換為類似「吉卜力」的畫風,構圖保持相同即可。

結果十分明顯,Grok的生成圖片與吉卜力相差甚遠。反觀Gpt-4o的成效果令人眼睛為之一亮,從人物表情到構圖,都保持與原圖片一致。

Gpt-4o

GPT-4o祖克伯.jpg
GPT-4o生成的結果頗為理想。
圖/ GPT-4o

Grok

GROK祖克伯.jpg
根據成果,難以聯想到吉卜力風格。
圖/ Grok

題目4:完全按照Prompt生成複雜構圖

最後一題,在沒有圖片參照的情況下,請AI依據「AI生成的Prompt來生成複雜圖片」。首先要求Gemini 2.5 Pro 生成圖片提示,提出的問題是:

我要生成「Elon musk登陸火星」的圖片生成prompt。請根據背景(所處的地理位置)、人物(從具體人物到動態描述)、構圖(包含人物及其他符號元素)生成。

要求如下:
1.照片比例16:9。
2.人物動作要有動態感,例如他正在躲避火星上的風暴。
3.圖片中要有包括類似CyberTruck的載具。

Gemini 2.5 Pro提供的prompt如下:

背景:大型隕石坑入口附近,火星地形,揚起的紅色塵土,稀薄的橘色大氣層和遠處朦朧的山脈。
人物:Elon Musk,穿著先進的 SpaceX探索服對抗強風,嘗試穩住身體往前邁進。
構圖:中景鏡頭,人物在前景,身後有一台CyberTruck風格載具,載具的銳利線條與環境形成對比,高細節度高。
比例:16:9

依照結果而言,仍是Gpt-4o相對理想,雖然人物比例略顯奇怪,但整體而言相對符合提示;Grok則是大要件符合,例如在火星上、有馬斯克跟CyberTruck,但是其他細節並不明顯。

Gpt-4o

馬斯克登陸火星.jpg
Gpt-4o的成果,有將地形描述,與人物的動作考慮進去,但筆觸有油畫感,頭的比例也有些失真。
圖/ OpenAI

Grok

GROK musk.jpg
GROK的生成結果,細節不太明顯。
圖/ GROK

結論:Gpt-4o確實生圖能力躍升

在將兩種模型比較過後,可發現Gpt-4o在理解自然語言的能力更為突出,在單純的物件,或是夾帶圖片風格轉換上,成效都令人驚艷。

值得注意的是,在圖片修改上,Gpt-4o的上下文理解能力也頗為優異,點擊生成的圖片之後,可在網頁介面上圈選想要修改的地方,並要求AI局部修改!

目前,Gpt-4o的修圖功能甚至開放給免費用戶,想要免費利用可要把握,而且甚至可以要求Gpt-4o客製化迷因。

女人與貓迷因.jpg
經典迷因也可以換個風格。
圖/ OpenAI
科學的盡頭.jpg
雖然可以生成文字,但要識別簡體與繁體字仍有一定難度。
圖/ OpenAI

延伸閱讀:ChatGPT-4o專屬LINE貼圖、風格漫畫怎麼生?4步驟教學一次看

存在版權柵欄?OpenAI:不能直接模仿在世藝術家

儘管 GPT-4o 在圖像生成方面取得了進步,但並非完美無缺。Goh 坦承,在公司展示的一個範例中,用戶上傳一張有兩扇窗戶的客廳照片,要求 AI 重新生成帶有新家具的圖像,但系統最終只呈現了一扇窗戶。

至於潛在的版權問題?OpenAI 表示,GPT-4o 的訓練數據來自「公開可得的資料」以及與 Shutterstock (影像圖庫公司) 等企業的合作夥伴關係所取得的專有數據。OpenAI 的營運長 Brad Lightcap 強調:「我們在輸出內容時尊重藝術家的權利,並設有政策防止生成直接模仿在世藝術家風格的作品。」

延伸閱讀:
2025十大高薪副業出爐!不用有經驗、工作彈性,這職缺一天可賺近5000元
AI界超夯新詞,MCP是什麼?定義、實例一次看懂

責任編輯:李先泰

往下滑看下一篇文章
從 Raise Day 出發,方睿科技如何打造商用地產的 AI 企業服務生態系?
從 Raise Day 出發,方睿科技如何打造商用地產的 AI 企業服務生態系?

AI 與數據正快速落地至各行各業,從製造、金融、電信、醫療到零售,應用速度不斷加快。但在每年交易規模至少新台幣 1900 億元的商用地產領域,卻長期受到數據破碎且不透明的限制,只能仰賴人力蒐集資訊,再憑直覺和經驗去解讀資訊、做出決策,使 AI 潛在價值難以真正發揮。為回應產業轉型的核心痛點,方睿科技首度舉辦「商用地產生態系年會 2026 Raise Day」,以開放式平台為核心,串聯專業地產服務商、空間相關企業服務商、產業專業人士等多元角色,勾勒出 B2B 企業服務生態系的全貌,希望能透過科技促進數據流動,為商用地產企業協作模式開啟新的可能性。

方睿科技
方睿科技首度舉辦 2026 Raise Day,以開放式平台為核心串聯多元角色,推動商用地產邁向產業共好的新階段。
圖/ 數位時代

方睿科技雙軌策略,讓 AI 成為商用地產的決策引擎

方睿科技創辦人暨執行長吳健宇指出,在 AI 時代,人應該專注於「最有價值」的工作;然而在商用地產業中,專業人士卻有約 70% 的時間耗費在資料蒐集與整理上,真正用於判斷與決策的時間僅約 10%。方睿科技希望翻轉這樣的時間分配,讓人力從低價值的資料處理中解放,將更多心力投入在判斷、溝通與決策等創造價值的商業活動。

方睿科技
方睿科技創辦人暨執行長 吳健宇
圖/ 數位時代

為此,方睿科技提出兩條實踐路徑。第一條是建構出具備完整性、易用性與進化性的商用地產智慧平台,運用 AI 技術,將過去產業中破碎、非結構化的資料,重塑為可被運算、可驗證的標準化數據,並結合圖表與互動式介面,讓使用者能夠快速得到完整市場資訊,實現「用戶即專家」的目標。

第二條則是推動生態系聯盟,將不動產視為企業服務的核心載體,串聯設計、家具、搬遷、清潔等多元服務夥伴,使空間不再只是靜態標的,而是承載案例、服務與數據回饋的生態系節點。透過生態系夥伴累積的實務資料與服務紀錄,平台得以發展「資料即推薦」模式,推動商用地產從單點交易,邁向可擴張的 B2B 服務網絡。

獨創「資料飛輪」機制,實現用戶即專家目標

在 AI 模型日益普及的當下,真正的競爭關鍵已不在模型本身,而是能否有效率地收集資料、提高資料品質,並將其與實際決策流程緊密結合。為此,方睿科技獨家設計出一個由「資料收集、資料精煉、專家把關、決策反饋」組成的資料飛輪,回應商用地產長期面臨的資料破碎與決策效率低落問題,成為方睿科技實踐願景的第一條路徑。

方睿科技技術長郭彥良進一步說明,資料飛輪機制的運作架構。首先在資料收集階段,必須系統性蒐集公開資料、內部檔案與報告,並透過 AI 協作將圖片等非結構化資訊轉換為可用的結構化數據。接著進入資料精煉,透過資料清洗與實體對齊,將原始資訊從單純的可閱讀升級為可比較、可推論的決策依據。第三步專家把關,則引入不動產專家進行校正與產業判讀,補上模型難以理解的規則與慣例,確保關鍵數據的正確性。最後的決策反饋階段,藉由收集使用者提問與行為,檢視現有資料是否足夠精準,再回到專家校正與補齊流程,使整個系統能隨使用頻率提升而持續進化。

在資料飛輪的運作基礎上,方睿科技正積極研發商用地產智慧平台 PickPeak。郭彥良表示,PickPeak 並非單純的物件搜尋工具,而是結合深度資料與 AI 的決策輔助平台。使用者可透過自然語言互動,提出人數、預算、區位、產業屬性等多重條件,再由系統動態生成可比較、可驗證的選址方案,真正將 AI 從「回答問題的工具」,轉化為「陪伴決策的數位專家」。

方睿科技
方睿科技技術長 郭彥良
圖/ 數位時代

創新 Data to win 模式,讓 AI 深入商用地產各階段決策流程

不過,單靠數據整合與 AI 應用仍不足以支撐產業全面升級,因此,方睿科技提出的第二條路就是,推動產業生態系聯盟,整合商用地產市場上不同角色的數據,讓 AI 能夠真正成為商用地產決策時的智慧引擎。

方睿科技不動產知識創新中心總監曾凡綱指出,目前在企業、房東或物業主與各類服務供應商之間,缺乏有效的整合機制,導致企業在選址與空間規劃過程中,難以快速找到真正合適的服務與解決方案,形成明顯的產業斷點。

為解決這些斷點,方睿科技提出「Data to win」模式,以資料取代傳統「Pay to win(付費買廣告)」思維,讓真正具備經驗與實績的服務夥伴,在適當的決策節點被看見。

曾凡綱說明,在廣告投放效益越來越低的情況下,企業服務商面臨的問題已不只是「如何曝光」,而是「如何在對的地方被看見」,這將是未來的市場勝出指標;而 Data to win 正好可以協助企業服務商建立此能力,方睿科技將生態系夥伴所擁有的案例、服務紀錄與產業知識等資料,經過去識別化與結構化處理後,再嵌入企業決策流程中,讓推薦不再來自廣告投放,而是真實、可被驗證的使用經驗,透過這樣的機制,不僅提升企業決策的準確度,也能同步放大生態系夥伴在合作中的實質價值。

舉例來說,方睿科技整合辦公傢俱夥伴 Backbone 班朋實業長期累積的辦公室規劃案例與平面圖資料,讓企業在選址階段,就能同步評估空間規劃方案,加速決策流程。又如,整合出行服務夥伴 USPACE 悠勢科技的服務資料,並呈現在地圖上,協助企業評估辦公據點的交通便利性,優化員工日常通勤與出行體驗。此外,平台也可整合大樓的 ESG 認證、公共設施與服務層資訊,協助企業快速篩選符合需求的辦公大樓,提升進駐媒合效率。

方睿科技
方睿科技不動產知識創新中心總監 曾凡綱
圖/ 數位時代

「Raise Day 只是這場變革的起點。」吳健宇強調,方睿科技已經透過投資與合夥模式,將布局延伸至專業地產服務與空間經營領域,至今旗下已有商用不動產仲介、顧問與估價等專業服務的宇豐睿星,以及聚焦商用地產代銷市場的希睿創新置業。透過直接參與第一線實務運作,方睿得以更深入理解產業真實痛點,讓科技不只是工具,而能真正回應實際決策與服務需求。

此外,方睿科技未來也將持續擴大「商用地產 x 企業服務生態系」聯盟,目前包括 Backbone、USPACE、IKEA For Business、潔客幫等企業服務夥伴已率先加入;接下來,方睿科技將邀請更多擁有關鍵數據與專業能力的企業服務商加入,讓數據在安全、可控的前提下流動,進一步釋放商用地產在選址、營運與企業服務等全生命週期中的結構性價值,為產業轉型啟動下一個關鍵階段。

方睿科技
右起方睿科技共同創辦人暨營運長陳致瑋、USPACE悠勢科技共同創辦人暨執行長宋捷仁 、Backbone班朋實業創辦人暨執行長廖家葳,透過企業服務生態系合作共同為產業啟動下一個關鍵階段。
圖/ 數位時代

方睿科技官網: https://www.funraise.com.tw

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓