GPT-4o生圖功能暴紅！一句話生成「吉卜力風」：使用教學一次看|數位時代 BusinessNext

重點一 ：OpenAI於3月26日更新旗下語言模型GPT-4o，使其能夠依照提示，實現精確、準確、逼真的圖像生成。

重點二 ：先前OpenAI的模型難以在圖像中生成清晰可讀的文字段落，但新版 GPT-4o 已能辦到。

重點三 ：GPT-4o成ChatGPT預設圖像模型，原開放免費及付費用戶，但由於使用人數超乎預期，奧特曼表示將推遲向免費用戶發布這項功能。

OpenAI近日發表 GPT-4o 的更新版本，顯著提升了圖像生成的逼真度。這項成果來自為期一年、結合人類訓練員的努力，新版 GPT-4o 現已取代 DALL-E 3，成為旗下聊天機器人 ChatGPT 預設的圖像生成模型。

OpenAI原先表示，無論是 ChatGPT 的免費用戶，或是 Plus、Team 和 Pro 方案的訂閱者，現在皆可使用此更新功能。

但OpenAI執行長Sam Altman週三宣布，ChatGPT 新推出的AI圖像功能將推遲向免費用戶開放，原因是需求量遠高於公司預期：「ChatGPT 中的圖像功能比我們預期的還要受歡迎（而且我們原本的預期已經相當高）。」

截至目前，GPT-4o的生圖新功能己在各大社群網路暴紅，尤其是「吉卜力風格」圖像，就連馬斯克、奧特曼都紛紛上傳新頭像。

延伸閱讀：曾說AI圖「極度噁心」的宮崎駿，吉卜力風卻變全網熱點！生成特定風格圖片究竟有沒有侵權？

AI更懂人話了！關鍵是一群「人類訓練員」

此次 GPT-4o 圖像生成能力提升的背後，關鍵在於一群「人類訓練員」的貢獻。該計畫首席研究員 Gabriel Goh 指出，這些訓練員負責標註訓練數據，指出 AI 生成圖像中的拼寫錯誤、異常的手部或臉部等瑕疵。透過這種被稱為「人類回饋強化學習」(Reinforcement Learning from Human Feedback, RLHF) 的常見技術，AI 模型學會更精確地遵循人類指示，從而生成更準確、實用的圖像。

OpenAI 透露，約有略多於100名人類工作者參與了此次的強化學習過程。Goh 強調：「基礎模型本身已具備智慧，而 RLHF 過程則能引導並提煉這種智慧。」

OpenAI 表示，隨著 GPT-4o 研究的進展，ChatGPT 的圖像生成功能對消費者和企業而言實用性大增。例如，先前的模型難以在圖像中生成清晰可讀的文字段落，但新版 GPT-4o 已能辦到。

ChatGPT 多模態產品負責人 Jackie Shannon 補充，新模型還能創建透明背景，讓企業得以製作標誌或其他圖像識別元素，甚至能依據使用者上傳的品牌風格指南生成圖像。

延伸閱讀：Gamma免費版怎麼用？30秒生成簡報、網頁，還能一鍵製作社群圖卡！完整攻略一次收

實測！GPT-4o比Grok更厲害嗎？

在GPT-4o強化生圖能力之前，馬斯克旗下xAI所開發的Grok是相對生圖友善的語言模型。因此，《數位時代》以下接逐一實測相同的生圖Prompt（相對複雜的圖片，將利用Gemini 2.5 Pro生成），來比較能力差異。

題目1：單一物件清晰度(貓)

首先從最簡單的開始。提示是：

「請生成一隻逼真的貓咪圖像。」

從結果來看，Gpt-4o在清晰度上略勝一籌。

Gpt-4o

首先以Gpt-4o來說，可以從貓身上的毛髮分岔看出具備更高的解析度，但只有生成一張。

Grok

Grok生成的貓咪圖案解析度也不俗，優勢是一次兩張，選擇更多。

題目2：圖片結合文字（貓罐頭廣告）

延續第一題，要求AI在原本的生成結果上加入更複雜的概念與文字標題，具體提示為：

「我需要據此結果進一步生成『有標題』的貓罐頭廣告，畫面是貓咪正在吃罐頭，標題文案是 『沒有一罐不能解決的問題。如果有，就兩罐。』 」

Gpt-4o

就結果而言，GPT-4o確實有生成出指定的文字標題，雖然中文字體有點奇怪，但在品質與概念上符合提示要求。

Grok

Grok的圖片清晰度沒問題，但對於「貓罐頭」的理解不如GPT-4o精準，左圖比較像人類的英國焗豆罐頭，右圖則是「貓飼料」，而且沒有文字標題。

題目3：按照範例圖片生成

第三題，按照一般人使用習慣，上傳一張範例圖片給AI，並請AI依照指定風格重新生成圖片。本次以臉書創辦人祖克伯的照片為範例，具體提示如下：

將圖片轉換為類似「吉卜力」的畫風，構圖保持相同即可。

結果十分明顯，Grok的生成圖片與吉卜力相差甚遠。反觀Gpt-4o的成效果令人眼睛為之一亮，從人物表情到構圖，都保持與原圖片一致。

Gpt-4o

Grok

題目4：完全按照Prompt生成複雜構圖

最後一題，在沒有圖片參照的情況下，請AI依據「AI生成的Prompt來生成複雜圖片」。首先要求Gemini 2.5 Pro 生成圖片提示，提出的問題是：

我要生成「Elon musk登陸火星」的圖片生成prompt。請根據背景（所處的地理位置）、人物（從具體人物到動態描述）、構圖（包含人物及其他符號元素）生成。

要求如下：
1.照片比例16:9。
2.人物動作要有動態感，例如他正在躲避火星上的風暴。
3.圖片中要有包括類似CyberTruck的載具。

Gemini 2.5 Pro提供的prompt如下：

背景：大型隕石坑入口附近，火星地形，揚起的紅色塵土，稀薄的橘色大氣層和遠處朦朧的山脈。
人物：Elon Musk，穿著先進的 SpaceX探索服對抗強風，嘗試穩住身體往前邁進。
構圖：中景鏡頭，人物在前景，身後有一台CyberTruck風格載具，載具的銳利線條與環境形成對比，高細節度高。
比例：16:9

依照結果而言，仍是Gpt-4o相對理想，雖然人物比例略顯奇怪，但整體而言相對符合提示；Grok則是大要件符合，例如在火星上、有馬斯克跟CyberTruck，但是其他細節並不明顯。

Gpt-4o

Grok

結論：Gpt-4o確實生圖能力躍升

在將兩種模型比較過後，可發現Gpt-4o在理解自然語言的能力更為突出，在單純的物件，或是夾帶圖片風格轉換上，成效都令人驚艷。

值得注意的是，在圖片修改上，Gpt-4o的上下文理解能力也頗為優異，點擊生成的圖片之後，可在網頁介面上圈選想要修改的地方，並要求AI局部修改！

目前，Gpt-4o的修圖功能甚至開放給免費用戶，想要免費利用可要把握，而且甚至可以要求Gpt-4o客製化迷因。

延伸閱讀：ChatGPT-4o專屬LINE貼圖、風格漫畫怎麼生？4步驟教學一次看

存在版權柵欄？OpenAI：不能直接模仿在世藝術家

儘管 GPT-4o 在圖像生成方面取得了進步，但並非完美無缺。Goh 坦承，在公司展示的一個範例中，用戶上傳一張有兩扇窗戶的客廳照片，要求 AI 重新生成帶有新家具的圖像，但系統最終只呈現了一扇窗戶。

至於潛在的版權問題？OpenAI 表示，GPT-4o 的訓練數據來自「公開可得的資料」以及與 Shutterstock (影像圖庫公司) 等企業的合作夥伴關係所取得的專有數據。OpenAI 的營運長 Brad Lightcap 強調：「我們在輸出內容時尊重藝術家的權利，並設有政策防止生成直接模仿在世藝術家風格的作品。」

延伸閱讀：
2025十大高薪副業出爐！不用有經驗、工作彈性，這職缺一天可賺近5000元
 AI界超夯新詞，MCP是什麼？定義、實例一次看懂

責任編輯：李先泰

從連鎖品牌走向街邊小店，自助設備迎來新一波普及潮

事實上，相較於連鎖餐廳、速食店或手搖飲品牌，自助設備在傳統市場、市集攤販、街邊小吃等中式餐飲場域的普及率一直不高。古吉系統科技總經理吳三奇分析，背後原因主要來自資訊落差、經營習慣與成本考量三大因素。

不過，隨著食藥署修正《食品良好衛生規範準則》，明定餐飲從業人員在調理即食食品時，手部不得接觸現金，這樣的市場現況正逐漸出現改變。關鍵在於，傳統餐飲業者的人力本就有限，「老闆一人負責點餐、備餐兼找零」的作業模式已成常態，即便有意增聘人力，也往往受限於缺工問題而不易實現。

在此背景下，自助點餐機/售票機、自助付款機等自助設備成了最佳解答。吳三奇形容，業者導入自助設備就像多聘請一位櫃檯人員，不僅能協助處理點餐、收款等重複性工作，符合法規要求及降低第一線人力負擔，也能減少找錯錢、收到假鈔，以及尖峰時段來不及應對顧客需求等問題，讓業者能將更多心力投入餐點製作與服務品質提升。

從早餐店到主題樂園，自助設備如何解決不同產業的營運痛點？

而從古吉服務的客戶案例來看，自助設備所解決的問題，不只是作業效率而已，而是涵蓋人流分散、收款管理與消費體驗等不同面向，且應用場景橫跨餐飲業、觀光休閒等各種服務場域。

像連鎖早餐品牌晨間廚房便透過自助設備解決尖峰時段的人流問題。由於早午餐產業的顧客高度集中在特定尖峰時段，且普遍不願久候，因此，點餐與出餐效率往往直接影響門市營運表現。為此，晨間廚房在原有的 POS 與手機點餐系統外，再導入古吉自助點餐機進行分流顧客，不僅提供更多元的點餐選擇，也有效降低櫃檯壓力並提升整體點餐與出餐效率。

而手搖飲品牌茶之魔手則透過自助收款設備改善門市收銀流程，其將自助收款機整合既有 POS 系統，店員只需負責點餐即可，由消費者自行完成付款流程，不僅減少收款、找零所耗費的時間，也能降低錯誤風險，進而快速消化排隊人流。

值得注意的是，自助設備的應用也早已跨出餐飲產業。例如主題樂園遠雄海洋公園便導入自動售票機並整合園區消費系統，遊客在購票的同時，還可取得折價卷，折抵在園區內的消費，不僅降低售票窗口的人力需求，也讓遊客從購票到入園的流程更加順暢。

從店家痛點出發，打造跨產業的一站式解決方案

從餐飲到觀光，不同產業面臨的營運挑戰雖然各不相同，卻都能在古吉的解決方案中找到對應答案，關鍵在於，古吉從市場需求角度出發，建立起涵蓋點餐、收款、叫號、廚房作業及營運管理的一站式解決方案，並透過多元產品組合滿足不同場域需求。

吳三奇進一步說明，古吉系統科技早在 2014 年便投入研發自助點餐系統，長期與第一線店家合作的過程中，發現許多業者面臨相似的經營難題，例如：人力不足、店面空間有限等。因此，古吉的產品開發始終圍繞著「省空間、更有效率、降低成本」三大目標，希望透過科技協助店家減輕人力負擔，同時優化營運流程。

正因如此，古吉系統科技不斷研發新產品，目前市場上多數品牌僅能提供 3 至 5 種機型，古吉卻已發展出 12 至 15 種不同尺寸與安裝形式的設備，讓業者能依照自身業態與空間條件選擇最適合的配置。

這樣的研發思維，也體現在古吉 2026 年推出的多款新產品上。例如：雙面自助點餐機採用兩個螢幕共用一台主機的設計，可同時服務兩位顧客；桌上型 1 托 2 點餐機則讓兩台點餐機共用一台付款設備，在有限空間中提升服務量能；而 POS 與自助點餐二合一雙系統機，則兼具店員服務與顧客自助操作兩種模式，可依現場需求靈活調整，無論是店員點餐、顧客自助結帳，或由顧客自行完成點餐與付款，都能有效提升整體營運效率。

「我們不是為了追求產品數量而開發新產品，而是從店家真正遇到的問題出發。」吳三奇表示，正因為持續思考如何解決店家在人力與空間上的限制，古吉才能持續創新產品，並成為台灣商家導入數量最高的自助點餐機品牌。

展望未來，吳三奇認為，隨著食安規範逐步落實，加上缺工問題短期內難以緩解，自助設備在服務業中的角色也將持續轉變，從過去提升效率的選配工具，逐漸成為維持營運、兼顧合規與優化顧客體驗的基本配備，並進一步推動餐飲業展開新一波數位轉型。

面對市場需求持續升溫，古吉系統科技也將持續投入產品創新，包括導入 AI 應用、縮減設備體積，以及開發更多符合不同場域需求的解決方案。同時，古吉也正積極布局日本、香港、越南等海外市場，希望將台灣自主研發的自助服務技術推向國際，讓更多企業透過科技提升營運效率與服務品質。