中文字終於沒有亂碼了!ChatGPT推出Images 2.0,「思考模式」可自我檢測圖是否走鐘
中文字終於沒有亂碼了!ChatGPT推出Images 2.0,「思考模式」可自我檢測圖是否走鐘

重點一:ChatGPT Images 2.0 文字描繪與多語系大躍進:日、韓、中、印地、孟加拉文皆可渲染。

重點二:首度加入「思考模式」,一次產最多 8 張連貫系列圖,並能自我檢查校對輸出。

重點三:時間點逼近IPO,OpenAI 要靠新圖像熱度衝破 10 億週活用戶。

OpenAI 在 4 月 21 日舉行線上發表會,推出新一代圖像生成模型 ChatGPT Images 2.0,主打精準文字描繪、多語系支援,以及首度具備「思考能力」的圖像生成模式。

執行長奧特曼(Sam Altman)在直播中形容:「Images 2.0 是一次巨大飛躍,就像一次從 GPT-3 跳到 GPT-5。」OpenAI 要把圖像生成從「按鈕式產圖」推進到「視覺合作夥伴」,讓模型不只生圖,還要會規劃、查資料、反覆校對自己的輸出。

ChatGPT Images 2.0 開啟全能圖像時代
OpenAI 推出 ChatGPT Images 2.0,強化中日韓文字描繪,並首度為圖像模型加入「思考」能力。對 ChatGPT 10 億活用戶目標有何助力?
圖/ OpenAI

OpenAI推出ChatGPT Images 2.0!中文字與非拉丁文字,終於不再亂碼

過去兩年,AI 生圖工具最被詬病的就是文字亂碼問題。兩年前你請 DALL-E 3 畫一張墨西哥餐廳菜單,菜名會變成「enchuita」「churiros」「burrto」「margartas」這類發明字。中文、日文、韓文等非拉丁文字的情況更慘,筆畫錯置、結構扭曲是家常便飯。

這次 Images 2.0 特別把「非拉丁文字渲染」列為主要升級項目,官方點名日文、韓文、中文、印地文、孟加拉文的文字表現都有明顯進步(OpenAI 官方公告僅以「Chinese」表述,未區分繁體或簡體)。

ChatGPT Images 2.0 生成簡體中文漫畫
OpenAI在官網中示範的中國簡中漫畫。
圖/ OpenAI

發表會上展示的示範包括:完整的日式漫畫頁面、一整張米飯照片中只有單一米粒印有模型名稱,以及能直接在 API 以 2K 解析度輸出的海報與資訊圖。

ChatGPT Images 2.0 生成日文漫畫
這一波更新後,ChatGPT Images 終於可以生成中文與日文等語言。
圖/ OpenAI

換言之,對華文市場的編輯、行銷、設計工作者來說,這代表可以直接用一張 AI 生成圖產出宣傳素材,而不用再事後修文字。

「思考模式」是新玩法,一次給你八張可用成品

Images 2.0 最大的結構性改動,是引入 OpenAI 推論模型的「thinking(思考)」能力。

白話說,過去 AI 生圖是「一句 prompt 換一張圖」,想要系列作品得自己一張張餵指令。新版的思考模式可以接收一次性的複雜需求,例如「幫我做一組開幕廣告,要 Twitter、IG 限動、IG 主頁、LinkedIn 四種比例」,模型會自己拆解任務、上網查即時資訊,產出最多 8 張「角色與物件連貫」的圖像。

OpenAI 形容這是「視覺合作夥伴(visual thought partner)」:它不只是工具,而是能接手從草稿到成品中間的整理、編排、校對工作。

思考模式另一項能力是自我檢查。模型生圖後會回頭驗證輸出是否符合指令,官方稱錯字「非常罕見(very rare)」。

不過該模式目前只開放給 ChatGPT Plus、Pro、Business 付費用戶;所有 ChatGPT 與 Codex 用戶可使用較快的「即時模式(instant mode)」。

會上網查資料,知識截止到 2025 年 12 月

另一個值得注意的升級,是 Images 2.0 具備更新的世界知識。官方標示模型的知識截止日為 2025 年 12 月,在思考模式下還能搜尋網路補最新資訊。這對製作說明圖、教學素材、資訊圖表這類需要準確度的場景特別關鍵。

例如畫出「Cantor 對角線證明」這類抽象數學概念的資訊圖,模型可以自己整理內容、寫出說明文字、安排版面配置,而不是單純把 prompt 渲染成圖。

不只對手逼近,OpenAI 還有 IPO 壓力

Images 2.0 的時機點也不是巧合。

去年底 Google 連發 Gemini 3 與圖像生成工具 Nano Banana Pro,外界評價熱烈,OpenAI 內部據報隨後發布「code red」備忘錄。另一頭,Anthropic 以 Claude Code、Claude Cowork 等代理式工具強攻開發者與企業市場,逼得 OpenAI 持續加碼旗下的 Codex 更新。

此外,OpenAI 傳出最快今年內 IPO。在獲利壓力下,公司近期已改組為公益企業、砍掉部分產品線(如影片生成工具 Sora)。2 月時 OpenAI 公布 ChatGPT 的週活躍用戶突破 9 億;若 Images 2.0 能複製去年「吉卜力風」的病毒級熱度,對 ChatGPT 衝破 10 億週活用戶有直接幫助。

但Images 2.0還不完美,物理結構與密集細節仍吃力

OpenAI 也坦承現階段限制。

Images 2.0 在需要「完整物理世界模型」的場景仍會失手,例如摺紙教學、魔術方塊等需要理解角度、翻面、對應關係的題目;密集重複細節(如一堆細沙)也可能超出模型能力。圖表的箭頭、零件標籤等精細標示,仍建議人工複查。

同時,API 中超過 2K 解析度的輸出目前仍屬 beta 階段,部分輸出可能不穩定。

Images 2.0定價與開放時程

  • ChatGPT 與 Codex 用戶:即日起可使用即時模式(instant)
  • Plus、Pro、Business 訂戶:另開放思考模式(thinking)進階輸出
  • 開發者 API:以 gpt-image-2 模型名稱提供,價格依品質與解析度浮動

延伸閱讀:認識蘋果新執行長特納斯!「工程師頭腦、創新者靈魂」,帶4兆美元帝國進入後庫克時代

資料來源:OpenAIGizmodoTechCrunch

本文初稿為AI編撰,整理.編輯/ 李先泰

關鍵字: #openai #ChatGPT
往下滑看下一篇文章
元健助聽器攜手 EVOX 啟動雲端革命:從電話到數據,打造可量化的客戶經營新模式
元健助聽器攜手 EVOX 啟動雲端革命:從電話到數據,打造可量化的客戶經營新模式

面對消費者注意力日益分散、行銷成本節節攀升的挑戰,企業能否在每一次互動中精準把握「關鍵時刻」,已成為站穩市場的決勝點。

台灣助聽器領導品牌元健大和(元健助聽器),不僅透過雲端服務優化配戴體驗,更攜手 E2 Nova 易得雲端(EVOX)打造企業級顧客互動平台,透過 EVOX CloudTalk 雲端電話總機與 EVOX Connect 全渠道雲端聯絡中心,元健助聽器成功的將傳統通訊互動內容轉化為可追蹤、可分析的數據資產,不僅大幅優化客服品質與內部溝通效率,更讓「電話」跳脫單純的服務功能,轉變為驅動營運成長與精算廣告投放效益的核心引擎。

人人買得起、願意戴的助聽器

在全球助聽器品牌中,元健助聽器是少數以「服務創新」來驅動產業變革的代表。董事長吳少暉看見使用者長年面臨的「貴、遠、醜」三大痛點,亦即價格負擔高、服務據點有限及外型選擇不足,決定將「提升助聽器普及率」定為品牌使命,直球對決這三大使用門檻。

EVOX-2.JPG
元健助聽器從產品、通路到服務模式全面重構助聽器的使用體驗,希望解決價格負擔高、服務據點有限及外型選擇不足等痛點。
圖/ 數位時代

為此,元健助聽器從產品、通路到服務模式全面重構助聽器的使用體驗。除了優化產品設計,廣泛佈建電商平台、電視購物等多元通路,主動挖掘潛在消費者外,亦於 2018 年率先推出雲端服務,透過 App 提供聽力檢測、調整助聽器設定等服務,不僅為使用者省去往返門市的時間與不便,也降低服務成本,讓助聽器從過去的高門檻醫療輔具,轉變為更多人可以負擔、可以使用的日常產品。

元健助聽器雲端布局的前瞻性,使其能較同業累積更多用戶數據與實戰經驗,形成難以複製的競爭優勢。如今,元健助聽器已是台灣助聽器與聽力服務市場上銷量第一的品牌,並以兩成市佔、全台 66 間門市為根基,將服務版圖延伸至泰國、馬來西亞、菲律賓、印度、日本及美國等海外市場。

從電話到數據:元健助聽器打造可量化的客戶轉換路徑

隨著服務版圖快速擴張,帶動元健助聽器的營運規模同步成長,挑戰也隨之浮現。吳少暉表示,傳統電話總機系統的建置與維護成本相當高,還可能因為突發狀況而導致服務中斷、流失商機,更重要的是,整體客戶服務流程缺乏可視性。

過往的廣告宣傳,僅能仰賴各門市店長回報新客來電數量,數據不即時且準確性不足,當成效不如預期時,更難以判斷問題究竟出在哪裡,是行銷文案不夠動人?或是門市服務需要再優化?為此,元健助聽器導入 EVOX CloudTalk 雲端電話總機,不僅省去主機建置與維運成本,更將每一通來電從「聲音」轉化為「數據」,從而提升整體服務效率。

透過 EVOX 的數位足跡,元健助聽器建立起一套從「曝光、點擊、來電到到店」的完整轉換路徑:從廣告投放帶來的網站流量、分店頁面點擊,到客戶實際撥打電話的行為,甚至每一通來電的接聽狀況與通話內容,皆能被 EVOX CloudTalk 完整記錄與分析。

吳少暉指出,現在團隊能以「來電數」作為評估指標,分析與比較不同行銷文案和廣告投放策略的成效,這讓元健助聽器成功擺脫過往「憑經驗、靠感覺」的決策模式,取而代之的是透過數據精準掌握不同區域與族群的需求差異,進一步優化行銷與服務策略,讓每一分行銷預算都能發揮最大戰力。

EVOX-3.JPG
元健大和董事長吳少暉指出, EVOX CloudTalk 讓公司能以「來電數」作為評估廣告投放成效的指標,讓每一分行銷預算都能發揮最大戰力。
圖/ 數位時代

EVOX Connect 帶來6大效益,讓客服成為營運成長引擎

在建立數據決策文化後,吳少暉進一步思考,如何讓每一通來電創造更高價值?過去由各門市自行接聽電話,不僅服務品質難以保持一致,也讓門市人員在現場服務與接聽電話之間分身乏術。因此,元健助聽器於 2023 年成立專責客服團隊,並導入 EVOX Connect ,將新客來電集中至客服部門,讓門市人員能專注於客戶到店後的體驗與售後服務。

吳少暉認為, EVOX Connect 為元健助聽器帶來六大關鍵效益。首先,自動輪派機制,兼具效率與公平:系統依照預設棒次自動分派來電給客服人員,解決過往搶線或來電分配不均的問題,顯著提升整體接線效率。

其次,動態狀態管理,服務永不中斷:當客服人員請假、離席或暫時無法接聽電話時,可暫時將服務狀態調整為下線,系統會自動將來電轉派給其他人員,確保服務不中斷。

第三,自動撥號機制,效率提升 5 倍:過去,客服人員有很多時間花費在手動撥號及等待接通上,而 EVOX Connect 的自動撥號功能可同時撥出多通電話,並僅保留成功接通的電話,大幅節省客服人員等待時間,也讓撥號效率提升 5 倍。

第四,嚴謹個資防護,強化企業合規: EVOX Connect 可集中匯入客戶資料與自動撥號機制,減少客服人員直接接觸完整顧客資訊的機會,不僅提升顧客個資安全性,也強化企業在法規與稽核下的合規能力。

第五,開放 API 整合,打造多元應用。 EVOX Connect 提供相當完整的 API 與技術文件,讓元健助聽器能與內部系統進行整合,發展更多元的應用場景。吳少暉舉例指出,目前與外部夥伴合作開發的 AI 客服系統,便是透過 EVOX Connect 所提供的 API 進行整合,讓非營業時間的來電可以交由 AI 客服即時回應,避免潛在商機流失,實現 24 小時服務不打烊的目標。

EVOX-4.JPG
元健大和與外部夥伴合作開發 AI 客服系統,並透過 API 介接 EVOX Connect ,讓非營業時間的來電可以交由 AI 客服即時回應,實現 24 小時服務不打烊的目標。
圖/ 數位時代

第六,通話錄音轉化教材,複製成功經驗:透過系統內建的通話錄音功能,讓元健助聽器可挑選優秀的客服互動案例並轉化為教材,協助各門市人員精進溝通技巧,讓服務經驗得以複製與傳承,進一步提升整體服務品質。

元健助聽器與 EVOX 多年的合作,已從單一品牌的數位轉型,擴展至母集團全面導入雲端系統的策略升級。這份信任,來自於雙方在企業文化與發展方向上的高度契合,以及 EVOX 系統在擴充性與整合性上的優勢,能滿足公司不同成長階段的需求。未來,元健助聽器將加速拓展海外市場,希望藉由 EVOX 建立單一管理後台,將客戶互動轉化為可持續累積的數據資產,為邁向全球市場奠定關鍵基礎。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓