OpenAI發布2款o1系列新模型!推理能力大勝GPT-4o,可解決複雜數學、編碼難題
OpenAI發布2款o1系列新模型!推理能力大勝GPT-4o,可解決複雜數學、編碼難題

OpenAI於9月12日在官網宣布推出代號Strawberry的新一代AI模型系列,正式名稱為OpenAI o1。其為一組強化推理能力的生成式AI,具備科學、數學和編程等領域的複雜任務處理能力。

首批發布的模型包括o1-preview,以及針對代碼生成的o1-mini,現已於ChatGPT及API平台上推出,企業版和教育版用戶下週可獲得存取權限。

ChatGPT Plus 和 Team 用戶已可在ChatGPT中訪問o1模型,但o1-preview每週可發送30條消息,而o1-mini則為50條,使用上仍有一定限制。

推理能力碾壓GPT-4o,擅長數學與編碼

OpenAI指出,o1系列模型的核心特點是推理能力顯著增強,o1能在回答前花更多時間進行推理,不但能考慮問題的各個部分,更能「思考」並自我檢查,以達到更準確的答案。

在技術測試中,o1在國際數學奧林匹克資格賽的正確解題率高達83%,前代模型GPT-4o僅為13%。此外,o1在編程競賽平台Codeforces中的表現達到了89百分位,超越了多數參賽者。

推理.jpg
據OpenAI測試,o1的數理能力遠超o1 preview跟4o(左);o1編碼能力同樣超群(中);博士等級科學測試甚至更勝人類專家(右)。

安全性方面,OpenAI衡量安全性的方法是測試使用者試圖越獄(繞過安全規則)時,模型將如何繼續遵循安全規則。在最嚴格的越獄測試之一中,GPT-4o得分為22(滿分100),而o1-preview模型得分為84分。

至於適用對象,若使用者欲解決科學、編碼、數學和類似領域的複雜問題,o1的推理能力可能特別有用。例如,醫療研究人員可使用o1來註釋細胞定序數據,物理學家可使用o1來產生量子光學所需的複雜數學公式等等。

推理超群,收費也超群

儘管推理能力大升級,但o1的收費也隨之增加。據OpenAI定價,o1-preview在API中的使用費用為每百萬個輸入token 15美元,輸出token則高達60美元,輸入成本是GPT-4o的3倍(每百萬個輸入 token 5美元),輸出成本則是4倍(每百萬個輸出token 15 美元)。

o1-mini 作為一款速度更快、價格更低的推理模型,相較o1-preview便宜 80%,特別適合需要推理但不需廣泛世界知識的應用場景。OpenAI 表示,o1-mini在準確生成和調試複雜代碼方面表現出色,可與o1-preview 相媲美。

由於目前版本仍在測試階段,o1在ChatGPT中的使用也受到限制,o1-preview每週限30條消息,o1-mini則限50條。模型的部分功能,如瀏覽網頁和文件分析,暫時未開放使用,而其圖像分析功能也因需進一步測試而未開放。

儘管在特定應用中具有優勢,o1仍有局限性。據《Tech Church》報導,模型有時需要超過10秒的時間才能回答問題,且仍可能產生幻覺。OpenAI也指出,o1在部分遊戲如圈圈叉叉(井字棋)中表現不穩定,並且經常不願承認自己無法回答的情況。

延伸閱讀:OpenAI新產品「草莓」將登場!這款新模型曾掀公司大內鬥,為何強到連研究員都害怕?

本文初稿為AI編撰,整理.編輯/ 李先泰

資料來源:《OpenAI》、《Tech Church

關鍵字: #AI #openai #ChatGPT
往下滑看下一篇文章
第6屆Meet大南方倒數!352組商機媒合、六大解方展區,帶問題進場就能找到解方
第6屆Meet大南方倒數!352組商機媒合、六大解方展區,帶問題進場就能找到解方

2026年8月28日(五)至29日(六),Meet大南方將於高雄展覽館展開第6屆展會,並於即日起正式啟動招商。

近兩年,南台灣企業開始出現一種很明顯的變化。

他們不再只是「想了解AI」,而是開始問:「這個東西能不能直接解決我的問題?」

在高雄,重工業與製造業面臨缺工與淨零轉型壓力;台南的高值製造聚落,開始加速導入自動化與數位管理工具;嘉義與屏東則分別圍繞無人機、智慧農業與綠能產業,形成新的區域應用場景。

這些變化背後,其實都指向同一件事:南台灣的企業需求,正在從「理解新科技」,轉向「尋找可立即落地的解方」。

#4 2026Meet大南方徵展
在破萬人流的展會現場,企業觀展者透過第一線交流快速比較不同解方與合作可能。
圖/ Meet創業小聚

而這也讓企業尋找解方的方式,開始改變。

過去,企業與新創及科技團隊的連結,多半依賴長期業務開發、人脈介紹,或零散的展會接觸;但在決策速度加快的情況下,企業更傾向在短時間內完成資訊比較、方案評估與初步媒合。

這也是為什麼,近年愈來愈多以「解方對接」為核心的場域開始出現。

以Meet大南方為例,2025年展會共促成352組商機媒合,較前一年成長2.7倍。在相近的展商規模下,媒合效率的提升,反映的並不只是活動熱度,而是企業需求正在快速集中。

AI已經不是重點,能不能落地才是

AI、自動化、ESG,幾乎已經成為所有產業論壇都會出現的關鍵字。

但對許多企業來說,問題早已不是「知不知道」,而是「能不能用」。

例如:
- AI能不能直接改善產線良率?
- 碳管理工具能不能真的降低營運壓力?
- 數位工具能不能解決人力不足?
- 自動化系統導入後,多久能看見效率提升?

比起概念,企業開始更在意落地性與導入成本。這也讓市場需求逐漸從「趨勢理解」,轉向更務實的「問題解決」。

比起曝光,現在的企業更在意能不能合作

在這樣的背景下,展會的角色也開始改變。

過去,展會更像品牌曝光與市場宣傳的平台;但現在,愈來愈多企業是帶著具體需求走進現場,希望在短時間內找到可以評估、比較,甚至直接進入合作討論的對象。

#0 2026Meet大南方徵展
企業需求加速浮現,也讓愈來愈多解方提供者選擇透過展會與企業直接對接。
圖/ Meet創業小聚

對解方提供者而言,這也意味著另一種市場接觸方式正在形成。

相較於傳統陌生開發,透過展會、媒合機制與現場交流活動,能在更短時間內接觸到大量潛在客戶,並快速理解區域市場的需求輪廓。

Meet大南方近年所強化的,也正是這類「高密度對接」。

除了展區展示外,現場也透過企業媒合會、投資人交流、新創社群活動等形式,增加需求方與解方之間的直接互動機會。

某種程度上,展會正在從「展示技術」,轉向「協助企業尋找答案」。

企業不是為了「看AI」而來,而是想解決缺工與效率問題

2026年Meet大南方將以「Meet Your BEST Solution」為核心主軸,並將展區重新調整為六大「解方區」,直接對應企業經營現場最常見的問題情境。

展區類別包括:
- 智慧製造與產線升級
- 數位管理與企業效率
- 醫療健康與高齡照護
- 淨零碳排與綠能永續
- 品牌轉型與跨境行銷
- 未來零售與餐飲科技

#3 2026Meet大南方徵展
為貼近企業需求,展會特別規劃六大解方展區,讓企業觀展者更有效率地找到對應解方。
圖/ Meet創業小聚

相較於以技術類型區分,這樣的方式更接近企業的思考邏輯。

企業不是為了「看AI」而來,而是為了解決效率、成本、缺工與轉型問題。而對新創與解方團隊而言,也更容易在具體場景中,被真正有需求的人看見。

南台灣缺的不是需求,而是有效的對接

從半導體供應鏈、製造業升級,到淨零與數位轉型需求快速增加,南台灣正在形成一個與過去不同的產業節奏。

這裡需要的,不再只是遙遠的科技想像,而是能真正進入工廠、辦公室與營運現場的實用工具。

#1 2026Meet大南方徵展
今年Meet大南方將於8/28、8/29在高雄展覽館舉辦。
圖/ Meet創業小聚

當企業開始加速尋找答案,市場也正在重新建立需求與解方的連結方式。

2026年8月28日至29日,Meet大南方將於高雄展覽館舉辦第6屆展會。在產業轉型持續推進的背景下,這類以解方對接為核心的場域,也逐漸成為南台灣企業與科技團隊建立連結的重要入口。

展會基本資料

2026 Meet Greater South 亞灣新創大南方
時間:8/28 (五)、8/29 (六)
地點:高雄展覽館北館
官網:https://meetgreatersouth.tw/

徵展起跑!新創享專屬免費方案
早鳥優惠至6/8,報名收件至7/3  >> 瞭解詳情

關鍵字: #創新創業

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓