OpenAI推出輕量版GPT-4o mini！可完美替代GPT-3.5？看懂為何它是小新創「CP值首選」|數位時代 BusinessNext

OpenAI於7月18日推出「GPT-4o mini」，瞄準「小而巧」的人工智慧 (AI) 模型競爭。據了解，這款最新模型「功能最強、成本較低」，OpenAI 計畫之後整合圖片、影片、音訊功能到這個最新模型中。

OpenAI 表示，GPT-4o mini 從7月18日起向 ChatGPT 的免費用戶、ChatGPT Plus 和團隊訂閱用戶開放，並將在下周向 ChatGPT 企業用戶開放。 GPT-4o mini 將取代 ChatGPT 中的舊模型 GPT-3.5 Turbo。

據了解，GPT-4o mini 的成本為每百萬輸入 Token 為 0.15 美元、每百萬輸出 Token 為 0.6 美元，比 GPT-3.5 Turbo 便宜超過 60%。

不只如此，新模型目前在聊天偏好上表現優於 GPT-4 模型，並在大規模多任務語言理解（MMLU，Massive Multitask Language Understanding）測驗中獲得了 82% 的得分。

MMLU是一種用於評估語言模型能力的文本智慧和推理基準，更高的MMLU得分表明它可以在各種領域中更好的理解和使用語言，增強其在現實世界中的應用。

根據 OpenAI 的數據，GPT-4o mini 模型的得分為 82%，比另外兩款低成本競品更高，Google(GOOGL-US) 的 Gemini Flash 得分為 77.9%，Anthropic 的 Claude Haiku 得分為 73.8%。

而在更大模型中，GPT-3.5 在這項測試中的得分為 70%，GPT-4o 得分為 88.7%，而 Google 聲稱其 Gemini Ultra 取得了有史以來最高的 90% 得分。

專家分析指出，較小的語言模型需要較少的運算能力來運行，使其成為資源有限的公司部署生成式 AI 的更實惠的選擇。

此外，這個新的輕量化模型還將在 API 中支援文字和視覺功能，OpenAI 表示該模型很快就會處理所有多模態輸入和輸出，例如視訊和音訊。

而且擁有這些功能後，這可能會像更強大的虛擬助理一樣，能夠理解你的旅行行程並提出建議，不過目前該模型只能主要用於簡單任務。

根據外媒報導，OpenAI 雖然在生成式 AI 市場仍占據領頭羊地位，但面臨的競爭壓力已經越來越大，OpenAI 還需要找到賺錢的方式，因其在處理器和基礎設施上花費了大量資金來建立和訓練其模型。

然而，不少公司無法負擔大型、更昂貴的模型，因此輕量化且廉價的模型可能更受歡迎。

OpenAI 的 API 產品負責人 Olivier Godement 受訪時解釋為何未能更早推出「小而巧」的 AI 模型，他說這純粹是「優先順序」的問題，因為 OpenAI 專注於創建更大、更好的模型，如 GPT-4，這需要大量的人力和運算資源。

隨著時間的推移，OpenAI 注意到開發人員越來越渴望使用較小的模型，因此決定現在是投入資源開發 GPT-4o Mini 的時機。

延伸閱讀：白話科技｜AI Agent是什麼？它為何是邁向AI界聖杯的關鍵一步？

本文授權轉載自：鉅亨網

對已經成熟發展的企業來說，最大的挑戰不是如何創新，而是經驗無法有效傳承，而生成式 AI 的價值正在於此，它讓分散的知識從「共同保存」走向「即時運用」，使組織得以在既有經驗之上，持續累積能力並向上成長。

由旭瑞文化傳媒成立、全台最大直播平台浪LIVE，正是這種轉變的最佳寫照。「我們其實一直都有在整理內部的知識、技術文件和作業流程規範，但做法比較像是集中在倉庫裡，雖然找得到，卻不一定用得快。」旭瑞文化傳媒技術研發中心技術總監黎欣捷（James）形容。

為此，浪LIVE 攜手網創資訊導入 AI 知識管理系統 NAVI，打造出一顆可以分析與調用歷史資料並產製新內容的「企業智慧大腦」，讓經驗不再只是被保存，而能實際參與日常營運流程。網創資訊總經理吳炳鈞進一步說明，這是因為 NAVI 將浪LIVE既有資料整理成可被運用的知識基礎，並在此基礎上生成內容，故能真正融入浪LIVE使用場景，提升文章產製與活動規劃的效率。

用 AI 提速，回應高頻、快節奏的營運需求

作為直播產業的領導平台，浪LIVE 不僅市占率超過 50%，每月活躍用戶數更高達 40-50 萬人。能夠寫下高黏著度、高互動率的成績，除了堅持以才藝直播為主軸、在市場上做出差異化特色，快速更新的內容與密集的行銷活動，同樣是浪LIVE 維繫用戶黏著度的關鍵。

黎欣捷表示，浪LIVE 每日都會更新社群貼文與文章內容、每個月平均規劃約 20 至 25 檔活動，不僅內容產出量龐大，對速度的要求也極高。編輯團隊在完成採訪後，必須在最短時間內產出文章，且要符合品牌的風格和版型，而營運團隊不僅要不斷發想新的玩法，還得預先估算不同設計下的投資報酬率、參與人數等機率，以確保活動能兼顧創意與成效。

這種高頻的營運節奏不僅極具挑戰性，還容易使團隊感到疲憊。因此，浪LIVE 開始思考如何利用 AI 來提升文章產出與活動企劃的效率，而 NAVI 正是思考後的最佳解答。

應用場景1：文章產製，不再從零開始

吳炳鈞進一步說明，網創資訊如何協助浪LIVE 將 NAVI 應用於文章產製與活動企劃。

先就文章產製來看，網創資訊將浪LIVE 過往累積的大量文章匯入 NAVI，由系統學習品牌文章的語氣與編排方式，及不同編輯的寫作風格並加以分類。之後，編輯只要提供採訪逐字稿或相關素材，並指定想要的文章風格，NAVI 便可依此生成初稿，再由編輯進行調整與潤飾，大幅加快整體產出速度，也讓編輯可以將更多心力投入內容品質的把關與主題發掘，用快速更新而主題有趣的文章，吸引會員持續留在平台。

吳炳鈞強調，NAVI 不是憑空寫文章，而是根據企業過去累積的內容與規範來生成，這樣的產出結果，才會更貼近原本的品牌風格與實際需求。更重要的是，網創資訊還能根據客戶使用情境進行客製化調整。例如，NAVI 可以整合圖片和文字，生成一篇圖文並茂的文章，並同步輸出對應的 HTML 程式碼，浪LIVE 編輯只需貼至後台系統，就能完成上稿作業，不必再花費大量時間去調整版面配置。

應用場景2：活動規劃，從歷史經驗找出新玩法

再就活動規劃來看，網創資訊同樣先將浪LIVE 的歷史活動範本、禮物清單與獎勵機制導入 NAVI，由系統學習營運團隊在發想活動時的思維脈絡，之後，團隊成員只要輸入關鍵字，NAVI 就能建議相應的活動方式與獎勵組合，作為活動規劃時的參考。

黎欣捷認為，NAVI 就像一位資深顧問，不僅提供更多元的視角與玩法建議，縮短活動規劃所需的時間和心力，也能即時調閱過往經驗，協助團隊跳脫個人思考盲點，避免重複規劃過去已經做過的活動內容。

吳炳鈞進一步以禮物清單為例，說明 NAVI 帶來的效益。浪LIVE每一檔活動都需要重新設計禮物或做不同的組合搭配，因此資料庫已累積上百種不同類型的禮物，這使得團隊成員在規劃活動時，常常要花很多時間去發想新禮物或搜尋資料。而在導入NAVI後，系統可以根據歷史資料提供合適的禮物搭配建議，協助團隊在規劃新活動時，更有效率地運用既有資源。

不只生成內容：NAVI 三大特色，讓 AI 真正嵌入企業流程

在資料管理與內容生成外，網創資訊也從企業管理需求出發，規劃出以下 3 大系統特色，使 NAVI 得以真正融入企業的營運流程中。

第一，NAVI 支援至少 20種大型語言模型，能因應不同使用需求，處理文字、圖片、音訊和影片等多種形式的內容。第二，系統可部署於私有雲或地端環境，讓資料能留在企業內部，降低被外部 AI 模型使用的疑慮。第三，整合 AD 身份驗證與授權機制，可依部門和角色別去設定資料存取權限，確保 AI 在回應問題或產生內容時，只會引用該使用者可存取的資料範圍，避免誤用或資料外洩的風險。吳炳鈞補充，由於系統可進行部門切割，也能進一步統計各單位的使用量，方便企業進行內部成本分攤與管理。

「企業需要的是能嵌入流程的 AI，而不是只會回答問題的工具。」吳炳鈞指出，因此 NAVI 一開始就定位在企業知識管理系統，從而發展上述系統設計。近年來，因應 AI Agent 趨勢，網創資訊亦將相關概念融入 NAVI，使系統具備更高的主動性，能依任務需求串接不同資料庫與內部系統，協助使用者完成特定工作流程。

未來，網創資訊將持續與浪LIVE 深化合作，逐步導入更多內容至系統中、拓展更多應用場景。也期待在與客戶合作的過程中，共同發掘更多具體的應用靈感，並視需求開發對應功能，持續放大知識與經驗的價值，讓技術不只停留在工具層次，而能真正轉化為企業成長的動能。