Google 推出 Gemini 3.1 Flash‑Lite:比 2.5 更快更便宜的「高頻 AI 工具人」
Google 推出 Gemini 3.1 Flash‑Lite:比 2.5 更快更便宜的「高頻 AI 工具人」

重點一:Google 於 3 月 3 日推出 Gemini 3.1 Flash-Lite,定價每百萬輸入 token 0.25 美元、輸出 1.5 美元,是 Gemini 3 系列中成本最低的模型。

重點二:新模型導入「思考等級」功能,開發者可在最低、低、中、高四個推理深度間切換,兼顧成本與準確度,適用於翻譯、內容審核、介面生成等高頻工作流。

重點三:儘管定位輕量,Gemini 3.1 Flash-Lite 在 GPQA Diamond 學術推理基準測試得分達 86.9%,Arena.ai 排行榜 Elo 分數為 1432,超越前幾代較大型的 Gemini 模型。

Google 於 2026 年 3 月 3 日正式推出 Gemini 3.1 Flash-Lite,定位為 Gemini 3 家族中成本最低、延遲最短的模型。

定價方面,每百萬輸入 token 收費 0.25 美元(約合新台幣 7.86 元),輸出 token 則為 1.5 美元(約合新台幣 47.2 元)。相較同月稍早上市的 Gemini 3 Flash(輸入 0.5 美元、輸出 3 美元),Flash-Lite 的整體費用約為後者的一半。

性能指標同樣搶眼。根據 Artificial Analysis 的基準測試,Gemini 3.1 Flash-Lite 的首次回應延遲(Time to First Token)較 Gemini 2.5 Flash 快 2.5 倍,輸出速率提升 45%,實測吐字速度達每秒 388.8 個 token。

AI模型速度與價格比較:Gemini 3.1 Flash‑Lite vs 同級對手」
Gemini 3.1 Flash‑Lite 是目前這個價位帶裡「又快又便宜」的高 CP 值選項,而不是只在單一側(速度或價格)取勝。
圖/ Google

Google 將其定義為「規模化智慧」的主力引擎,尤其適合需要即時回應的高頻應用場景,如客服、內容審核、使用者介面生成,以及大量翻譯任務。

目前 Gemini 3.1 Flash-Lite 已在 Google AI Studio 的 Gemini API 以及企業版 Vertex AI 上以「公開預覽」形式開放,API 端點名稱為 gemini-3.1-flash-lite-preview,支援文字、圖片、影片等多模態輸入,上下文視窗為 128K token。

「思考等級」打破輕量模型的天花板

Gemini 3.1 Flash-Lite 最受矚目的架構更新,是新增的「思考等級」(Thinking Levels)功能。開發者可以針對每一次請求,在「最低(Minimal)」、「低(Low)」、「中(Medium)」、「高(High)」四個推理深度之間動態調整。

這意味著:處理簡單的分類或翻譯任務時,選擇最低推理深度可大幅壓低延遲與成本;面對需要多步推理的 UI 生成或系統模擬時,則提升推理等級換取精確度。 對於同時運行數百萬次查詢的 SaaS 企業而言,這種彈性尤為關鍵。

早期測試用戶回報,Flash-Lite 在意圖路由任務上的準確率達 94%。企業級應用如電商商品介面自動填充,也能在毫秒級延遲下完成大批次操作。Google 強調,Flash-Lite 並非「廉價版」,而是針對量產場景優化的「平衡版」。

Gemini 3.1 Flash‑Lite 能力評測:多項基準測試成績與輸出速度一覽表
Gemini 3.1 Flash‑Lite 雖然是「便宜輕量版」,但在多科目、多模態的正式考試裡,分數已經站上上一代中大型模型的水準,而且維持很快的輸出速度。
圖/ Google

基準測試:輕量不等於低能

儘管命名為 Flash「Lite」,Gemini 3.1 Flash-Lite 的學術推理成績並不遜色。

在 GPQA Diamond(設計用於測試專家級推理能力的基準)上,該模型得分達 86.9%;多模態理解基準 MMMU Pro 則為 76.8%。Arena.ai 排行榜的 Elo 分數為 1432,在同價位模型中排名前列,甚至在部分指標上超越 Gemini 前幾代的較大型模型。

相較於同月發布的 Gemini 3.1 Pro(GPQA Diamond 達 94.3%,定位為高算力推理模型),Flash-Lite 確實在頂端推理能力上有所取捨;但對於絕大多數高頻、低複雜度的生產工作流而言,這樣的性價比已屬罕見。

VentureBeat 的評測認為,Gemini 3.1 系列的策略意圖清晰:由 Pro 負責「動腦」,由 Flash-Lite 負責「動手」,共同覆蓋企業 AI 基礎設施的全層需求。

延伸閱讀:Meta眼鏡洩個資?一句「Hey Meta」疑讓資料送肯亞:性影像、銀行卡號,全變AI訓練素材?

資料來源:Google Blog

本文初稿為 AI 編撰,整理.編輯/李先泰

關鍵字: #Google #Gemini

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓