重點一:Google 推出 Gemini 3 Flash,速度更快、成本更低,整體能力超越 2.5 Pro。
重點二:API 定價為每百萬輸入代幣 0.50 美元、輸出代幣 3 美元,並提供快取與批次處理以降低成本。
重點三:即日起於 Gemini API 與 Vertex AI 上線,強化視覺/空間推理與程式碼執行。
Google 推出新一代推理模型 Gemini 3 Flash,主打在「速度、成本與智能」三者間取得最佳平衡,在多項基準測試上超越前代 2.5 Pro,並以更高的速率限制與更低價格提供生產級能力。
官方指出,Gemini 3 Flash 在不犧牲推理能力的前提下,提供「Flash‑level latency(快閃級延遲)」與更高效率,適合日常快速問答,也可處理更複雜的多模態分析與工具使用場景。
Google 亦在模型選擇器提供「Fast(快速)」與「Thinking(思考)」兩種 3 Flash 選項,分別對應即時簡答與較複雜問題;3 Pro(專業)則主攻進階數學與程式需求。
Gemini 3 Flash 目前已在 Google AI Studio、Google Antigravity(智慧代理開發平台)、Gemini CLI、Android Studio,以及企業用的 Vertex AI 全面上線,為開發者與企業提供更可擴的推理服務。
3 Flash 比 2.5 Pro 快 3 倍
Gemini 3 Flash 在高階推理與知識基準上展現前沿表現:GPQA Diamond(高難度研究生等級問答)達 90.4%,Humanity’s Last Exam(不使用外部工具)為 33.7%,在同級模型中具競爭力。
官方並指出,3 Flash 相較 2.5 Pro「在多項基準更優且速度更快」,且即便在最低「思考層級」(thinking level)設定下,仍常優於前代在「高思考層級」的表現。
第三方 Artificial Analysis 的測試也顯示,3 Flash 取得 Intelligence Index(智能指數)71 分,比 Gemini 3 Pro Preview(Gemini 3 專業版預覽)僅低 2 分,但價格約為其一半,成為同價位段最具智能與性價比的模型;相較 Gemini 2.5 Flash(2025 年 9 月版)亦提升 13 分。
Gemini 3 Flash 的 API 定價:每百萬輸入代幣 0.50 美元(約新台幣 15.8 元),每百萬輸出代幣 3 美元(約新台幣 94.6 元),音訊輸入為每百萬代幣 1 美元(約新台幣 31.61 元)。
整體推理與知識表現顯著進步:在人類終極考試 Humanity’s Last Exam 以 35% 位居第二;在 MMLU‑Pro(高難度學科理解)達 89% 排名第三、GPQA Diamond(研究級問答)達 90% 同列第三,僅次於 Gemini 3 Pro Preview 與 GPT‑5.2 xhigh(高階)。
應用與生態:遊戲、法務、偵測全面落地
Google 表示,3 Flash 已整合至多項產品與早期客戶案例:在遊戲開發中,Astrocade(遊戲創作引擎)可從單一提示生成完整策劃與可執行程式碼,快速把概念變成可玩的作品;Latitude(遊戲引擎)用 3 Flash 生成更智慧的角色與更逼真世界,且在複雜任務上以更低成本達到先前需「專業級」模型(如 Sonnet 4.5)才可能的品質。
在深偽(Deepfake)偵測領域,Resemble AI 以 3 Flash 進行近即時多模態鑑識,將複雜取證輸出轉換為易懂解釋,並稱其相較 2.5 Pro 在多模態分析上快 4 倍;在法務文件分析方面,Harvey(法律 AI)指出 3 Flash 對其 BigLaw Bench 較 2.5 Flash 有超過 7% 的推理品質提升,且以低延遲支撐高量、嚴謹的合約條文抽取與交叉引用任務。
整體來看,3 Flash 於近即時推理、影像/影片分析、代理式程式開發與法務等場景,均展現兼具精確與效率的實務價值。
資料來源:Google、TechChurch
本文初稿為AI編撰,整理.編輯/ 李先泰
