Google正式在11月19日凌晨推出Gemini 3,而且罕見地全線產品導入,不只可體驗到採用最新模型的聊天機器人Gemini 3 Pro,包含AI Mode(搜尋)、Gemini App、開發者和企業端,都將導入Gemini 3,用戶打開Google AI Studio就能開始免費體驗,
而Gemini 3有多強?
Google DeepMind執行長Demis Hassabis與Google DeepMind技術長暨Google首席AI架構師Koray Kavukcuoglu是這樣說:「我們在通用人工智慧(AGI)的道路上,又邁出重大一步。」
以下為《數位時代》整理Google提供的資訊,搶先理解「Gemini 3時代」。
一句話講完:Gemini 3 Pro輾壓Gemini 2.5 Pro
根據Google的說法,Gemini 3 Pro在所有的AI基準測試中,均顯著超越Gemini 2.5 Pro。
它以1501分成績高居LMArena排行榜首位,在無使用任何工具的情況下,展現博士級(PhD Level)推理能力,於「人類終極考試」獲得準確率37.5%頂尖成績。過去,Gemini 2.5 Pro的成績為21.6%。
「人類終極考試」是集結全球專家設計的一道測驗,被各家語言模型開發商視為檢驗AI模型性能的指標之一。
此外,Google強調Gemini 3 Pro回應簡潔、直切重點,摒棄AI常見的陳腔濫調與恭維,「這款AI如同一位真正的思考夥伴,透過多種方式幫助使用者理解資訊與表達想法。」在展示的過程中,Gemini 3 Pro甚至可以因應論文內容,生成3D視覺化的圖形,協助使用者多了解所需的內容。
Gemini 3 Deep Think(深度思考模式):很猛,但再等等
同時Google也推出了Gemini 3 Deep Think,將優先開放測試人員使用後,才會提供給Google AI Ultra的訂閱用戶使用。
在上述的「人類終極考試」中,Gemini 3 Deep Think獲得了41%的準確率,超越Gemini 3 Pro的優異表現。
所以Gemini 3可以做什麼?探索學習、打造一切、規劃萬物
在Google提供的資料中,也特別提到Gemini 3可以做什麼?如果你平常就是AI使用者,那幾乎沒有太大的差別,就是學習、打造(build),以及規劃(Plan)──只是Gemini 3在更層面都更加強悍。
給所有人:Gemini 3可以探索學習
舉例來說,任何學習者只需輸入學術論文、長篇教學影片或講義,Gemini 3便能生成互動式記憶卡、視覺化圖表等輔助工具,甚至能分析匹克球比賽影片,指出動作修正要點並制定全面提升的訓練計畫。
而AI Mode也將全面採用Gemini 3技術。同樣用例子來看最簡單,未來如果使用者在研究房屋貸款,使用AI Mode它能直接生成專屬的貸款計算器,讓你即時比較方案。
註:AI Mode的Gemini 3功能將在美國先上線,其他地區尚未公布開放時程。
給開發者(包含Vibe Coding):Gemini 3是表現更好的工程師夥伴
延續Gemini 2.5 Pro的能力,Gemini 3也能處理複雜的提示與指令,在衡量工程師代理人能力的SWE-bench Verified基準測試中,Gemini 3以76.2%的表現大幅超越Gemini 2.5 Pro版本。
且現在已經可以在Google AI Studio、Vertex AI、Gemini CLI以及Google全新的智能代理開發平台Google Antigravity中使用Gemini 3進行開發。
此外,該技術已整合至Cursor、GitHub、JetBrains、Manus、Replit等第三方平台。
Gemini 3同時也是更好的規劃者
Gemini 3在Vending-Bench 2的評測中位居榜首,該評測透過模擬販賣機營運來測試長期規劃能力。Gemini 3 Pro能夠在整年模擬營運中保持穩定的工具使用與決策品質,在不偏離任務的前提下創造更高收益。
這意味著Gemini 3能更有效地協助使用者處理日常生活事務。透過結合更深層的推理能力與改進後更穩定的工具應用,Gemini 3能在使用者的控制與指引下,全程代為執行更複雜、更多步驟工作流程。例如分類、整理Gmail收件箱,或規劃旅行行程等。
責任編輯:李先泰
