AI殺不死Google,卻讓Google更強大了!
04

Gemini 3重磅登場!Google罕見全線產品導入:強度碾壓2.5 Pro,使用起來差在哪?

Google正式在11月19日凌晨推出Gemini 3,而且罕見地全線產品導入。

(2025/11/19/1430,更新第三方評測數據)

Google正式在11月19日凌晨推出Gemini 3,而且罕見地全線產品導入,不只可體驗到採用最新模型的聊天機器人Gemini 3 Pro,包含AI Mode(搜尋)、Gemini App、開發者和企業端,都將導入Gemini 3,用戶打開Google AI Studio就能開始免費體驗,

而Gemini 3有多強?

Google DeepMind執行長Demis Hassabis與Google DeepMind技術長暨Google首席AI架構師Koray Kavukcuoglu是這樣說:「我們在通用人工智慧(AGI)的道路上,又邁出重大一步。」

而由Artificial Analysis釋出的 AA-Omniscience(跨領域知識與幻覺可靠性)最新評測顯示,Google 的 Gemini 3 Pro 在整體指標中登頂,尤其在正確率上顯著領先,比次高的 Grok 4 高出 14 分,反映其在跨領域知識題的「答對比例」有重大提升。

評測團隊指出,AA-Omniscience 的設計不僅檢驗模型的知識覆蓋與正確性,也觀察模型在面對知識缺口時是否具備適當的「拒答」能力,藉此評估可靠性。此次結果顯示,Gemini 3 Pro 在「知道的題目」上表現更穩、更準,成為新一代通用知識型模型的領先者。

以下為《數位時代》整理Google提供的資訊,搶先理解「Gemini 3時代」。

一句話講完:Gemini 3 Pro輾壓Gemini 2.5 Pro

根據Google的說法,Gemini 3 Pro在所有的AI基準測試中,均顯著超越Gemini 2.5 Pro。

gemini_3_lm_arena_leaderboard (1).jpg
Gemini 3 Pro在所有的AI基準測試中,均顯著超越Gemini 2.5 Pro。
圖/ Google

它以1501分成績高居LMArena排行榜首位,在無使用任何工具的情況下,展現博士級(PhD Level)推理能力,於「人類終極考試」獲得準確率37.5%頂尖成績。過去,Gemini 2.5 Pro的成績為21.6%

「人類終極考試」是集結全球專家設計的一道測驗,被各家語言模型開發商視為檢驗AI模型性能的指標之一。

此外,Google強調Gemini 3 Pro回應簡潔、直切重點,摒棄AI常見的陳腔濫調與恭維,「這款AI如同一位真正的思考夥伴,透過多種方式幫助使用者理解資訊與表達想法。」在展示的過程中,Gemini 3 Pro甚至可以因應論文內容,生成3D視覺化的圖形,協助使用者多了解所需的內容。

Gemini 3 Deep Think(深度思考模式):很猛,但再等等

同時Google也推出了Gemini 3 Deep Think,將優先開放測試人員使用後,才會提供給Google AI Ultra的訂閱用戶使用。

在上述的「人類終極考試」中,Gemini 3 Deep Think獲得了41%的準確率,超越Gemini 3 Pro的優異表現。

所以Gemini 3可以做什麼?探索學習、打造一切、規劃萬物

在Google提供的資料中,也特別提到Gemini 3可以做什麼?如果你平常就是AI使用者,那幾乎沒有太大的差別,就是學習、打造(build),以及規劃(Plan)──只是Gemini 3在更層面都更加強悍。

給所有人:Gemini 3可以探索學習

舉例來說,任何學習者只需輸入學術論文、長篇教學影片或講義,Gemini 3便能生成互動式記憶卡、視覺化圖表等輔助工具,甚至能分析匹克球比賽影片,指出動作修正要點並制定全面提升的訓練計畫。

而AI Mode也將全面採用Gemini 3技術。同樣用例子來看最簡單,未來如果使用者在研究房屋貸款,使用AI Mode它能直接生成專屬的貸款計算器,讓你即時比較方案。

註:AI Mode的Gemini 3功能將在美國先上線,其他地區尚未公布開放時程。

給開發者(包含Vibe Coding):Gemini 3是表現更好的工程師夥伴

延續Gemini 2.5 Pro的能力,Gemini 3也能處理複雜的提示與指令,在衡量工程師代理人能力的SWE-bench Verified基準測試中,Gemini 3以76.2%的表現大幅超越Gemini 2.5 Pro版本。

且現在已經可以在Google AI Studio、Vertex AI、Gemini CLI以及Google全新的智能代理開發平台Google Antigravity中使用Gemini 3進行開發。

此外,該技術已整合至Cursor、GitHub、JetBrains、Manus、Replit等第三方平台。

Gemini 3同時也是更好的規劃者

Gemini 3在Vending-Bench 2的評測中位居榜首,該評測透過模擬販賣機營運來測試長期規劃能力。Gemini 3 Pro能夠在整年模擬營運中保持穩定的工具使用與決策品質,在不偏離任務的前提下創造更高收益。

這意味著Gemini 3能更有效地協助使用者處理日常生活事務。透過結合更深層的推理能力與改進後更穩定的工具應用,Gemini 3能在使用者的控制與指引下,全程代為執行更複雜、更多步驟工作流程。例如分類、整理Gmail收件箱,或規劃旅行行程等。

延伸閱讀:專訪|華碩奪OLED顯示器市佔第一!從可攜式、電競到眼鏡,怎麼用20年打贏三星跟LG?

責任編輯:李先泰

關鍵字: #Google #Gemini

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓