Google Gemini 3.1 Pro 登場:推理力大躍進,直衝「AI 工作流引擎」時代
Google Gemini 3.1 Pro 登場:推理力大躍進,直衝「AI 工作流引擎」時代

Google(GOOGL-US) 周四 (19 日) 透過官方部落格,突然宣布推出其最新的人工智慧核心模型 Gemini 3.1 Pro。這款模型被定位為處理最複雜任務的「智慧升級版」,象徵著 Google 在 AI 核心推理能力上取得了重大突破。

隨著 Gemini 3.1 Pro 的發布,Google 旨在將更強大的智慧應用於日常開發與消費級產品中,幫助使用者解決那些「簡單回答已不足夠」的艱難挑戰。

核心推理能力的飛躍:基準測試表現驚人

Gemini 3.1 Pro 最受矚目的改進在於其邏輯推理能力的提升。根據 Google 發布的數據,該模型在評估邏輯模式解決能力的關鍵基準測試 ARC-AGI-2 中,獲得了 77.1% 的驗證分數。與前代 Gemini 3 Pro 的 31.1% 相比,其推理性能提升超過兩倍,也遠高於 Gemini 3 Deep Think 的 45.1%。

在與競爭對手的橫向對比中,Gemini 3.1 Pro 在多項指標上領先於 Anthropic 的 Claude Opus 4.6 以及 OpenAI 的 GPT-5.2。例如:

Humanity"s Last Exam(人類最後的考驗):Gemini 3.1 Pro 分數為 44.4%,優於 Claude Opus 4.6 的 40.0% 與 GPT-5.2 的 34.5%。

MMLU(大規模多任務語言理解):達到 92.6%,領先競爭對手。

GPQA Diamond:得分 94.3%,展現出極高水平的專業知識理解。

儘管如此,報導也指出在特定領域中,競爭對手仍保有優勢。例如,Claude Opus 4.6 在部分 SWE-Bench 驗證中仍位居榜首,而 OpenAI 的 GPT-5.3-Codex 則在特定的編程測試中表現較佳。

Gemini 3.1 Pro 的「動腦能力」整體往上了一級
Google 最新的 Gemini 3.1 Pro 在多項高難度智力與程式任務基準測試中,整體表現明顯超越前一代 3 Pro,並與其他旗艦模型正面對比。在 ARC‑AGI‑2 這類考驗抽象推理的測驗上,成績一口氣拉到 77.1%;在寫程式與修 bug 的 SWE‑Bench、LiveCodeBench、SciCode 等實戰任務中,也有明顯提升,顯示它不只會「寫答案」,更能在真實情境裡拆解問題、完成工作。
圖/ Google

多樣化的實務應用

Google 強調,Gemini 3.1 Pro 不僅是數據上的進步,更在於能將高級推理轉化為實用的功能。

  1. 純程式碼動畫生成:該模型能直接根據文字指令生成網頁適用的 SVG 動畫。由於這些動畫是基於純程式碼而非像素構建,因此在任何比例下都能保持清晰,且檔案體積遠小於傳統影片。

  2. 複雜系統整合:Gemini 3.1 Pro 展現了連接複雜 API 與使用者介面的能力。在官方展示中,它成功構建了一個即時航太儀表板,利用公開遙測數據視覺化國際太空站 (ISS) 的軌道運行。

  3. 沉浸式互動設計:該模型能編寫複雜的 3D 動態視覺效果 (如鳥群飛翔模擬),並結合手部追蹤功能,讓使用者能操控視覺效果,甚至產生隨動作變化的生成式配樂。

  4. 創意編碼與文學轉化:Gemini 3.1 Pro 展現了理解文學主題並將其轉化為功能性程式碼的能力。例如,它能根據艾蜜莉 · 勃朗特的經典小說《咆哮山莊》的大氣色調,設計出富有現代感的個人作品集網站,而非僅僅是摘要文字。

全方位布局:如何體驗 Gemini 3.1 Pro

Google 目前已在多個平台上陸續推送 Gemini 3.1 Pro,涵蓋開發者、企業及一般消費者:

一般消費者:可透過 Gemini App 使用。訂閱 Google AI Pro 與 Ultra 方案的用戶將享有更高的使用限制。此外,NotebookLM 也已開放 Pro 與 Ultra 用戶專屬體驗。

開發者與企業:可透過 Gemini API (Google AI Studio)、Vertex AI、Gemini Enterprise 以及 Google 的代理式開發平台 Antigravity 進行訪問。

開發工具整合:該模型也將整合進 Gemini CLI、Android Studio,甚至延伸至微軟的服務,如 GitHub Copilot 和 Visual Studio Code。

AI 賽賽升溫:Google 的市場防禦與進攻

這次發布正值 AI 市場競爭最激烈的時刻。市場分析指出,Gemini 3 Pro 在去年 11 月發布後曾引發 OpenAI 的「紅色警報 (code red)」,並導致部分用戶從 ChatGPT 流向 Gemini。Google 執行長 Sundar Pichai 在最近的財報中提到,Gemini App 的月活躍用戶已超過 7.5 億,且其模型透過 API 每分鐘處理超過 100 億個 token。

Gemini 3.1 Pro 的推出被視為 Google 快速迭代策略的一部分。Google 表示,目前發布的是預覽版,目的是為了在正式全面開放 (GA) 之前,驗證更新並進一步推進代理式工作流 (agentic workflows) 等雄心勃勃的研發領域。

Karpathy:應用商店模式正在過時

Gemini 3.1 Pro 發布之際,OpenAI 共同創辦人 Andrej Karpathy 提出「應用商店模式正在過時」的觀點,他指出,隨著如 Gemini 3.1 Pro 等具備強大推理能力的模型出現,模型已能從單純回答問題延伸到完成一整套專業工作流。

Karpathy 預見一個由「AI 原生傳感器」和「執行器」構成的時代,屆時將由 LLM 負責編排、即興生成高度定制的應用。這種「即時生成、用完即棄」或「個人專屬」的軟體邏輯,將從根本上取代傳統應用商店的發布與下載機制。

總結來說,Karpathy 認為,AI 讓軟體開發的門檻與成本降到極低,未來的趨勢是 AI 根據用戶需求直接生成解決方案,而非用戶去適配應用商店中既有的 App。

本文授權轉載自:鉅亨網

延伸閱讀:NotebookLM簡報支援修改功能了,還能匯出PPT格式!如何使用?教學一次看

往下滑看下一篇文章
代理式商務來襲:萬事達卡與NCCC攜手產業打造信任新基礎
代理式商務來襲:萬事達卡與NCCC攜手產業打造信任新基礎

隨著代理式 AI(AI Agent)的快速普及,其在商務交易中的應用也從智慧搜尋、商品比價一路延伸至自主下單,逐步形塑出全新的代理式商務(Agentic Commerce)模式。為因應此一趨勢,萬事達卡攜手聯合信用卡處理中心(NCCC)於 15 日舉辦「 AI 時代支付安全與數據信任高峰會」,匯聚產官學界專家共同交流,深入探討代理式商務下的支付授權與驗證機制,以及 AI 時代金融監理的演進與詐欺防治重點。

萬事達卡台灣區董事總經理陳懿文表示,無論交易是由人或代理式 AI 發起,都應該在安全可信的環境中完成,萬事達卡將持續強化支付安全的把關能力,不僅著眼於風險控管,更期望將「信任」轉化為未來創新的基礎與成長動能。聯合信用卡處理中心董事長桂先農則認為,面對 AI 浪潮,支付安全已不再只是技術問題,更要在消費體驗、數據運用與隱私保護之間取得動態平衡。金融監督管理委員會主任委員彭金隆表示,金管會未來將持續秉持安全與發展並進的原則,致力於打造可信賴、穩健且具有包容性的環境,加速金融 AI 應用的發展。

Mastercard-02.jpg
金融監督管理委員會主任委員彭金隆特別出席,表示金管會核心理念為「負責任創新」,並於2025 年成立『金融科技產業聯盟』,期待結合金融周邊單位與金融機構的力量,打造可信任及穩健的AI 金融應用環境。
圖/ 數位時代
Mastercard-03.jpg
萬事達卡台灣區董事總經理陳懿文(左)攜手聯合信用卡處理中心董事長桂先農(右)致詞不約而同提到:面對 AI 浪潮,支付安全將會是如何在消費體驗、數據運用與隱私保護之間取得動態平衡的治理課題。
圖/ 數位時代

AI Agent 重新定義消費旅程,萬事達卡提 4 大要素保障支付安全

Google Cloud 台灣技術總經理林書平認為,代理式商務正在重新定義消費旅程,而 Universal Commerce Protocol(UCP)則是支撐這場變革的關鍵。他表示,UCP 就好像電商界的 Type-C 接口,可以串聯不同代理式 AI 與電商平台後台系統,讓代理式 AI 可以根據消費者需求,自主完成商品搜尋與推薦、比價到下單的交易流程,打造更即時、更個人化的消費體驗。

在此情況下,支付不再只是交易流程中的最後一步,而是串聯個人化服務、授權機制、風險控管與信任的核心環節。萬事達卡數據與顧問服務部資深副總裁戴輝瑾指出,要確保代理式商務下的交易安全,必須具備 4 個關鍵要素,包括可驗證代理式 AI 身份、明確的使用者授權、確保代理式 AI 執行的任務沒有超出授權範圍,以及在發生爭議時,能透過公開透明且可追溯的機制進行處理,確保各方權益。

此外,他也強調,風險管理不應侷限於付款當下,需從交易前、交易中、交易後到持續性的監控,建立端到端的治理架構。為此,萬事達卡推出多元解決方案強化整體防護能力,包括以 Identity Solution 強化數位身分驗證、以 Decision Intelligence Pro 提升即時風險判斷能力、透過 Ethoca 優化爭議處理流程,以及藉由 Recorded Future 提供即時網路威脅情報,全面覆蓋交易生命週期,打造更完整的支付安全生態系。

AI 監理邁入新階段,以信任為核心的監管新框架

從監理角度來看,AI 所帶來的變革也同步改寫治理思維。金管會銀行局局長童政彰指出,監理機關不僅要加強國際合作,更應深化與金融業及科技業的對話,建立更開放且具前瞻性的監理模式。進一步針對代理式商務來看,政大金融AI創新中心主任王儷玲認為,金融監理重心應由模型與資料管理,轉向代理式 AI 安全,尤其當 AI 可以代理消費者進行支付時,如何確保代理式 AI 在授權範圍內執行交易,將成為未來的監理重點。

在國際監理趨勢方面,萬事達卡數據與顧問服務部副總裁 Audrey Wong 分析亞太與全球支付生態並指出,AI 時代的監管核心已轉向「以信任為基礎」,金融業在應用 AI 時,必須具備可解釋性、可問責性與可稽核性,確保決策透明且可追溯。同時,隨著詐騙與洗錢行為跨境化,監理機制也應向外延伸,確保跨境一致性,並透過如 ISO 20022 等標準強化資料透明與治理能力。

回到金融機構實務面,國泰世華銀行數據長梁明喬表示,代理式 AI 將對既有支付與風控機制帶來結構性改變,以信用卡支付為例,過往的驗證重點在於是否為本人,但在代理式 AI 情境下,則轉變為驗證 AI 的身份、授權來源與行為意圖。未來,隨著代理式 AI 的普及發展,授權與權限管理將變得更加重要。

Mastercard-04.jpg
關鍵對談以「AI 時代的資安監管趨勢與企業應對策略 」為題,左起邀請:數位時代總編輯 王志仁主持及重磅與談人國立政治大學金融 AI 創新中心主任 王儷玲、國泰世華銀行數據長 梁明喬及萬事達卡數據與顧問服務部副總裁 Audrey Wong與會。
圖/ 數位時代

AI 詐騙升級,聯防機制成新關鍵

最後,本場研討會亦聚焦討論 AI 造成詐欺風險升級的議題。台灣大哥大資訊長蔡祈岩觀察,詐騙已從單一管道演變為跨平台、跨場景的複合型攻擊,尤其是假冒「代理式 AI 」的詐騙手法,透過對話引導消費者提供個資與支付資訊,正成為新興且高風險的威脅來源。

萬事達卡 Franchise Innovation 副總裁Dennis Koh 進一步歸納出 3 大詐欺發展趨勢。第一,Deepfake 服務化使詐騙門檻與成本大幅降低。第二,詐欺行為跨境化與遠端化,已經突破地理限制、走向全球攻擊。第三,社交工程從大量投放釣魚信件,轉為高度個人化、難以辨識的精準攻擊。

面對詐欺手法持續演進,聯合信用卡處理中心風險管理部資深協理李錦堯表示,聯卡中心正透過區塊鏈與FIDO生物識別技術,打造無密碼的數位身分認證系統,並結合AI數據模型提升TRACE風險預警系統的效能。未來,聯卡中心將持續優化模型,並建立跨機構資料共享的聯防機制,整合發卡機構與國際組織資源,以提升整體防詐能力,對抗日益複雜的詐欺攻擊。

代理式商務將為消費者帶來更好的消費與支付體驗,但同時也對安全、治理與信任造成更大的影響,促使產業必須從單點防護走向跨機構、跨生態系的整體治理思維。在此趨勢下,萬事達卡將持續扮演關鍵推動者角色,攜手監理機關與產業夥伴,強化支付安全標準,推動台灣支付產業的監管框架與創新發展,打造兼顧效率與信任的數位商務環境。

Mastercard-05.jpg
回應AI 代理經濟下的詐欺防制與個資挑戰,本論壇特別邀請台灣大哥大資訊長 蔡祈岩、聯合信用卡處理中心風險管理部資深協理 李錦堯、萬事達卡Franchise Innovation副總裁 Dennis Koh交流趨勢觀點。
圖/ 數位時代

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓