Google Gemini 3.1 Pro 登場:推理力大躍進,直衝「AI 工作流引擎」時代
Google Gemini 3.1 Pro 登場:推理力大躍進,直衝「AI 工作流引擎」時代

Google(GOOGL-US) 周四 (19 日) 透過官方部落格,突然宣布推出其最新的人工智慧核心模型 Gemini 3.1 Pro。這款模型被定位為處理最複雜任務的「智慧升級版」,象徵著 Google 在 AI 核心推理能力上取得了重大突破。

隨著 Gemini 3.1 Pro 的發布,Google 旨在將更強大的智慧應用於日常開發與消費級產品中,幫助使用者解決那些「簡單回答已不足夠」的艱難挑戰。

核心推理能力的飛躍:基準測試表現驚人

Gemini 3.1 Pro 最受矚目的改進在於其邏輯推理能力的提升。根據 Google 發布的數據,該模型在評估邏輯模式解決能力的關鍵基準測試 ARC-AGI-2 中,獲得了 77.1% 的驗證分數。與前代 Gemini 3 Pro 的 31.1% 相比,其推理性能提升超過兩倍,也遠高於 Gemini 3 Deep Think 的 45.1%。

在與競爭對手的橫向對比中,Gemini 3.1 Pro 在多項指標上領先於 Anthropic 的 Claude Opus 4.6 以及 OpenAI 的 GPT-5.2。例如:

Humanity"s Last Exam(人類最後的考驗):Gemini 3.1 Pro 分數為 44.4%,優於 Claude Opus 4.6 的 40.0% 與 GPT-5.2 的 34.5%。

MMLU(大規模多任務語言理解):達到 92.6%,領先競爭對手。

GPQA Diamond:得分 94.3%,展現出極高水平的專業知識理解。

儘管如此,報導也指出在特定領域中,競爭對手仍保有優勢。例如,Claude Opus 4.6 在部分 SWE-Bench 驗證中仍位居榜首,而 OpenAI 的 GPT-5.3-Codex 則在特定的編程測試中表現較佳。

Gemini 3.1 Pro 的「動腦能力」整體往上了一級
Google 最新的 Gemini 3.1 Pro 在多項高難度智力與程式任務基準測試中,整體表現明顯超越前一代 3 Pro,並與其他旗艦模型正面對比。在 ARC‑AGI‑2 這類考驗抽象推理的測驗上,成績一口氣拉到 77.1%;在寫程式與修 bug 的 SWE‑Bench、LiveCodeBench、SciCode 等實戰任務中,也有明顯提升,顯示它不只會「寫答案」,更能在真實情境裡拆解問題、完成工作。
圖/ Google

多樣化的實務應用

Google 強調,Gemini 3.1 Pro 不僅是數據上的進步,更在於能將高級推理轉化為實用的功能。

  1. 純程式碼動畫生成:該模型能直接根據文字指令生成網頁適用的 SVG 動畫。由於這些動畫是基於純程式碼而非像素構建,因此在任何比例下都能保持清晰,且檔案體積遠小於傳統影片。

  2. 複雜系統整合:Gemini 3.1 Pro 展現了連接複雜 API 與使用者介面的能力。在官方展示中,它成功構建了一個即時航太儀表板,利用公開遙測數據視覺化國際太空站 (ISS) 的軌道運行。

  3. 沉浸式互動設計:該模型能編寫複雜的 3D 動態視覺效果 (如鳥群飛翔模擬),並結合手部追蹤功能,讓使用者能操控視覺效果,甚至產生隨動作變化的生成式配樂。

  4. 創意編碼與文學轉化:Gemini 3.1 Pro 展現了理解文學主題並將其轉化為功能性程式碼的能力。例如,它能根據艾蜜莉 · 勃朗特的經典小說《咆哮山莊》的大氣色調,設計出富有現代感的個人作品集網站,而非僅僅是摘要文字。

全方位布局:如何體驗 Gemini 3.1 Pro

Google 目前已在多個平台上陸續推送 Gemini 3.1 Pro,涵蓋開發者、企業及一般消費者:

一般消費者:可透過 Gemini App 使用。訂閱 Google AI Pro 與 Ultra 方案的用戶將享有更高的使用限制。此外,NotebookLM 也已開放 Pro 與 Ultra 用戶專屬體驗。

開發者與企業:可透過 Gemini API (Google AI Studio)、Vertex AI、Gemini Enterprise 以及 Google 的代理式開發平台 Antigravity 進行訪問。

開發工具整合:該模型也將整合進 Gemini CLI、Android Studio,甚至延伸至微軟的服務,如 GitHub Copilot 和 Visual Studio Code。

AI 賽賽升溫:Google 的市場防禦與進攻

這次發布正值 AI 市場競爭最激烈的時刻。市場分析指出,Gemini 3 Pro 在去年 11 月發布後曾引發 OpenAI 的「紅色警報 (code red)」,並導致部分用戶從 ChatGPT 流向 Gemini。Google 執行長 Sundar Pichai 在最近的財報中提到,Gemini App 的月活躍用戶已超過 7.5 億,且其模型透過 API 每分鐘處理超過 100 億個 token。

Gemini 3.1 Pro 的推出被視為 Google 快速迭代策略的一部分。Google 表示,目前發布的是預覽版,目的是為了在正式全面開放 (GA) 之前,驗證更新並進一步推進代理式工作流 (agentic workflows) 等雄心勃勃的研發領域。

Karpathy:應用商店模式正在過時

Gemini 3.1 Pro 發布之際,OpenAI 共同創辦人 Andrej Karpathy 提出「應用商店模式正在過時」的觀點,他指出,隨著如 Gemini 3.1 Pro 等具備強大推理能力的模型出現,模型已能從單純回答問題延伸到完成一整套專業工作流。

Karpathy 預見一個由「AI 原生傳感器」和「執行器」構成的時代,屆時將由 LLM 負責編排、即興生成高度定制的應用。這種「即時生成、用完即棄」或「個人專屬」的軟體邏輯,將從根本上取代傳統應用商店的發布與下載機制。

總結來說,Karpathy 認為,AI 讓軟體開發的門檻與成本降到極低,未來的趨勢是 AI 根據用戶需求直接生成解決方案,而非用戶去適配應用商店中既有的 App。

本文授權轉載自:鉅亨網

延伸閱讀:NotebookLM簡報支援修改功能了,還能匯出PPT格式!如何使用?教學一次看

往下滑看下一篇文章
以數位公共建設金流平台為橋樑,打造民眾、商家與銀行共贏生態圈
以數位公共建設金流平台為橋樑,打造民眾、商家與銀行共贏生態圈

在中央銀行與財金公司引領下,數位公共建設金流平台不僅整合「TWQR」,更連通銀行與民間電支機構,透過統一的QR碼「TWQR」,以「跨機構、一碼付」、「款券合用」、「跨境支付」以及即將上線的「多券合用」等功能,讓很多部會的券,甚至是金融機構發行的,都可以一起使用,逐步吸引民眾、商家與金融機構加入,民眾能即時使用、商家快速收款,銀行也能結合金融服務創新。隨著「TWQR」平台成熟,2026 年應用場景也從生活消費、公共繳費拓展至交通運輸等領域,形成涵蓋支付與生活服務的數位金融生態圈。

「數位公共建設金流平台」讓政府能運用既有的金融通路,完成艱鉅的數位政策推展,數位化取代紙本作業,不僅提升發放效率,更能大幅節省印製與回收的行政成本。對民眾而言,領取補助不再受時間與地點限制,免去紙本券排隊、保管不便的痛點,輕鬆取得「全時服務」,真正做到「數位領券免排隊、消費折抵更直覺」。為響應政府推動非現金支付的目標、打造更普惠的金融環境,玉山銀行率先將數位公共建設金流平台整合進玉山 Wallet App,於 2025 年 1 月推出「數位券」服務,同時,也領先同業推出「券+點+支付」整合付款功能,民眾可以在 App 內完成登記、領取與使用政府補助,並在 TWQR 與台灣 Pay 商店消費抵用,大幅簡化支付流程。

玉山銀行個人金融事業總處資深副總經理林榮華表示:「我們很重視客戶體驗,整合數位公共建設金流平台後,民眾不僅能透過玉山 Wallet App 領取各類政府補助券,例如客家幣,還能透過玉山電子支付與玉山 e point ,一鍵完成『券+點+支付』合併付款。」未來,玉山銀行也將與特約商店合作,透過「數位券」服務,發送更多數位優惠,讓商家能更容易推動數位行銷並提升支付體驗。

玉山銀行個人金融事業總處資深副總經理 林榮華
玉山銀行個人金融事業總處資深副總經理 林榮華
圖/ TWQR

以TWQR為核心,打造多方受益的數位金流生態圈

過去,面對不同政府機關發送的消費券或振興券,民眾常需要在不同平台登記、領取與使用,不僅流程繁瑣,商家核銷程序也相對複雜。為了解決這類問題,政府積極建構「數位公共建設金流平臺」,整合部會、地方政府與銀行,讓政策補助與振興措施更智慧,從三個面向共創生態系多贏:

提供民眾更便利的「全時服務」:民眾領取跟使用補助券不再受限於時間與地點,真正做到「想領就領、想花就花」。

玉山銀行信用卡暨支付金融處處長張正志進一步解釋,傳統的紙本券除了領取時間與地點受限,還有排隊等候、保管不易與使用不便等問題,即使金融機構推出數位券,民眾也面臨需要下載不同 App 才能使用的狀況。「整合數位公共建設金流平台後,民眾不需切換平台,即可在同一個 App 內完成電子支付、數位券與點數的整合付款。」

協助商家簡化核銷流程並增加客源。舉例來說,玉山銀行特約商家無需更改既有系統,也不用支付額外費用或重新簽約,可以原有收單系統完成收款與核銷,大幅降低導入門檻;此外,玉山銀行亦積極打造好玩、有趣、高互動性的數位券行銷活動,商戶可以透過參與這類活動提升曝光、接觸新客群,進而創造新的營收機會。

玉山分享不僅2月的「一馬當先好運金」活動帶動 10 倍流量,3月推出的「2026新年數位任務挑戰賽」等活動也吸引大量客戶參與,創造民眾、商家與玉山的共贏。對金融機構而言,則是擴大支付場景與深化客戶關係的關鍵平台。透過 TWQR 約 60 萬家商家通路,銀行等金融機構不僅能提升客戶使用頻率,也能逐步建立點數與支付整合的生態圈。

玉山銀行的作法是將數位公共建設金流平台與玉山 Wallet App 整合在一起,開通電子支付並綁定支付工具,藉此引導客戶多加使用玉山 Wallet App,以及透過 TWQR 通路優勢以及交通(乘車碼)跟生活繳費場景應用等方式提升客戶往來頻次與增加跨售機會。「根據我們的統計數據,玉山電子支付帶動玉山銀行開戶的數量,是其他錢包的 6 到 10 倍。」

民眾透過玉山Wallet掃描TWQR,即可在消費場景中使用一鍵完成「數位券+點數+支付」合併付款
民眾透過玉山Wallet掃描TWQR,即可在消費場景中使用一鍵完成「數位券+點數+支付」合併付款
圖/ TWQR

TWQR數位券再進化:從優惠工具、場景金融到實現精準行銷

對玉山銀行來說,整合數位公共建設金流平台不僅是優化民眾領取與使用消費券與振興券體驗的重要工具,更是實現多元場景金融、貫徹精準行銷的重要平台。舉例來說,相較於沒有精準分眾的活動,透過數據分析遴選出的玉山特選用戶領券繳費折抵的轉換率超過 8 成、重購率逾 7 成,成效十分亮眼。

張正志面帶微笑的說:「未來,我們將以系統平台為核心,由跨部門籌組的科技聯隊以數據分析跟 AI 持續優化行銷成效,打造差異化服務體驗。」例如,計畫推出行銷智能化服務:不用人工事先挑選名單,當客戶行為樣態觸發系統預判條件,AI Agent 便會智能發券,提供專屬禮遇。

總體來說,TWQR數位券讓支付更簡單、更智慧,也讓政策補助落地更快速,也為銀行與民間支付合作提供舞台。而玉山銀行除透過舉辦與TWQR相關活動引流、吸引客戶申請數位券服務,更透過平台將獎勵回饋發送到玉山 Wallet App,協助客戶開啟使用電子支付服務,使用後將再度獲得回饋進而養成使用習慣,爾後,以有趣且高互動的客戶經營方式,引導客戶從使用一個銀行服務擴展到使用多個服務,發揮獲客、活客、留客與悅客的正向循環,更好實現跨生態多贏。

#0 台灣Pay
玉山銀行個人金融事業總處資深副總經理 林榮華(右)、玉山銀行信用卡暨支付金融處處長 張正志(左)
圖/ TWQR
精華一次看>>數位時代 Youtube 頻道 Shorts

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓