Google Gemini 3.1 Pro 登場：推理力大躍進，直衝「AI 工作流引擎」時代|數位時代 BusinessNext

Google(GOOGL-US) 周四 (19 日) 透過官方部落格，突然宣布推出其最新的人工智慧核心模型 Gemini 3.1 Pro。這款模型被定位為處理最複雜任務的「智慧升級版」，象徵著 Google 在 AI 核心推理能力上取得了重大突破。

隨著 Gemini 3.1 Pro 的發布，Google 旨在將更強大的智慧應用於日常開發與消費級產品中，幫助使用者解決那些「簡單回答已不足夠」的艱難挑戰。

核心推理能力的飛躍：基準測試表現驚人

Gemini 3.1 Pro 最受矚目的改進在於其邏輯推理能力的提升。根據 Google 發布的數據，該模型在評估邏輯模式解決能力的關鍵基準測試 ARC-AGI-2 中，獲得了 77.1% 的驗證分數。與前代 Gemini 3 Pro 的 31.1% 相比，其推理性能提升超過兩倍，也遠高於 Gemini 3 Deep Think 的 45.1%。

在與競爭對手的橫向對比中，Gemini 3.1 Pro 在多項指標上領先於 Anthropic 的 Claude Opus 4.6 以及 OpenAI 的 GPT-5.2。例如：

• Humanity"s Last Exam(人類最後的考驗)：Gemini 3.1 Pro 分數為 44.4%，優於 Claude Opus 4.6 的 40.0% 與 GPT-5.2 的 34.5%。

• MMLU(大規模多任務語言理解)：達到 92.6%，領先競爭對手。

• GPQA Diamond：得分 94.3%，展現出極高水平的專業知識理解。

儘管如此，報導也指出在特定領域中，競爭對手仍保有優勢。例如，Claude Opus 4.6 在部分 SWE-Bench 驗證中仍位居榜首，而 OpenAI 的 GPT-5.3-Codex 則在特定的編程測試中表現較佳。

Google 最新的 Gemini 3.1 Pro 在多項高難度智力與程式任務基準測試中，整體表現明顯超越前一代 3 Pro，並與其他旗艦模型正面對比。在 ARC‑AGI‑2 這類考驗抽象推理的測驗上，成績一口氣拉到 77.1%；在寫程式與修 bug 的 SWE‑Bench、LiveCodeBench、SciCode 等實戰任務中，也有明顯提升，顯示它不只會「寫答案」，更能在真實情境裡拆解問題、完成工作。

圖／ Google

多樣化的實務應用

Google 強調，Gemini 3.1 Pro 不僅是數據上的進步，更在於能將高級推理轉化為實用的功能。

純程式碼動畫生成：該模型能直接根據文字指令生成網頁適用的 SVG 動畫。由於這些動畫是基於純程式碼而非像素構建，因此在任何比例下都能保持清晰，且檔案體積遠小於傳統影片。
複雜系統整合：Gemini 3.1 Pro 展現了連接複雜 API 與使用者介面的能力。在官方展示中，它成功構建了一個即時航太儀表板，利用公開遙測數據視覺化國際太空站 (ISS) 的軌道運行。
沉浸式互動設計：該模型能編寫複雜的 3D 動態視覺效果 (如鳥群飛翔模擬)，並結合手部追蹤功能，讓使用者能操控視覺效果，甚至產生隨動作變化的生成式配樂。
創意編碼與文學轉化：Gemini 3.1 Pro 展現了理解文學主題並將其轉化為功能性程式碼的能力。例如，它能根據艾蜜莉 · 勃朗特的經典小說《咆哮山莊》的大氣色調，設計出富有現代感的個人作品集網站，而非僅僅是摘要文字。

全方位布局：如何體驗 Gemini 3.1 Pro

Google 目前已在多個平台上陸續推送 Gemini 3.1 Pro，涵蓋開發者、企業及一般消費者：

• 一般消費者：可透過 Gemini App 使用。訂閱 Google AI Pro 與 Ultra 方案的用戶將享有更高的使用限制。此外，NotebookLM 也已開放 Pro 與 Ultra 用戶專屬體驗。

• 開發者與企業：可透過 Gemini API (Google AI Studio)、Vertex AI、Gemini Enterprise 以及 Google 的代理式開發平台 Antigravity 進行訪問。

• 開發工具整合：該模型也將整合進 Gemini CLI、Android Studio，甚至延伸至微軟的服務，如 GitHub Copilot 和 Visual Studio Code。

AI 賽賽升溫：Google 的市場防禦與進攻

這次發布正值 AI 市場競爭最激烈的時刻。市場分析指出，Gemini 3 Pro 在去年 11 月發布後曾引發 OpenAI 的「紅色警報 (code red)」，並導致部分用戶從 ChatGPT 流向 Gemini。Google 執行長 Sundar Pichai 在最近的財報中提到，Gemini App 的月活躍用戶已超過 7.5 億，且其模型透過 API 每分鐘處理超過 100 億個 token。

Gemini 3.1 Pro 的推出被視為 Google 快速迭代策略的一部分。Google 表示，目前發布的是預覽版，目的是為了在正式全面開放 (GA) 之前，驗證更新並進一步推進代理式工作流 (agentic workflows) 等雄心勃勃的研發領域。

Karpathy：應用商店模式正在過時

Gemini 3.1 Pro 發布之際，OpenAI 共同創辦人 Andrej Karpathy 提出「應用商店模式正在過時」的觀點，他指出，隨著如 Gemini 3.1 Pro 等具備強大推理能力的模型出現，模型已能從單純回答問題延伸到完成一整套專業工作流。

Karpathy 預見一個由「AI 原生傳感器」和「執行器」構成的時代，屆時將由 LLM 負責編排、即興生成高度定制的應用。這種「即時生成、用完即棄」或「個人專屬」的軟體邏輯，將從根本上取代傳統應用商店的發布與下載機制。

總結來說，Karpathy 認為，AI 讓軟體開發的門檻與成本降到極低，未來的趨勢是 AI 根據用戶需求直接生成解決方案，而非用戶去適配應用商店中既有的 App。

本文授權轉載自：鉅亨網

延伸閱讀：NotebookLM簡報支援修改功能了，還能匯出PPT格式！如何使用？教學一次看

在全球「消費升級」的時代，現今消費者要找的，不是最便宜、CP 值最高的產品，而是更安全、更值得信任、更符合需求的商品。在此趨勢下，台灣品牌的優勢反而被放大。

事實上，憑藉著深厚的製造底蘊、對品質的堅持，許多來自台灣的品牌，正透過精準的「價值創新」研發，以及「安全信任」的品牌經營，在亞馬遜上，擄獲各國消費者的青睞。

拒絕等待完美，MOOIMOM 透過出海、迭代快速進化

新創母嬰品牌 MOOIMOM 自 2016 年創立起，便瞄準全球市場，MOOIMOM 創辦人周靖棠指出，近年來，台灣新生兒人數持續下滑，若一開始就只做台灣市場，花去的時間、開發成本都無法撐起未來的成長性，「所以我們第一天就決定『Go Gloabl』，這對新創非常重要。」

MOOIMOM 是從印尼市場起家，再逐步拓展回台灣，但周靖棠隨即又意識到，若「Go Global」僅在東南亞、台灣，仍然有侷限，於是 MOOIMOM 決定加入亞馬遜，跨出亞洲、進軍澳洲等市場，「MOOIMOM 需要一個已經有高信賴度、強大物流、精準數據的夥伴，協助我們降低跨足北美、澳洲等市場的門檻。」

為了找到市場缺口、實踐價值創新，MOOIMOM 積極運用亞馬遜上的數據與賣家工具。相較於其他品牌可能會注意自家產品有多少五顆星的評價，周靖棠尤其重視「四顆星」的留言，「因為那往往是能不能從『好』做到『更好』的關鍵。」以 MOOIMOM 的「涼感產後束腹帶」為例，團隊透過評論，發現邊緣縫線會造成皮膚的些微摩擦，加上產婦穿不住悶熱的材質，於是，MOOIMOM 花了近兩年時間，參考亞馬遜後台數據，包括消費者留言、競品的包裝顏色、排名落差等資訊，將產品從 1.0 迭代至 3.0 版本，不僅改採涼感透氣材質，更做到無縫線的舒適感。周靖棠透露，1.0 版的束腹帶，原先一週賣不到 1000 美元，但發展至 3.0 時，除了評價穩定保持在 4.3 顆星以上，一週甚至可以達到1萬美元的營業額，等於成長十倍。

另外，周靖棠也善用亞馬遜的「A+ Content」等工具，將「永續」元素植入 MOOIMOM。由於澳洲對環保、安全規範的要求，向來以嚴格聞名，對於跨境電商無法「觸摸實品」的鴻溝，團隊便運用 A+ Content，在產品頁面中將小麥桿融合PP材質等無毒認證和安全細節，讓消費者一目瞭然。針對各國嚴格的母嬰用品法規，團隊也在亞馬遜協助下，一一完成合規程序，把出海阻礙轉化為讓消費者安心買單的保證。

科學實證敲開日本大門，大研生醫靠極致細節贏得信任

以德國頂級魚油、視易適葉黃素等產品聞名的大研生醫，起初是為了自己和家人的保健需求創立，在台灣取得佳績後，大研決定將這份堅持帶向世界。而出海的首站，是保健食品發展逾百年、相當競爭的日本市場。

大研生醫出海首站就挑戰保健食品發展逾百年、相當競爭的日本市場，大研生醫董事長林東慶表示，進入日本市場真的很辛苦，但當收到日本消費者正向的回饋時，對團隊帶來很大的鼓舞。

圖／數位時代

大研生醫董事長林東慶解釋，先選擇日本，是因為當地消費者偏好網購、多居住於公寓，購物習慣、商業環境和台灣相近。至於決定透過亞馬遜進軍日本，一方面出於亞馬遜是日本使用率最高的電商網站之一。其次，在日本市場想「從 0 到 1」發展不易，溝通成本高，「但亞馬遜上的消費者，都很願意接受新東西。代表我們更容易在上面找到對的人。」

林東慶特別提到，日本保健食品市場歷史悠久，卻並非完全沒有切入機會。例如：日本延續過往經驗，原料進展未必跟上時代需求，市面的魚油濃度普遍都不足。除了端出創新的產品之外，想進入相對成熟的日本保健品市場，安全有效、建立信任是唯一真理，「大研經營的正是『信任』，信任背後代表了你的產品、服務和品牌。而亞馬遜就是過程中的最強後盾。」

大研透過亞馬遜的後台數據，從消費習慣與市場需求兩個面向，深入了解日本市場。例如，日本消費者偏好小顆粒、一天可服用多顆保健品；另一方面，日本社會因工作壓力大，助眠、舒緩情緒等產品需求也持續成長。團隊再搭配「在地製造、世界原料」的策略，讓「Made in Japan」成為敲門磚，「就和在台灣帶起『高濃度魚油』的風潮一樣，我們以國際頂級專利原料、強大的科學實證及嚴格的產品檢驗，帶起新趨勢。」

大研甚至將細節延伸至包裝、服務。比方說，日本家戶的信箱尺寸偏小，大研的包裝設計，便要確保能順利投遞進信箱；消費者認為用紙盒包裝更安全，大研也從善如流，採精緻紙盒而非美國市場的簡約瓶裝。由於在每個環節都做到極致，大研才進軍日本亞馬遜半年，就奪下 Omega-3 魚油類目排名第一，整體 BSR 也達到 1000 至 1200 名以內。

接下來，大研計劃進軍極度重視天然與健康的澳洲市場，以及競爭激烈的美國市場，林東慶強調，大研期望透過亞馬遜，將對品質的堅持帶出台灣，成為具影響力的全球品牌。

大研生醫因應不同市場消費習慣，推出日本、美國、台灣三種版本魚油產品，同樣訴求高濃度、高品質。不僅在生產上呼應其「在地製造、世界原料」的全球化策略，更配合當地市場習慣，量身定做外包裝規劃，左：日本版、中：美國版、右：台灣版德國頂級魚油）

圖／數位時代

跳脫傳統代工宿命，特力集團用數據算出市場需求

擁有 30 年歷史的特力集團，從傳統 B2B 貿易起家，如今再下一城、攻入跨境電商市場，在亞馬遜上的營收，每月穩定達到美元六位數。這背後，是一場為了解決傳統代工痛點發起的 DNA 轉型。

特力集團業務總監 Isaac Liao 指出，傳統 B2B 貿易是特力深厚且穩固的根基，但為了在全球供應鏈重組的變局中更具敏捷度，特力必須打破過去與終端市場之間的隔紗。但中上游企業打下游 B2C 戰局，最怕盲目下注或因為怕虧損而不敢試錯。特力的心法，是建立一個「基於數據的科學容錯機制」，把亞馬遜當成全球導航儀，大膽做小規模的市場實驗，算準了、看清了再重注出擊。

Isaac 透露，特力在歐美家居市場突圍的關鍵，在於用「數據」找出消費者的痛點，再據此創新產品，「中上游企業常覺得自家產品無敵，怎麼會賣不好？但在電商戰場，消費者沒搜那個關鍵字，產品再好都等於不存在。」特力是用亞馬遜的商機探測器、品牌分析工具，抓出高需求、低競爭的藍海市場，並將自家產品、競品的負評，作為研發參考。例如團隊抽絲剝繭後，發現消費者通常在購買資源回收桶時，最痛恨「異味洩漏」和「腳踏板易壞」；買烤肉推車時，則有「說明書看不懂」、「組裝太複雜」等痛點。團隊會再據此回頭改良製程、產品，並將行銷時，將這些痛點的「解方」直接放大在亞馬遜的產品頁面 A+ Content 和主圖影片中。

Isaac 特別提到，近期特力導入了亞馬遜行銷雲（Amazon Marketing Cloud, AMC），拆解完整的消費旅程。以特力在亞馬遜熱銷的烤肉推車為例，透過 AMC 的底層數據藍圖，團隊發現歐洲消費者從心動到行動平均需要三週。消費者可能在第一週看球賽時，先被特力的品牌影片廣告（DSP）吸引；第二週滑亞馬遜時，看到展示型廣告（SD）被再次提醒；直到第三週週末要辦派對了，才在搜尋框輸入關鍵字並透過商品廣告（SP）下單結帳，「AMC 讓我們看清這條跨渠道的『消費旅程藍圖』，把過去盲目砸廣告的焦慮，變成每分錢都能精算回報率的高精準 ROI 投資。」

特力已立下月營收達七位數美元的新目標。Isaac 透露，團隊正積極布局生成式引擎優化（GEO）等最新 AI 搜尋趨勢，並根據亞馬遜的後台數據，延伸家居周邊產品線，期望推動內部從「製造思維」進化為「市場和品牌思維」，讓台灣深厚的製造底蘊，能在國際零售舞台上走得更深、更遠。

在迎戰「消費升級」的此刻，台灣企業從來不缺好技術，缺的是直面終端市場的勇氣與機會。而亞馬遜提供的，不只是一套銷售工具，而是一套完整的「持續創新」能力——從全球物流、在地合規，到消費者洞察與數據分析，讓品牌得以直接理解世界各地消費者的真實需求。透過這套基礎設施，品牌能在國際市場中「快速測試、快速修正、快速成長」，把每一次迭代都變成站穩腳步的養分。台灣品牌只要願意邁出第一步，再借力亞馬遜的全球能力，勢必能在世界舞台走得更穩、更遠，實踐「Go Global From Day One」的布局。

想要挑戰跨境，讓更多人認識你的產品嗎？
立即報名 Taiwan Select Day