AI之戰白熱化!Anthropic推出Claude Opus 4.5:程式、代理、電腦操作,性能碾壓Gemini 3 Pro?
AI之戰白熱化!Anthropic推出Claude Opus 4.5:程式、代理、電腦操作,性能碾壓Gemini 3 Pro?

重點一:Anthropic 推出 Claude Opus 4.5,宣稱為目前最強,在程式、代理與電腦操作領先。

重點二:模型新增可調整的「effort參數」,趕時間就選低 effort,追求最強效能就選高 effort。讓開發者能用更少資源,跑更長、更複雜的流程,還能依需求調整「思考力」與「成本」。

重點三:Claude Opus 4.5的輸入/輸出代幣降價約三分之二。

Anthropic 宣布推出新一代大型模型 Claude Opus 4.5,定位為其最旗艦版本,並表示在「程式開發、代理(agentic workflows)與電腦使用」方面具備領先能力。

官方指出,Opus 4.5 在多項真實世界工程測試表現出色,包含 SWE-bench 類型的評測,且在多語言與長程推理上有明顯進步。

實務面上,Opus 4.5 在多家早期客戶測試中被評為「用更少 Token 完成更難任務」,包含 GitHub Copilot 等重度代理場景、跨程式碼庫重構、長時間自主編碼與長篇故事生成等使用情境。

Claude Opus 4.5 的軟體工程能力
Anthropic指出,Opus 4.5的軟體工程能力堪稱當今最強。
圖/ Anthropic

目前,模型已在 Anthropic 各管道上線,包括App、API 與三大雲平台,開發者已可使用「claude-opus-4-5-20251101」。

值得注意的是,API定價從前代大幅下修至每百萬輸入代幣 5 美元(約新台幣 160 元)、每百萬輸出代幣 25 美元(約新台幣785元),相較 Claude Opus 4.1 的 15 美元與 75 美元降幅約三分之二,使先進AI能力更具可及性。

除了模型本身,Anthropic 同步更新 Claude Developer Platform、Claude Code 與消費端 App,強調更長時程代理、跨 Excel、Chrome 與桌面環境的整合,以及聊天在長對話中的自動摘要銜接,減少斷點。

「Effort參數」是什麼?

Opus 4.5 的核心變化之一是效率與控制。Anthropic引入「Effort參數」,允許開發者在「速度與成本」與「能力最大化」之間調整,搭配「Context Compaction(情境壓縮)」與「Advanced Tool Use(進階工具使用)」等平台能力,使長任務更穩定、探查更少、推理更精煉。

官方數據顯示, 在中等 Effort 下,Opus 4.5 可用顯著更少的輸出 Token 達到與 Sonnet 4.5 相近或更好的分數;在最高 Effort 下,仍能以更少 Token 超越 Sonnet 4.5。

平台也強化「Context Management(情境管理)」與「Memory Capabilities(記憶能力)」,並支持多子代理協作,讓複雜多階段任務更可控、可組合。

在產品面上,Claude Code 的 Plan Mode 更精準,會先提出澄清問題並建立可編輯的 plan.md,再執行;同時提供桌面版以並行多個本地/遠端 Session。

消費端則開放 Claude for Chrome 給 Max 用戶,並擴大 Claude for Excel 的測試名單至 Max、Team、Enterprise。而在資費與配額方面,Opus 4.5 取消專屬上限(原本有配額限制),力求可作為日常主力。

Opus 4.5進化!代理、長文能力都更強

Anthropic在系統卡中稱 Opus 4.5 是其迄今「對齊(Alignment)」最穩健的模型,並強化對「提示注入(Prompt Injection)」的抵抗力。公司表示在與第三方強攻擊集的評測中,Opus 4.5 比其他前沿模型更不易被駭客欺騙,對企業關注的安全使用情境是一項關鍵提升。

官方亦強調 Opus 4.5 的代理能力。指出在其中一個測試情境中,模型必須扮演航空公司服務代理,協助一位焦慮的客戶。該基準(τ2-bench)預期模型會拒絕修改基本經濟艙預訂,因為航空公司不允許更改該艙等的機票。然而,Opus 4.5 找到了一個富有洞察力(且合法)的方法來解決問題:先升級艙等,然後再修改航班。

Claude Opus 4.5 的各項能力值
Anthropic指出,Opus 4.5在各項能力都勝過當前模型。
圖/ Anthropic

至於在典型業務場景的具體改善,則如下:

  • Excel 自動化:讀取多表、交叉引用、生成樞紐與圖表,對錯誤資料有更好的容錯與修正建議;財務模型可維持單位、期間與假設一致。
  • 金融建模:現金流、比率分析、情境測試與敏感度分析更可靠;能追蹤假設來源並對不一致的前提提出更正。
  • 企業級多步任務:跨文件檢索→工具呼叫→彙整→產出決策稿的長流程更少卡住;在長達 30 分鐘的自主編碼與流程協調裡,失誤率下降、步驟更精簡。

官方也強調,Opus 4.5 在長內容生成的穩定性更強力。例如10~15 頁章節,在段落結構、角色與設定的一致性更好;能維持主線邏輯與前後呼應,不易出現前後矛盾。而若生成事實型長文,Opus 4.5 可在長上下文中持續引用同一套資料與定義,較少遺忘或自相矛盾。

總體而言,Opus 4.5 不僅是能力提升,更是讓開發者能以可調節的成本/能力曲線構建更長、更可靠的代理系統。

延伸閱讀:哪一款AI最可靠?研究揭Claude家族最老實:為何對LLM來說,坦承無知比「已讀亂回」更難?

資料來源:Anthropicventurebeat

本文初稿為AI編撰,整理.編輯/ 李先泰

往下滑看下一篇文章
品牌成長的下一步:WPP Open 與 AI 驅動的智慧行銷全攻略
品牌成長的下一步:WPP Open 與 AI 驅動的智慧行銷全攻略

生成式 AI 正在改變人們的生活與工作方式,品牌行銷的運作模式也因此而大幅改變。為因應這波變革,WPP Media(群邑媒體)舉辦「Open for Growth 2030 打開智能行銷時代」論壇,正式宣佈在台推出全新平台 WPP Open,並攜手奧美與 The Trade Desk 兩大合作夥伴,共同探討未來十年的媒體轉型藍圖,協助企業洞察國際趨勢,搶先布局新時代的傳播競爭力。

WPP Open 在台上市,打造 AI 行銷智能引擎

WPP Media(群邑媒體)執行長郭俊鑫表示,AI 已經是行銷流程中不可或缺的一環,但行銷人現在的挑戰不在於「要不要用AI」,而是「如何讓 AI 落地,真正幫助品牌在每一個層面上都能產生成效?」

對此,WPP 集團集結全球的行銷數據、策略與方法論,打造出全新智慧行銷平台 WPP Open,這是一個跨品牌、跨市場、跨媒體的 AI 智能策略引擎,可以讓行銷策略與產出更快、更準、更有影響力。

WPP Media
WPP Media(群邑媒體)執行長郭俊鑫
圖/ WPP Media

WPP Open平台具備三大特色。第一是以 WPP 集團本身所擁有涵蓋 75 個產業的消費者數據庫為基礎,再串接全球超過 350 家合作夥伴的數據庫,透過大量且多元的數據來訓練模型,確保資料安全與精準。第二是以「Private by Default」為設計核心,確保品牌在利用數據的同時仍維持最高隱私標準。第三是內建 Discovery、Plan、Activate、Measure 四大模組,涵蓋媒體行銷的每一個階段,讓品牌主、創意團隊與媒體平台等不同組織,都能在相同平台上一起協作,提高作業效率。

WPP Open如何解決品牌的三大挑戰?

WPP Media策略長金佳諭進一步指出,在科技快速變化、市場競爭激烈的今日,所有品牌主都在面臨三大行銷挑戰:如何找到下一個成長來源?如何在大量且分散的媒體環境中維持精準消費者洞察?又如何在海量數據中看見完整故事?而WPP Open 恰好能協助企業克服這三大挑戰。

首先,透過 Discover 模組可以助力品牌找到下一個成長來源。過去,行銷團隊在解讀客戶需求時,往往會因為溝通方式、經驗或觀點差異,而出現理解落差,而 Discover 模組可分析 Brief 背後的隱藏訊息、提供產業洞察、找出未被看見的成長動能,或是從消費者決策路徑和行為中,判斷品牌真正的競爭優勢,讓團隊從第一步就做出對的決策。

WPP Media
WPP Media策略長金佳諭
圖/ WPP Media

其次,是運用 Plan 模組看見真實受眾,維持精準的消費者洞察。WPP Media 資深總監陳昭伶指出,過去的消費者研究存在許多限制,例如,難以全面理解消費者、人工解讀數據,耗時又費力等,但透過 Plan 模組 4 大功能可以突破限制,快速完成消費者研究。

舉例來說,Audience Insight 可以從不同維度去描繪消費者樣貌,行銷人只要與系統「對話」,就能看到洞察結果,不必再花大量時間進行複雜的資料處理。而Build Persona 則讓行銷人可以看到消費者生活化的樣貌。Focus Group 能夠模擬目標受眾樣貌並回答問題,大幅縮減焦點訪談所需的時間和人力成本。Customer Journey 則能了解不同階段的消費者旅程,「當我們真正理解消費者,就能與他建立更真誠的連結。」陳昭伶說。

WPP Media
WPP Media 資深總監陳昭伶
圖/ WPP Media

第三,是藉由Measure 模組從海量數據中看見完整故事。WPP Media數據與技術團隊負責人戴伯偉表示,WPP Open 以行銷人員為中心,將媒體投放明細、轉換成效、電商/銷售數據、品牌自有資料等內外部數據,匯整在單一平台上,使企業可以做更快速更全面的資料探索。此外,Measure 模組還能根據不同業務需求,客製且彈性的設計報表,讓每個部門都能更直覺地看到最關心的指標。同時還內建 AI 助理:可以自動摘要廣告成效,協助團隊快速發現問題、提出解方。

戴伯偉強調, Measure 模組實現了數據分析自由,滿足任何分析靈感或需求,並且整合跨部門的商業智慧,可以賦能企業與品牌,做出成效最好、效率最高的決策。

WPP Media
WPP Media 數據與技術團隊負責人戴伯偉
圖/ WPP Media

AI 驅動的新世代行銷:從洞察、創意到投放的全面革新

策略人員每天面對不同產業、不同生意與品牌課題,外界常期待我們要「全知」、什麼都懂,而我們自己也渴望靠近全知的能耐。

有了WPP Open加持,策略人員依然需要具備判斷問題的能力與領域思維,但過去大量耗費在蒐集、彙整、比對資料的人工勞動,現在交由擁有龐大資料庫與策略模組的 WPP Open 來處理。在資料的廣度與深度上,比以往更能觸及更完整的世界。

然而,真正的策略答案,從來不是一鍵產生。不論是以終為始,或從始至終,策略的形成仍需辯思往返、推敲求真。WPP Open 協助我們更靠近「全知」,但策略人員的價值,仍在於那段來回思辨的過程,以及從無數可能中找到最真實的解。

WPP Media
奥美整合行銷播集團策略總監宋伊婕
圖/ WPP Media

此外,AI 也能讓行銷素材變得更有創意、更獨特。奧美整合行銷傳播集團執行創意總監蔣依潔分享品牌運用 AI 的行銷創意。例如,有國際飲料品牌以開放平台促成大眾共創;而某家養生飲品則用 AI 創造出虛擬的知己小姐,展現集體女性樣貌中的不同細節;亦有連鎖通路品牌在行銷洗衣精品牌時,運用 AI 生成對髒衣服的想像,從庶民生活中的不完美找到趣味和機會。「創意手法可以不同,但必須與品牌調性一致,這是 AI 生成內容的核心前提。」蔣依潔強調。

WPP Media
奧美整合行銷傳播集團執行創意總監蔣依潔
圖/ WPP Media

在創意產出後,行銷還有最後一哩路,也就是媒體投放。作為 WPP Open 的重要策略夥伴,The Trade Desk(TTD)副總監陳玟潔指出,當品牌透過 WPP Open 完成受眾洞察、策略規劃與創意發想後,真正的挑戰是——如何在龐雜的開放網路中,把廣告「最有效率」投遞給真正的目標受眾。

WPP Media
The Trade Desk(TTD)副總監陳玟潔
圖/ WPP Media

TTD 以跨裝置身份辨識(Unified ID 2.0)、全通路(Omni-channel)、高效演算力與透明數據為核心,讓 WPP Open 所定義的受眾能被精準觸及,並結合 AI技術,協助品牌在投放過程中不斷優化、掌握主導權。她強調:WPP Open 與 TTD 的結合,讓「從洞察到投放」真正串成一條完整、透明、可信賴的 AI 行銷鏈。

在科技快速變化與媒體碎片化的時代,WPP Open 用 AI 串連行銷流程,讓 AI不只是工具,更是推動品牌邁向下一個成長曲線的真正起點。

想了解更多WPP Open AI平台的實際應用,歡迎直接洽詢 WPP Media - Growth & Marketing | MKTG@wppmedia.com

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓