Anthropic新旗艦Opus 4.7 上線！新增xhigh思考模式、視覺3倍升級，可接手最難程式工作|數位時代 BusinessNext

Anthropic新旗艦Opus 4.7 上線！新增xhigh思考模式、視覺3倍升級，可接手最難程式工作

Anthropic發布新旗艦模型Claude Opus 4.7，更擅長長時間任務，但同樣內容的token用量最多增加35%，費用會微幅上升。

重點一：Claude Opus 4.7 能連續工作數小時、主動檢查自己的答案，過去需要工程師緊盯的程式難題可放手交給 AI。

重點二：軟體工程實測 SWE-bench Pro 解題率從 Opus 4.6 的 53.4% 拉升至 64.3%；新增可微調 AI 思考深度的 xhigh 模式。

重點三：定價不變（輸入 5 美元、輸出 25 美元／百萬 token）；同步上架 Bedrock、Vertex AI、Microsoft Foundry，並作為 Anthropic 新安全機制的第一個測試場。

Anthropic 於 4 月 16 日正式推出新一代旗艦模型 Claude Opus 4.7，同步上架自家 Claude 平台，以及 Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 三大雲端。定價與前代 Opus 4.6 相同，每百萬字輸入 token 5 美元、輸出 25 美元（約合新台幣 159 元與 795 元）。

這次更新的核心賣點，Anthropic 用一句話總結：「過去要工程師緊盯的最難程式工作，現在可以放手交給 Opus 4.7。」新模型能連續工作數小時，且在回報答案前，會主動想辦法驗證自己產出的結果正不正確。

科技媒體《VentureBeat》補充，Opus 4.7 在多項可直接比對的評測中，領先 OpenAI 今年 3 月發布的 GPT-5.4 與 Google 今年 2 月發布的 Gemini 3.1 Pro。

實際進步多少？幾個關鍵測試成績

Anthropic 把 Opus 4.7 定位為「Opus 4.6 的直接升級版」，強化重點放在最困難的軟體工程任務。幾個代表性數字：

SWE-bench Pro（軟體工程實測）：解題率從 Opus 4.6 的 53.4% 提升至 64.3%
arXiv Reasoning（論文推理，開啟工具輔助）：從 84.7% 升至 91.0%
GPQA Diamond（博士級理工題）：94.2%
GDPval-AA（經濟價值知識工作第三方評測）：以 Elo 1753 分居首，GPT-5.4 為 1674、Gemini 3.1 Pro 為 1314
視覺辨識（XBOW 測試）：從 54.5% 跳到 98.5%

Anthropic 誠實指出，Opus 4.7「整體能力仍不如公司最強的 Claude Mythos Preview」，後者因能力過強尚未全面開放。

新增extra high思考模式

這次一併端出的新功能，大多圍繞「讓使用者更能控制 AI 怎麼想、花多少錢」這個主軸：

xhigh 思考模式：過去 Claude 的思考深度只有「低／中／高／最大」四檔，這次在「高」和「最大」之間多了一檔 xhigh（extra high）。Claude Code 已把預設全面拉到 xhigh，讓開發者不必手動切換也能拿到 Anthropic 認為最划算的品質。
task budgets（任務預算）公測：允許開發者替長任務設定 token 上限，避免一個長時間除錯任務意外爆預算。
/ultrareview 指令：Claude Code 內的新指令，專門模擬資深工程師的深度程式碼審查，Pro 與 Max 用戶可免費試用三次。
auto mode 擴展到 Max 用戶：讓 Claude 在授權範圍內自行做決策、減少使用者被詢問的次數。

視覺方面，Opus 4.7 能處理最長邊 2,576 像素（約 3.75 百萬畫素）的圖片，前一代上限只到 1,568 像素。一張完整解析度的圖最多會吃掉 4,784 個 token，是舊模型 1,600 token 上限的約三倍。這項升級對處理螢幕截圖、技術圖表、文件掃描圖的 AI 工具幫助最大。

Claude Opus 4.7 在 Anthropic 內部「自動代理程式程式碼評測」中，無論在低到 max 各個 effort 等級，都以較少或相近的 token 用量達成明顯更高任務完成率：在相同總 token 下，其得分曲線整體高於 Opus 4.6，並在新增的 xhigh 等級下持續提升表現，顯示在長鏈條、自主化 coding 任務上具備更佳的效能與性價比。

圖／ Anthropic

企業升級要留意：費用會變貴、舊 prompt 要重寫

Anthropic 在升級指南中提醒兩件會影響成本的事。

第一，Opus 4.7 換了一套處理文字的方式（業界稱為 tokenizer），同樣的內容在新模型可能產生 1.0 到 1.35 倍的 token 數。換句話說，原本一篇文章花 1,000 token，升級後可能要花 1,350 token，帳單自然上升。第二，新模型在困難任務上會「想得更久」，輸出字數也增加。

另一個比較棘手的變化是，Opus 4.7「對指令的遵循明顯更嚴格」。意思是：過去 Opus 4.6 會自動腦補、寬鬆詮釋模糊指令，Opus 4.7 則完全照字面執行。因此，針對舊模型寫的提示詞（prompt）很可能在新模型上出現非預期結果，企業須重新檢視既有的提示詞資料庫。

技術層面，Anthropic 也移除了幾個舊版 API 參數，用舊寫法會直接回報錯誤，開發者須改寫為新格式，詳細清單見官方遷移指南。

Anthropic 新安全機制的「第一個白老鼠」

Opus 4.7 另一層意義，是 Anthropic 上週宣布 Project Glasswing（新一代 AI 安全計畫）之後的第一個測試平台。

公司最強大的 Mythos Preview 模型因能力過強、釋出範圍受限，Anthropic 選擇先在 Opus 4.7 上測試自動偵測並攔截高風險網路安全請求的防護機制，實際部署的學習成果將用於未來放寬 Mythos 等級模型的公開程度。

合法用途的資安研究者（漏洞研究、滲透測試、紅隊演練）可申請加入新設的 Cyber Verification Program，以取得較寬鬆的使用條件。

延伸閱讀：「沒有Anthropic，TPU成長從哪來？」黃仁勳坦承太晚投資Anthropic是失誤，把大訂單拱手讓人

資料來源：Anthropic、VentureBeat、Claude Migration Guide

本文初稿為AI編撰，整理．編輯/李先泰

隨著生成式 AI 工具快速普及，使用 AI 生成圖片、文案與影音素材，早已不再稀奇；真正困難的是，如何讓 AI 內容不只具備媲美真人拍攝的質感，還能精準貼合品牌語氣、商品賣點與社群傳播節奏，進一步帶動流量、轉換率與會員經營。

不過，有一家成立不到 5 年的團隊，卻憑藉著這項能力，吸引百年家電品牌、大型連鎖零售品牌、化妝品代工龍頭到政府機關等不同類型客戶合作。近期更與以創意出名的電商平台蝦皮購物共同合作。

這家隱身在眾多一線大廠背後的 AI 操盤手，正是三立集團旗下的 MarTech 公司「創造智能」。相較於單純提供 AI 工具或單點行銷服務，創造智能更像是企業的 AI 行銷整合夥伴，不只是生成 AI 影音內容，而是從行銷目標出發，運用 AI 串起從內容生成、社群導流、顧客互動到會員經營的完整行銷旅程，突破過往內容與數據各自為政的盲點，這才是它真正讓企業買單的關鍵。

除了預算大幅減少、製作效率提升外，林慧珍指出，現在很多人都可以利用 AI 工具生成圖片或影片，但真正拉開差距的，不是 AI 應用能力，而是內容本身。創造智能刻意打造一支由行銷人才與工程師組成的「混血團隊」，兼顧 AI 影音內容的製作效率與品質。

圖／創造智能

串起行銷斷點，打造 AI 一條龍整合服務

對台灣企業行銷現場的長期觀察，是創造智能跳脫單一工具走向「AI 行銷整合」模式的起點。

創造智能執行長林慧珍指出，企業行銷工作往往交由不同廠商負責，從影音內容製作、廣告投放、社群經營到會員管理，各自使用不同工具與平台，導致資料散落在各處，形成一個個看不見的行銷斷點，一旦成效不如預期，很難釐清問題究竟出在哪一個環節，是素材無法打動消費者、投放策略失準，還是會員經營沒有發揮效益。

「很多 AI 或軟體業者的想法是，用自家產品去解決客戶的問題，但我們想的不只是解決問題，而是如何讓客戶用最方便、最完整的一條龍方式達成商業目標，」林慧珍強調，也因此，創造智能成立初期便鎖定AIGC 商業影音、AI客服/虛擬人及LINE CRM三大領域，希望從內容、互動到會員經營，串起完整的行銷流程。

在行銷旅程的前端，創造智能透過自家研發的系統與深厚的行銷經驗，快速產製出 AI 影音內容，協助品牌放大聲量、吸引目標受眾；接著透過 AI 客服與 AI 虛擬人即時回應顧客需求，不受時間、地點與語言限制，提高互動與成交機率；最後再藉由 LINE CRM 將流量收斂為品牌的第一方會員資產，透過會員貼標、分群分眾、自動化推播、再行銷等機制，持續深化顧客關係，將一次性的流量轉化為持續回購的忠誠會員。

用 AI 加速內容測試，快速找到市場答案

除了串起完整的行銷流程外，創造智能還能為企業創造兩大價值，第一個是協助企業更快找到真正打動消費者的內容。

「現在很多人都可以利用 AI 工具生成圖片或影片，但真正拉開差距的，不是 AI 應用能力，而是內容本身。」林慧珍指出，創造智能刻意打造一支由行銷人才與工程師組成的「混血團隊」，兼顧 AI 影音內容的製作效率與品質。

林慧珍進一步說明，團隊許多成員原本就來自專業影音團隊，長期協助企業製作導流影片，因此在劇本企劃、分鏡設計與敘事節奏上，累積大量實戰經驗。以近期協助蝦皮購物製作 AI 短影音為例，團隊並非直接交由 AI 工具生成內容，而是先分析目標受眾的偏好，再於腳本設計時加入企劃巧思。像是刻意運用消費者熟悉的歌曲氛圍，營造「似曾相識」的共感，引發社群討論。這些對品牌語感、社群節奏與內容敘事的掌握，正是創造智能團隊多年累積的內容經驗，也是現階段 AI 難以取代的核心價值。

另一方面，團隊則負責研發系統，以滿足企業多元行銷需求。例如：創造智能自行開發的「AI 導演模板」，不僅能快速生成高度擬真的影音內容，還可以依據品牌的不同需求，快速調整畫面風格、配音語氣與敘事方式，協助品牌進行 A/B Test，找出最能吸引消費者的內容。同時，還能依照不同社群平台需求，自動延伸出不同秒數與尺寸的版本，讓同一支影片快速應用於不同投放渠道。

更重要的是，從企劃發想到完成影片，最快約一週即可完成，不僅大幅縮短製作時程，也較傳統真人拍攝節省約 4 至 6 成的成本

讓 AI 走進工作流程，從客服升級為企業數位夥伴

創造智能為企業帶來的第二個價值是，透過 AI 客服 / AI 虛擬人推動流程自動化。林慧珍認為，AI 的價值不只是回答問題，而是深入既有的工作流程，以自動化服務協助企業降低成本、提升營運效率。

舉例來說，創造智能在與百年家電品牌合作時，先以 LINE 官方帳號與會員經營為核心，透過 LINE CRM 建立會員數據基礎，依據會員的瀏覽行為、產品偏好及互動紀錄，自動完成會員標籤與分群，並透過精準推播提供更符合需求的內容。隨著會員數據逐步累積，再進一步串接 Facebook 等社群平台，讓會員經營從單一通路延伸至跨平台互動，逐步建立完整的品牌數位接觸點。

目前，雙方合作已進入第二階段，將 AI 客服真正導入企業日常營運中。從客服受理、案件分流到售後服務，整個流程皆可透過 AI 與系統自動串接完成，不僅縮短服務時間、提升案件處理效率，也讓 AI 的角色從單純的客服工具，進一步成為串聯客服、門市與售後服務的企業數位夥伴。

同樣的模式，也被延伸到 B2B 外貿場景。創造智能為某知名化妝品代工廠打造 AI Sales（AI 虛擬人），並匯入產品知識與各國出口法規，讓 AI 不僅能以多國語言即時回覆海外買家問題，更可自動完成名片蒐集、預約真人業務及商機派單等流程，不僅溝通時間由 6 個月降至 3 個月，減少 30% 以上真人處理成本，訂單成交率提升 25%-32%，

未來，AI 工具將持續演進，但企業真正需要的，始終是能協助創造商業價值的解決方案。林慧珍相信，唯有整合技術、內容與流程，並站在企業角度思考，AI 才能從工具升級為夥伴。這也是創造智能希望實踐的品牌理念──最人性化的MarTech 公司，創造更有溫度的智能夥伴。