Token燒太快?Anthropic官方給出4條Claude Code建議,這樣做降低額度消耗
Token燒太快?Anthropic官方給出4條Claude Code建議,這樣做降低額度消耗

Anthropic 近日針對「Claude Code 用量暴衝」的爭議做出說明。許多用戶反映,自己明明只是做了幾個操作,卻在短時間內用掉大量配額,甚至在升級到更昂貴的方案後,實際可用的時間與token用量反而大幅下降,引發不少不滿。

負責 Claude Code 的 Lydia Hallie 在 X 上表示,團隊這段時間蒐集了大量回報與數據後發現,發現多數 token「燒得特別快」的情況,其實來自幾種非常消耗額度的使用模式。同時,她也提出4個官方建議,希望用戶可以降低不必要消耗。

一、優先使用 Sonnet 4.6,避免 Opus 過度消耗

首先,在 Pro 方案中,Anthropic 建議預設改用 Sonnet 4.6,而不是更高階的 Opus。原因在於,Opus 的代幣消耗大約是 Sonnet 的兩倍,如果不是每一次都需要最強、最深度的推理能力,其實沒有必要全程使用 Opus,否則會很快碰到用量上限。

二、調整運算強度與延伸思考功能

其次,Claude Code 提供「運算強度」(effort level)與「延伸思考」(extended thinking)等參數,這些功能會讓模型進行更多步驟的推理,自然也會大幅增加token的使用量。官方建議,如果只是處理一般的程式輔助或輕量任務,可以適度調低運算強度,甚至在不需要深度推理時關閉延伸思考,把成本壓下來。

三、避免長時間續用巨大對話工作階段

第三,Lydia 提醒,用戶不要長期「續命」一個放著不動的大型對話。如果某個工作階段(session)已經閒置約一小時以上,且累積了龐大的上下文內容,繼續在同一個工作階段裡操作,模型每次都要重新處理這段長上下文,自然會讓一次互動就吃掉大量token。她建議改成重新開啟一個新工作階段,比較節省資源。

四、透過上下文視窗上限控制對話長度

第四,Anthropic 也在 Claude Code 中提供「上下文視窗」(context window)上限設定,例如使用環境變數(environment variable)‎CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000 來自動壓縮過長的上下文。對常態開啟大型專案、讀取多檔案的開發者來說,這可以避免模型每次都帶著過量歷史內容一起運算。

Lydia 表示,團隊已經陸續推出多項效率優化,並在產品內加入提示視窗,幫助使用者避免觸發大型提示快取失誤(large prompt cache misses)等高成本情境。她也提醒,用戶務必確認自己使用的是最新版本。如果仍然遇到「明明只是個小操作,卻吃掉不成比例的大量額度」的狀況,可以在產品內執行 ‎/feedback 指令,讓團隊進一步調查。

Gemini 的額度其實也很容易被「用法」吃掉

前面幾點是 Anthropic 自己點名的 Claude Code 省 token 方式,但實際上,現在多數訂閱型 AI 服務的額度,都跟「怎麼使用」高度相關。以 Google AI 的 Gemini 為例,如果有訂閱相關方案,也要特別留意使用方式,才不會很快把每日額度燒光。

雖然官方文件沒有直接標註「哪些行為是浪費額度」,但從使用說明與各項功能限制中,其實可以整理出幾種特別容易消耗額度的使用模式,作為規劃使用策略的參考。

一、提問本身的長度與複雜度

提示詞越長、結構越複雜,模型在背後需要投入的運算資源就越高;如果在同一個對話串中,多次追加篇幅較長、層次繁複的追問,使用量會持續往上疊加。換句話說,能用精準語句表達清楚的問題,就應該盡量避免鋪陳過多背景與枝節內容,而在單一對話中無限制延伸討論,也會讓額度消耗速度明顯加快。

二、容易被忽略的來源

一口氣上傳數量眾多的檔案,會比事先精選少量關鍵檔案更快耗用額度;而且檔案容量越大,例如長時間影片、頁數龐大的 PDF 報告,模型為了讀懂內容所需的處理資源與上下文空間也會同步增加。較佳的做法,是先預先整理,只上傳「確實需要 Gemini 協助分析」的檔案,而不是把整個資料夾原封不動丟進去。

三、本身就屬於高成本的進階功能

Deep Research 會依方案不同設定每日或每月可產生的報告數量上限;圖像、影片、音樂生成等功能,也都有明確的每日張數或曲數限制,而且官方特別提醒這些需求量高的服務,限額未來可能因為成本壓力而調整;至於 Agent、螢幕自動化、簡報生成等功能,多半也設有每日可使用次數或同時執行數量上限。

若想實際降低額度浪費,可以從幾個面向著手調整。問題設計上,盡量聚焦核心需求,優先追求「精準與清楚」,而不是刻意拉長篇幅或追求華麗文采;在對話結構上,當討論主題已經大幅轉變,或是單一對話變得過長時,適度開啟新對話,有助於減少不必要的歷史上下文負擔;在檔案管理上,只上傳實際需要分析的檔案,避免一次性投入大量冗餘資料;至於生成內容,若是為了比較模型輸出品質而重生多個版本,事先替自己訂一個合理上限,避免無節制反覆生成,也能有效控制整體用量。

延伸閱讀:用Claude Code管理100篇研究筆記!前OpenAI共同創辦人公開LLM知識庫系統,貼一段指令就能建起來
Claude送免費額度!這三種方案都能領,怎麼領?要注意什麼?教學一次看

資料來源:AnthropicGoogle

本文初稿為AI編撰,整理.編輯/黃若彤

關鍵字: #Claude #Gemini
往下滑看下一篇文章
健細胞科技攜手中興大學,推出「Cancell Insight」醫療AI 輔助決策平台,消弭醫療數位鴻溝
健細胞科技攜手中興大學,推出「Cancell Insight」醫療AI 輔助決策平台,消弭醫療數位鴻溝

為打破醫療 AI 高昂的算力與人力門檻,健細胞科技與國立中興大學資管系蔡孟勳教授團隊產學合作,正式推出「Cancell Insight 醫療 AI 模型平台」(https://insight.cancell.ai)。該平台以 SaaS(軟體即服務)模式提供一站式託管,讓先進的醫療 AI 資源不再侷限於大型醫學中心,有效消弭基層與城鄉間的醫療數位鴻溝。

軟體硬實力:打通 AI 落地最後一哩路

過去,許多由學術或生技單位開發的優秀模型因缺乏部署工具,往往淪為「實驗室孤兒」;而中小型醫院也常因 IT 建置成本對 AI 望之卻步。

健細胞科技創辦人周子堯Victor憑藉其UIUX規劃、程式開發技術背景,親自領軍AI 模型研發團隊,建構 Cancell Insight 平台。他強調,智慧醫療落地必須具備「無感化部署」、「持續性反覆運算」與「大眾化使用」三大要素。Cancell Insight 包辦了從數據清潔、標註到模型訓練與部署的底層工程,醫療機構僅需提供去識別化數據,繁瑣技術難題全由平台解決,讓 AI 真正回歸醫療「輔助」本質。

專為高壓臨床環境設計,七大核心優勢重新定義臨床運作效率

健細胞科技
Cancell Insight提供涵蓋數據清洗、精準標註、模型訓練至部署託管的一站式解決方案
圖/ 健細胞科技

【行動化與 LINE 整合】 支援 LINE 一鍵登入,醫師可直接透過官方帳號上傳檔案呼叫模型並查閱紀錄,實現真正的醫療行動化。

【隨選模型與高相容性】 提供多元 AI 模型庫供彈性訂閱。每組模型具備獨立 API Key,可無縫串接醫院現有 HIS 系統或 APP。

【團隊協作共享】 首創以「團隊」為服務單位,跨科別成員可同步共享模型權限、數據分析與歷史紀錄,提升研究協調效率。

【自動化數據處理】 支援模板批次上傳,內建自動校準系統,若格式不符將自動轉檔、去識別化與重構,大幅解放 IT 人力。

【雙模態 AI 解析】 深度整合 Dr.Cell AI (Gemini) 多模態能力,不僅輸出預測結果,更提供進階臨床解說與治療準則問答,提升決策參考價值。

堅守醫療嚴謹性,推動醫療平權與永續商業價值

在追求科技創新的同時,Cancell Insight 嚴格把關醫療安全性。平台所有 AI 模型輸出結果均定位為「臨床決策輔助」與「研究檢測輔助」,透過「非直面病患」的機制,確保所有 AI 建議皆由專業醫療人員進行最終判讀。

透過 SaaS 專案訂閱模式,Cancell Insight 成功以合理經費取代了傳統的高額硬體採購,讓中小型醫院與偏鄉診所也能具備同等的診斷實力,落實真正的醫療平權。對研發端而言,平台不僅是加速醫療科技商用化、縮短變現週期的推進器,其高度結合日常工作流的特性,更有效減少了醫護的行政負荷,緩解當前醫療量能短缺的危機。

【進階部署】啟動臨床試驗,Docker 地端部署確保資安與時效

為進一步驗證臨床效益並符合醫療機構對資訊安全的高標準,Cancell Insight 即將與各大醫療機構攜手展開「臨床研究計畫」。針對有高度資安控管需求的醫院,平台提供彈性的 Docker 地端模型部署(On-premise Deployment) 方案。第一線的醫師與護理師可直接在院內本機端快速啟動 AI 模型,安全地注入病患臨床數據後,即可「零時差」取得預測結果。此舉不僅確保了敏感醫療數據「不出院」,完美符合嚴格的醫療法規與病患隱私要求,更能實際驗證 Cancell Insight 在真實高壓的臨床場域中,能即時、有效地提供精準的決策輔助。

健細胞科技
部署輕量化模型於地端,支援離線模式使用模型,完善保護企業敏感資料
圖/ 健細胞科技

展望未來,擴大智慧醫療生態圈

透過 SaaS 模式取代高額硬體採購,Cancell Insight 致力落實醫療平權。未來,健細胞科技將以此平台為樞紐,尋求跨界深度合作:

醫療機構: 提供各級別醫院隨選即用的 AI 助理及地端部署選項。
學術/生技: 協助實驗室模型落地,並優化新藥研發與臨床試驗的數據處理效率。
商業保險: 整合 AI 評估工具,提供更精準的健康管理與風險控管服務。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓