多數用戶在使用 Claude 時,往往會碰到用量上限的問題,這時候大家的直覺反應是升級付費方案。
X 帳號 Ruben Hassid 近日發表的一篇貼文,提出了相反的觀點:額度用完不是方案問題,是操作習慣問題。這讓不少仰賴 Claude 工作的用戶重新審視自己的使用方式。
Ruben Hassid 是「How to AI」電子報的作者,他定期撰寫 AI 運用的相關內容並分享在自己的 X 帳號以及 LinkedIn 上。他整理出 9 個調整方式,幫助 Claude 使用者使用上有效縮減 token。
為什麼「習慣」比「方案」更重要?
Claude 計費的核心單位是 token,簡單來說,就是模型處理的文字量。你送進去的每一個字、每一張上傳的文件、每次對話的歷史紀錄,都在消耗 token。
問題在於:大多數人的壞習慣,等同於在每次對話裡反覆「重載」大量資訊。把同一份合約上傳五次、發現說錯就重新送一則訊息、開著用不到的網路搜尋功能讓它在背景待命,而這些行為都會對 token 造成不必要的消耗。在這樣的使用習慣下,升級方案只是把上限拉高,問題的根源並沒有解決。
4個情境、9個技巧,教你減少 token 消耗
第一種:壓縮輸入,減少每次對話的起始負擔
把 PDF 轉成 .md 再上傳
操作步驟:開一份 Google Doc,把 PDF 內容貼進去,下載時選擇 .md 格式,再上傳給 Claude。
Hassid 給出的數字直接:一份 15 頁的 PDF 約消耗 45,000 tokens;同樣內容存成 .md 檔,只需要約 2,000 tokens。這是因為 PDF 格式本身帶有大量排版標記,模型需要一起解析;而純文字的 Markdown 內容更純粹。
用 Projects 取代重複上傳
進入 Claude 的 Projects 功能,建立一個專案,把常用文件(合約範本、公司介紹、風格指南)上傳一次,這樣一來,專案內的每個新對話都能直接讀取這些文件,不需要每次重傳。對於習慣把同一份文件貼進五個不同對話視窗的用戶,這一個改變就能省下大量重複消耗。
第二種:改變提問方式,讓對話更有效率
讓 Claude 先問你
與其花時間寫一段 500 字的詳細 prompt,不如這樣提問:
「我想要 [任務描述] 以達成 [成功條件]。在你開始之前,用 AskUserQuestion 向我提問。」
Claude 會主動問使用者問題,只需要點選或簡短回答即可。這當中的邏輯是,一段 500 字的 prompt 就是 500 個 token,但點選回答幾乎不耗費任何額度。
善用編輯訊息,避免重新發送
寫完一則訊息後發現說錯,直覺是再送一則「等等,我的意思是……」,這會讓整段對話歷史再走一遍,等於雙倍計費。
正確做法是,點選「Edit」修改上一則訊息,再傳送,這樣 Claude 會從原本的問題重新生成,不會堆疊新的上下文。
一次發三個任務
「幫我摘要這份報告」→ 送出 →「列出三個關鍵點」→ 送出 →「幫我寫一個標題」→ 送出。
三則訊息,就是三次完整的上下文重載。把三個需求合併成一則訊息送出,只重載一次。這不只省時間,還能節省兩次等於白燒的 token。
第三種:管理長對話,避免歷史紀錄越堆越重
先規劃,再執行
Anthropic 證實:在 Cowork 裡叫 Claude 直接幫忙「產生檔案」(例如試算表、簡報、文件),比普通聊天訊息更吃用量。所以不要一開始就開 Cowork 說「幫我做一個財務模型」。
正確順序是:先在 Claude Chat 裡,把需求想清楚。包括:討論要做什麼檔案、章節結構要怎麼切、每個欄位或段落的假設是什麼,反覆確認到自己滿意為止。
當架構、假設都確定之後,再把 Chat 的最終回答整段複製,貼到 Cowork ,下指令「照這個規劃,幫我做出這個檔案」。
- 便宜的 Chat 負責「一起討論、規劃、想清楚」;
- 貴的 Cowork 只在最後一步「負責照計畫做出成品」。
這樣就不會為了邊想邊改、邊試邊調,在 Cowork 裡瘋狂燒用量。
每 15 則訊息做一次壓縮
當一段對話已經很長,在繼續之前先這樣提示:
「把這整段對話摘要成一份簡報。」
把摘要內容複製起來,開一個新對話,把摘要貼為第一則訊息,再繼續工作。這個動作可以把 105,000 tokens 的對話歷史壓縮成約 500 tokens 。
第四種:選對模型與功能設定
根據任務難度切換模型
打開模型選擇下拉選單。如果任務在 30 秒內就能完成(摘要、翻譯、簡單問答),選 Haiku 或 Sonnet;只有需要深度、多步驟推理的工作才動用 Opus。
如果你還不確定從哪裡開始,不妨先用 Haiku 4.5 跑遍你的日常任務,確認哪些環節覺得「不夠用」,再針對性升級到 Sonnet 或 Opus。如此,也能避免因「選錯模型」而帶來的高成本及低效率。
關掉沒在用的功能
打開工具面板,把這次任務用不到的全部關掉:Web Search、外部連接器、Extended Thinking。這些功能開著不代表沒在消耗,它們即使沒被呼叫,也會佔用處理資源。每次對話前花 10 秒確認,只開這次真正需要的功能。
這 9 個技巧有一個共同的前提:你知道自己在做什麼。
PDF 轉 .md 省 token 沒錯,但如果原始 PDF 包含圖表或非文字資訊,轉換後這些資訊會直接消失,Claude 也看不到。用 Projects 集中管理文件是好習慣,但要確保上傳的是有效的最新版本,舊版本堆在裡面同樣佔用空間。
「每 15 則摘要一次」是個規則,但摘要本身也會有資訊損耗,如果對話中有非常具體的細節需要後續引用,摘要未必能完整保留。
此外,部分技巧(如 Projects、Cowork 的操作流程)仍需要用戶具備基本的 Claude 介面操作能力,對工具不熟悉的使用者初期可能需要一段上手時間。
在每一次上傳問題前先思考一下怎麼調整詢問或使用方式,用量上限就能被更好被避免。
延伸閱讀:Claude Design進階用法|6步驟產出專業簡報,Slider微調、Comment修改一次學會
不會Claude Code也能上手!用Projects打造AI工作流,5步驟養成長期記憶助理
資料來源:Ruben Hassid on X
本文初稿為AI編撰,整理.編輯/黃若彤
