你是否發現 Claude Code 的 Token 用量總是比預期快很多?每次執行任務、讀取檔案、分析程式碼,Token 就像流水一樣消耗——不知不覺就觸碰到限制,不得不等待或付費升級。
這篇文章來自一個真實的優化過程:我在一次完整的發文任務中,系統性地找出 Token 消耗的根源,並實際執行了 6 個優化步驟,最終將固定讀取成本降低 57%,整體目標是把每次任務從 22,000 Token 壓到 15,000 Token 以內。
以下每個步驟都有具體指令和預期結果,你可以直接照著執行。
先搞懂:Token 到底在哪裡被消耗掉?
很多人以為 Token 主要花在「AI 的回答」上,但實際上最大的消耗來自輸入端——也就是每次對話開始前,系統要讀取的所有背景資料。
📌 【名詞解釋】Token
白話定義:AI 處理文字的最小單位。中文一個字約 1.5-2 個 Token,英文一個單字約 1 個 Token。
具體影響:Token 越多 = 費用越高、速度越慢、越容易達到上限。
底層邏輯:AI 每次回答前必須「讀懂」所有輸入內容,輸入越長,處理成本越高。
以一個完整的「發布文章」工作流程為例,Token 的分布大約是這樣:
典型發文任務的 Token 消耗分析(優化前)
固定讀取(每次對話都要讀):
CLAUDE.md 系統設定 ≈ 4,200 Token ← 最容易優化
任務一流程.md ≈ 5,000 Token
其他任務流程.md × 4 ≈ 3,000 Token
────────────────────────────────────
固定讀取小計 ≈ 12,200 Token
實際工作(真正有用的部分):
SEO 研究 ≈ 3,000 Token
寫文章 1,800 字 ≈ 6,000 Token
WordPress 發布 + 標籤 ≈ 2,000 Token
Threads / Reddit 內容 ≈ 2,000 Token
────────────────────────────────────
實際工作小計 ≈ 13,000 Token
總計 ≈ 25,000 Token
問題所在:固定讀取佔了將近一半,
而且每次對話都要重新讀一遍。理解了這個結構,優化方向就很清楚:壓縮固定讀取、讓實際工作更精準。以下是 6 個具體步驟。
步驟一:壓縮 CLAUDE.md(立即省 57% 固定讀取)
CLAUDE.md 是 Claude Code 每次對話都會自動讀入的設定檔,相當於 AI 的「工作手冊」。問題是,很多人的 CLAUDE.md 越寫越長,塞進了大量細節說明,導致每次對話一開始就耗費大量 Token。
📌 【名詞解釋】CLAUDE.md
白話定義:放在專案根目錄的設定檔,Claude Code 每次啟動時自動讀取,用來告訴 AI「這個專案的規則是什麼」。
具體功能:設定工作原則、任務流程、禁止事項等長期規則。
底層邏輯:每次對話都全文讀入,文件越長消耗越多 Token。
如何壓縮?
原則:CLAUDE.md 只放「觸發規則和指向連結」,細節移到各任務資料夾的 流程.md。
❌ 不好的 CLAUDE.md 寫法(細節全塞進來):
### 任務一:增加廣告收益
目標:每月 300 美元 AdSense 收益
步驟一:用 WebSearch 搜尋關鍵字...
步驟二:從搜尋結果選出瀏覽量高的文章...
步驟三:用 WebFetch 抓取該文章完整內容...
[繼續 10 個步驟的詳細說明]
→ 光這一個任務就 800 字,多個任務加起來 3,000+ 字
✅ 好的 CLAUDE.md 寫法(只留觸發點):
### 任務一:廣告收益
目標:AdSense $300/月,發AI教學文
詳細流程:任務一_增加廣告收益/流程.md
→ 只需 2 行,減少 95% Token 消耗實測結果:將 CLAUDE.md 從 4,200 Token 壓縮到 1,800 Token,每次對話立刻省下 2,400 Token,相當於固定讀取成本降低 57%。
執行步驟:
- 打開你的 CLAUDE.md 檔案
- 把每個任務的「詳細步驟說明」剪下,貼到對應任務資料夾的
流程.md - CLAUDE.md 中的任務描述改為:任務名稱 + 一句目標 + 「詳見 xxx/流程.md」
- 確認 CLAUDE.md 總字數控制在 1,000 字以內(約 1,500 Token)
步驟二:在對話中段使用 /compact 指令
當一個任務執行到一半,對話歷史已經累積很長,後續操作的成本會越來越高,因為 AI 每次回答前都要「回顧」整段對話記錄。
📌 【名詞解釋】/compact 指令
白話定義:Claude Code 內建的「壓縮對話歷史」指令,把前面的長對話濃縮成一份摘要,釋放 Context 空間。
具體功能:保留工作進度和關鍵結果,清除不必要的對話細節。
底層邏輯:Context Window(上下文視窗)有上限,越早壓縮,後續操作成本越低。
最佳執行時機:發文任務中,文章寫完之後、開始發布到 WordPress 之前。這個時間點剛好是任務的分界線——寫作階段已完成,後續操作(發布、Search Console、Threads)不太需要回頭看寫作過程的細節。
在 Claude Code 終端機輸入:
/compact
→ 出現:「已將對話壓縮為摘要,繼續工作。」
→ 代表成功,後續操作的 Token 消耗大幅降低
建議時機:
寫完文章 → 執行 /compact → 繼續發布流程
省下約 3,000 Token注意:/compact 執行後,AI 會「忘記」壓縮前的對話細節,但會記住重要的工作進度。如果後續需要參考先前的具體內容,建議先把重要結果記錄到檔案。
步驟三:確認 Prompt Caching 已啟用
這是 Anthropic 官方提供的功能,Claude Code 已預設啟用。原理是:同樣的內容(如 CLAUDE.md)在同一次對話中第二次讀取時,只需要原本成本的 10%。
📌 【名詞解釋】Prompt Caching(提示詞快取)
白話定義:把重複出現的輸入內容快取起來,下次讀取時直接從快取取得,不需要重新處理。
具體效果:快取讀取成本 = 一般成本的 10%,等於省了 90%。
限制:只在同一個對話 Session 內有效;快取內容需超過 2,048 Token 才會觸發。
Prompt Caching 省錢示意:
第 1 次讀取 CLAUDE.md(1,800 Token):
→ 正常消耗 1,800 Token
→ 同時建立快取
同一對話中第 2 次讀取 CLAUDE.md:
→ 只消耗 180 Token(省 90%!)
實際影響:
同一對話中盡量不中斷,讓快取發揮作用
✅ 一個任務的所有步驟在同一對話完成
❌ 不要頻繁開新對話(快取會失效)你需要做的事:不需要任何設定。唯一要養成的習慣是「一個任務從頭到尾在同一個對話完成」,不要中途開新對話。
步驟四:用 Python 腳本取代瀏覽器操作
每次要求 Claude Code 「開啟瀏覽器、點擊按鈕、截圖確認」,背後的 Token 消耗遠比你想像的多——AI 要讀取截圖、分析畫面、找到按鈕位置,這些視覺分析非常耗 Token。
解決方法:把重複性的操作寫成 Python 腳本,直接呼叫 API,完全跳過瀏覽器。
以「發布 WordPress 文章」為例:
瀏覽器方式(耗 Token):
開啟 Chrome → 截圖確認 → 找到文章標題欄位
→ 輸入內容 → 截圖確認 → 找發布按鈕 → 點擊
→ 截圖確認發布成功
消耗:約 4,000-6,000 Token
Python API 方式(省 Token):
import wp_api
wp_api.publish_post(title, content, slug, tags...)
→ 直接呼叫 WordPress REST API
→ 回傳文章 ID 和 URL
消耗:約 200 Token
省下:80-95% 的操作 Token如何建立自己的 API 腳本?
- 找出你最常重複操作的平台(WordPress、Notion、Google Sheets 等)
- 確認該平台有提供 REST API(大多數都有)
- 請 Claude Code 幫你寫一個對應的 Python 腳本(一次性成本)
- 之後所有操作都呼叫這個腳本,不再用瀏覽器
建立腳本是一次性投資,之後每次執行都大幅省 Token,任務越重複越划算。
步驟五:知識庫查詢改用 Graphify 知識圖譜
當你的知識庫(文件、程式碼、筆記)超過 20 個檔案,每次要 AI 查找資訊,它就要把所有檔案都讀一遍——Token 大量消耗。Graphify 的解法是:先建一次圖譜,之後查詢走圖譜不讀全文。
沒有 Graphify(每次查詢都讀全部):
50 個檔案 × 平均 500 Token = 25,000 Token / 次查詢
有 Graphify(查圖譜):
圖譜摘要約 350 Token / 次查詢
節省:(25,000 - 350) / 25,000 = 98.6%(即官方說的 71.5 倍)
安裝步驟:
pip install graphifyy # 安裝套件
graphify install # 在 Claude Code 中安裝技能
/graphify ./你的資料夾 # 建立知識圖譜(一次性)
/graphify query "你的問題" # 之後查詢都走圖譜圖譜建立一次後永久可用(存成 graph.json),除非資料夾有大量新增,否則不需要重建。
步驟六:建立 Token 消耗追蹤,每 3 次自動分析
優化的最後一步是「量化」——如果不追蹤,你永遠不知道哪個步驟最耗 Token,也無法評估每次優化的效果。
做法是建立一個簡單的 Python 追蹤腳本,每次任務完成後記錄消耗估算,累積 3 次後自動輸出分析報告。
# token_tracker.py 使用方式
# 每次任務完成後記錄(估算 Token 數):
python3 token_tracker.py log "發文_AI工具教學" 18000 "首次使用/compact"
# 累積 3 次後執行分析:
python3 token_tracker.py analyze
# 分析報告輸出:
# ============================
# 📊 Token 消耗分析報告
# ============================
# 發文次數:3 次
# 平均消耗:19,333 Token
# 最佳記錄:18,000 Token
# 與目標差距:3,333 Token (22.2%)
#
# 💡 優化建議:
# ⚠️ 平均超過 15,000 Token,建議:
# 1. 發文中段執行 /compact
# 2. 知識庫查詢改用 Graphify 圖譜
# ============================這個追蹤機制讓「Token 優化」從感覺變成數據,你可以清楚看到每次改進的效果,也能在效率退步時立刻發現。
6 個步驟的整體效果
| 步驟 | 方法 | 省下 Token | 難度 |
|---|---|---|---|
| 步驟一 | CLAUDE.md 壓縮到 1,500 字以內 | 2,400 / 次(-57%) | 低,只需編輯文字 |
| 步驟二 | 文章寫完後執行 /compact | 3,000 / 次(-40%) | 低,輸入一個指令 |
| 步驟三 | 同一對話完成所有任務步驟 | 2,000 / 次(-20%) | 低,改變習慣即可 |
| 步驟四 | Python 腳本取代瀏覽器操作 | 4,000 / 次(-80%) | 中,一次性建立腳本 |
| 步驟五 | Graphify 知識圖譜(知識庫 >20 個檔案) | 依知識庫大小 | 低,一行安裝 |
| 步驟六 | token_tracker.py 追蹤分析 | 量化優化成果 | 低,一行指令記錄 |
| 合計 | 約省 10,000 Token |
優化前後對比:
優化前:每次發文 ≈ 25,000 Token
↓
優化後:每次發文 ≈ 15,000 Token
節省幅度:40%
如果你使用 Claude Code Pro($20 / 月):
優化後可執行的任務數量增加約 67%
也就是同樣的費用,能做更多事建議執行順序
以下是根據「難度 vs 效益」排列的優先順序,建議從最簡單的開始:
今天就做(5 分鐘內完成):
✅ 步驟三:不要中途開新對話
✅ 步驟二:任務中段輸入 /compact
這週做(需要 30 分鐘):
✅ 步驟一:整理 CLAUDE.md,細節移到流程.md
✅ 步驟六:建立 token_tracker.py 開始追蹤
有需要再做(視情況):
✅ 步驟四:常用平台建立 API 腳本(一次性投資)
✅ 步驟五:知識庫超過 20 個檔案後安裝 Graphify推薦工具對比
| 工具 | 功能 | 適合場景 | 費用 |
|---|---|---|---|
| Graphify | 知識圖譜,省 71.5 倍查詢 Token | 知識庫 >20 個檔案 | 免費 |
| /compact 指令 | 壓縮對話歷史 | 長任務中段 | 內建 |
| Prompt Caching | 重複內容省 90% | 所有情境(自動) | 內建 |
| token_tracker.py | 追蹤消耗、分析優化 | 建立長期改善機制 | 免費(自建) |
結論
Token 優化不是一次性的工作,而是一個持續改進的過程。這 6 個步驟的邏輯是:先壓縮固定成本(步驟一),再優化執行效率(步驟二到五),最後建立追蹤機制確保持續改善(步驟六)。
從今天開始,試著先做步驟一(整理 CLAUDE.md)和步驟二(使用 /compact),這兩個步驟合計可以在不改變任何工作流程的情況下,降低約 20-40% 的 Token 消耗。
有任何問題或你自己發現的省 Token 技巧,歡迎在留言區分享!
📚 延伸閱讀:你可能也有興趣
- Claude Code 指令完整攻略:50+ 斜線指令、快捷鍵與 CLI 旗標,效率翻倍秘技(2026)
- Claude Code 長期記憶怎麼設定?Memvid + Hooks 讓 AI 自動記住你,零基礎完整教學(2026)
- Claude Code 怎麼連接 NotebookLM?MCP 安裝完整教學,自動生成影片總覽(2026)
- 知識圖譜工具 Graphify 完整教學:讓 AI 自動看懂整個程式庫,省 71 倍 Token
❓ 常見問題 FAQ
Claude Code Token 一天大概會消耗多少?
依使用強度不同,輕度使用(每天 2-3 小時)約消耗 50,000-100,000 Token;重度使用可能超過 300,000 Token。建議用 /usage 指令查看即時消耗狀況。
哪個方法最快減少 Claude Code Token 消耗?
最立竿見影的是啟用「Prompt Caching」和使用 /compact 指令壓縮對話記錄。前者可減少重複讀取程式碼的費用,後者在對話過長時特別有效,平均可省 30-50% Token。
Claude Code 免費版有 Token 限制嗎?
有。免費版每天有使用量上限,達到上限後需等到隔天重置。Claude Pro($20/月)有更高限額,Claude Max($100/月)提供最高用量。如果常超出限制建議升級方案。
📬 不錯過任何 AI 工具教學
阿宥每週整理最實用的 AI 工具心得,都是實際用過才寫的。

.png)