cropped 房地產阿宥(AI房仲).png

Claude Code Token 消耗太快?6 個步驟立即省下 57%,全程實測有效(2026)

你是否發現 Claude Code 的 Token 用量總是比預期快很多?每次執行任務、讀取檔案、分析程式碼,Token 就像流水一樣消耗——不知不覺就觸碰到限制,不得不等待或付費升級。

這篇文章來自一個真實的優化過程:我在一次完整的發文任務中,系統性地找出 Token 消耗的根源,並實際執行了 6 個優化步驟,最終將固定讀取成本降低 57%,整體目標是把每次任務從 22,000 Token 壓到 15,000 Token 以內。

以下每個步驟都有具體指令和預期結果,你可以直接照著執行。



先搞懂:Token 到底在哪裡被消耗掉?

很多人以為 Token 主要花在「AI 的回答」上,但實際上最大的消耗來自輸入端——也就是每次對話開始前,系統要讀取的所有背景資料。

📌 【名詞解釋】Token
白話定義:AI 處理文字的最小單位。中文一個字約 1.5-2 個 Token,英文一個單字約 1 個 Token。
具體影響:Token 越多 = 費用越高、速度越慢、越容易達到上限。
底層邏輯:AI 每次回答前必須「讀懂」所有輸入內容,輸入越長,處理成本越高。

以一個完整的「發布文章」工作流程為例,Token 的分布大約是這樣:

典型發文任務的 Token 消耗分析(優化前)

固定讀取(每次對話都要讀):
  CLAUDE.md 系統設定       ≈  4,200 Token  ← 最容易優化
  任務一流程.md            ≈  5,000 Token
  其他任務流程.md × 4      ≈  3,000 Token
  ────────────────────────────────────
  固定讀取小計             ≈ 12,200 Token

實際工作(真正有用的部分):
  SEO 研究                 ≈  3,000 Token
  寫文章 1,800 字           ≈  6,000 Token
  WordPress 發布 + 標籤    ≈  2,000 Token
  Threads / Reddit 內容    ≈  2,000 Token
  ────────────────────────────────────
  實際工作小計             ≈ 13,000 Token

總計                       ≈ 25,000 Token

問題所在:固定讀取佔了將近一半,
而且每次對話都要重新讀一遍。

理解了這個結構,優化方向就很清楚:壓縮固定讀取、讓實際工作更精準。以下是 6 個具體步驟。



步驟一:壓縮 CLAUDE.md(立即省 57% 固定讀取)

CLAUDE.md 是 Claude Code 每次對話都會自動讀入的設定檔,相當於 AI 的「工作手冊」。問題是,很多人的 CLAUDE.md 越寫越長,塞進了大量細節說明,導致每次對話一開始就耗費大量 Token。

📌 【名詞解釋】CLAUDE.md
白話定義:放在專案根目錄的設定檔,Claude Code 每次啟動時自動讀取,用來告訴 AI「這個專案的規則是什麼」。
具體功能:設定工作原則、任務流程、禁止事項等長期規則。
底層邏輯:每次對話都全文讀入,文件越長消耗越多 Token。

如何壓縮?

原則:CLAUDE.md 只放「觸發規則和指向連結」,細節移到各任務資料夾的 流程.md

❌ 不好的 CLAUDE.md 寫法(細節全塞進來):

### 任務一:增加廣告收益
目標:每月 300 美元 AdSense 收益
步驟一:用 WebSearch 搜尋關鍵字...
步驟二:從搜尋結果選出瀏覽量高的文章...
步驟三:用 WebFetch 抓取該文章完整內容...
[繼續 10 個步驟的詳細說明]
→ 光這一個任務就 800 字,多個任務加起來 3,000+ 字

✅ 好的 CLAUDE.md 寫法(只留觸發點):

### 任務一:廣告收益
目標:AdSense $300/月,發AI教學文
詳細流程:任務一_增加廣告收益/流程.md
→ 只需 2 行,減少 95% Token 消耗

實測結果:將 CLAUDE.md 從 4,200 Token 壓縮到 1,800 Token,每次對話立刻省下 2,400 Token,相當於固定讀取成本降低 57%

執行步驟:

  1. 打開你的 CLAUDE.md 檔案
  2. 把每個任務的「詳細步驟說明」剪下,貼到對應任務資料夾的 流程.md
  3. CLAUDE.md 中的任務描述改為:任務名稱 + 一句目標 + 「詳見 xxx/流程.md」
  4. 確認 CLAUDE.md 總字數控制在 1,000 字以內(約 1,500 Token)

步驟二:在對話中段使用 /compact 指令

當一個任務執行到一半,對話歷史已經累積很長,後續操作的成本會越來越高,因為 AI 每次回答前都要「回顧」整段對話記錄。

📌 【名詞解釋】/compact 指令
白話定義:Claude Code 內建的「壓縮對話歷史」指令,把前面的長對話濃縮成一份摘要,釋放 Context 空間。
具體功能:保留工作進度和關鍵結果,清除不必要的對話細節。
底層邏輯:Context Window(上下文視窗)有上限,越早壓縮,後續操作成本越低。

最佳執行時機:發文任務中,文章寫完之後、開始發布到 WordPress 之前。這個時間點剛好是任務的分界線——寫作階段已完成,後續操作(發布、Search Console、Threads)不太需要回頭看寫作過程的細節。

在 Claude Code 終端機輸入:

/compact

→ 出現:「已將對話壓縮為摘要,繼續工作。」
→ 代表成功,後續操作的 Token 消耗大幅降低

建議時機:
  寫完文章 → 執行 /compact → 繼續發布流程
           省下約 3,000 Token

注意:/compact 執行後,AI 會「忘記」壓縮前的對話細節,但會記住重要的工作進度。如果後續需要參考先前的具體內容,建議先把重要結果記錄到檔案。

步驟三:確認 Prompt Caching 已啟用

這是 Anthropic 官方提供的功能,Claude Code 已預設啟用。原理是:同樣的內容(如 CLAUDE.md)在同一次對話中第二次讀取時,只需要原本成本的 10%。

📌 【名詞解釋】Prompt Caching(提示詞快取)
白話定義:把重複出現的輸入內容快取起來,下次讀取時直接從快取取得,不需要重新處理。
具體效果:快取讀取成本 = 一般成本的 10%,等於省了 90%。
限制:只在同一個對話 Session 內有效;快取內容需超過 2,048 Token 才會觸發。

Prompt Caching 省錢示意:

第 1 次讀取 CLAUDE.md(1,800 Token):
  → 正常消耗 1,800 Token
  → 同時建立快取

同一對話中第 2 次讀取 CLAUDE.md:
  → 只消耗 180 Token(省 90%!)

實際影響:
  同一對話中盡量不中斷,讓快取發揮作用
  ✅ 一個任務的所有步驟在同一對話完成
  ❌ 不要頻繁開新對話(快取會失效)

你需要做的事:不需要任何設定。唯一要養成的習慣是「一個任務從頭到尾在同一個對話完成」,不要中途開新對話。



步驟四:用 Python 腳本取代瀏覽器操作

每次要求 Claude Code 「開啟瀏覽器、點擊按鈕、截圖確認」,背後的 Token 消耗遠比你想像的多——AI 要讀取截圖、分析畫面、找到按鈕位置,這些視覺分析非常耗 Token。

解決方法:把重複性的操作寫成 Python 腳本,直接呼叫 API,完全跳過瀏覽器。

以「發布 WordPress 文章」為例:

瀏覽器方式(耗 Token):
  開啟 Chrome → 截圖確認 → 找到文章標題欄位
  → 輸入內容 → 截圖確認 → 找發布按鈕 → 點擊
  → 截圖確認發布成功
  消耗:約 4,000-6,000 Token

Python API 方式(省 Token):
  import wp_api
  wp_api.publish_post(title, content, slug, tags...)
  → 直接呼叫 WordPress REST API
  → 回傳文章 ID 和 URL
  消耗:約 200 Token

省下:80-95% 的操作 Token

如何建立自己的 API 腳本?

  1. 找出你最常重複操作的平台(WordPress、Notion、Google Sheets 等)
  2. 確認該平台有提供 REST API(大多數都有)
  3. 請 Claude Code 幫你寫一個對應的 Python 腳本(一次性成本)
  4. 之後所有操作都呼叫這個腳本,不再用瀏覽器

建立腳本是一次性投資,之後每次執行都大幅省 Token,任務越重複越划算。

步驟五:知識庫查詢改用 Graphify 知識圖譜

當你的知識庫(文件、程式碼、筆記)超過 20 個檔案,每次要 AI 查找資訊,它就要把所有檔案都讀一遍——Token 大量消耗。Graphify 的解法是:先建一次圖譜,之後查詢走圖譜不讀全文

沒有 Graphify(每次查詢都讀全部):
  50 個檔案 × 平均 500 Token = 25,000 Token / 次查詢

有 Graphify(查圖譜):
  圖譜摘要約 350 Token / 次查詢
  節省:(25,000 - 350) / 25,000 = 98.6%(即官方說的 71.5 倍)

安裝步驟:
  pip install graphifyy        # 安裝套件
  graphify install             # 在 Claude Code 中安裝技能
  /graphify ./你的資料夾       # 建立知識圖譜(一次性)
  /graphify query "你的問題"   # 之後查詢都走圖譜

圖譜建立一次後永久可用(存成 graph.json),除非資料夾有大量新增,否則不需要重建。

步驟六:建立 Token 消耗追蹤,每 3 次自動分析

優化的最後一步是「量化」——如果不追蹤,你永遠不知道哪個步驟最耗 Token,也無法評估每次優化的效果。

做法是建立一個簡單的 Python 追蹤腳本,每次任務完成後記錄消耗估算,累積 3 次後自動輸出分析報告。

# token_tracker.py 使用方式

# 每次任務完成後記錄(估算 Token 數):
python3 token_tracker.py log "發文_AI工具教學" 18000 "首次使用/compact"

# 累積 3 次後執行分析:
python3 token_tracker.py analyze

# 分析報告輸出:
# ============================
# 📊 Token 消耗分析報告
# ============================
# 發文次數:3 次
# 平均消耗:19,333 Token
# 最佳記錄:18,000 Token
# 與目標差距:3,333 Token (22.2%)
#
# 💡 優化建議:
#   ⚠️  平均超過 15,000 Token,建議:
#      1. 發文中段執行 /compact
#      2. 知識庫查詢改用 Graphify 圖譜
# ============================

這個追蹤機制讓「Token 優化」從感覺變成數據,你可以清楚看到每次改進的效果,也能在效率退步時立刻發現。

6 個步驟的整體效果

步驟方法省下 Token難度
步驟一CLAUDE.md 壓縮到 1,500 字以內2,400 / 次(-57%)低,只需編輯文字
步驟二文章寫完後執行 /compact3,000 / 次(-40%)低,輸入一個指令
步驟三同一對話完成所有任務步驟2,000 / 次(-20%)低,改變習慣即可
步驟四Python 腳本取代瀏覽器操作4,000 / 次(-80%)中,一次性建立腳本
步驟五Graphify 知識圖譜(知識庫 >20 個檔案)依知識庫大小低,一行安裝
步驟六token_tracker.py 追蹤分析量化優化成果低,一行指令記錄
合計約省 10,000 Token
優化前後對比:

優化前:每次發文 ≈ 25,000 Token
                    ↓
優化後:每次發文 ≈ 15,000 Token

節省幅度:40%

如果你使用 Claude Code Pro($20 / 月):
  優化後可執行的任務數量增加約 67%
  也就是同樣的費用,能做更多事

建議執行順序

以下是根據「難度 vs 效益」排列的優先順序,建議從最簡單的開始:

今天就做(5 分鐘內完成):
  ✅ 步驟三:不要中途開新對話
  ✅ 步驟二:任務中段輸入 /compact

這週做(需要 30 分鐘):
  ✅ 步驟一:整理 CLAUDE.md,細節移到流程.md
  ✅ 步驟六:建立 token_tracker.py 開始追蹤

有需要再做(視情況):
  ✅ 步驟四:常用平台建立 API 腳本(一次性投資)
  ✅ 步驟五:知識庫超過 20 個檔案後安裝 Graphify

推薦工具對比

工具功能適合場景費用
Graphify知識圖譜,省 71.5 倍查詢 Token知識庫 >20 個檔案免費
/compact 指令壓縮對話歷史長任務中段內建
Prompt Caching重複內容省 90%所有情境(自動)內建
token_tracker.py追蹤消耗、分析優化建立長期改善機制免費(自建)

結論

Token 優化不是一次性的工作,而是一個持續改進的過程。這 6 個步驟的邏輯是:先壓縮固定成本(步驟一),再優化執行效率(步驟二到五),最後建立追蹤機制確保持續改善(步驟六)。

從今天開始,試著先做步驟一(整理 CLAUDE.md)和步驟二(使用 /compact),這兩個步驟合計可以在不改變任何工作流程的情況下,降低約 20-40% 的 Token 消耗。

有任何問題或你自己發現的省 Token 技巧,歡迎在留言區分享!


📚 延伸閱讀:你可能也有興趣

➜ 查看更多 AI 數位應用與雲林房地產分析文章


❓ 常見問題 FAQ

Claude Code Token 一天大概會消耗多少?

依使用強度不同,輕度使用(每天 2-3 小時)約消耗 50,000-100,000 Token;重度使用可能超過 300,000 Token。建議用 /usage 指令查看即時消耗狀況。

哪個方法最快減少 Claude Code Token 消耗?

最立竿見影的是啟用「Prompt Caching」和使用 /compact 指令壓縮對話記錄。前者可減少重複讀取程式碼的費用,後者在對話過長時特別有效,平均可省 30-50% Token。

Claude Code 免費版有 Token 限制嗎?

有。免費版每天有使用量上限,達到上限後需等到隔天重置。Claude Pro($20/月)有更高限額,Claude Max($100/月)提供最高用量。如果常超出限制建議升級方案。


📬 不錯過任何 AI 工具教學

阿宥每週整理最實用的 AI 工具心得,都是實際用過才寫的。

Compare Listings

TitlePriceStatusTypeAreaPurposeBedroomsBathrooms

Compare