Claude Code Token 消耗太快？6 個步驟立即省下 57%，全程實測有效（2026）

你是否發現 Claude Code 的 Token 用量總是比預期快很多？每次執行任務、讀取檔案、分析程式碼，Token 就像流水一樣消耗——不知不覺就觸碰到限制，不得不等待或付費升級。

這篇文章來自一個真實的優化過程：我在一次完整的發文任務中，系統性地找出 Token 消耗的根源，並實際執行了 6 個優化步驟，最終將固定讀取成本降低 57%，整體目標是把每次任務從 22,000 Token 壓到 15,000 Token 以內。

以下每個步驟都有具體指令和預期結果，你可以直接照著執行。

先搞懂：Token 到底在哪裡被消耗掉？

很多人以為 Token 主要花在「AI 的回答」上，但實際上最大的消耗來自輸入端——也就是每次對話開始前，系統要讀取的所有背景資料。

📌 【名詞解釋】Token
白話定義：AI 處理文字的最小單位。中文一個字約 1.5-2 個 Token，英文一個單字約 1 個 Token。
具體影響：Token 越多 = 費用越高、速度越慢、越容易達到上限。
底層邏輯：AI 每次回答前必須「讀懂」所有輸入內容，輸入越長，處理成本越高。

以一個完整的「發布文章」工作流程為例，Token 的分布大約是這樣：

典型發文任務的 Token 消耗分析（優化前）

固定讀取（每次對話都要讀）：
  CLAUDE.md 系統設定       ≈  4,200 Token  ← 最容易優化
  任務一流程.md            ≈  5,000 Token
  其他任務流程.md × 4      ≈  3,000 Token
  ────────────────────────────────────
  固定讀取小計             ≈ 12,200 Token

實際工作（真正有用的部分）：
  SEO 研究                 ≈  3,000 Token
  寫文章 1,800 字           ≈  6,000 Token
  WordPress 發布 + 標籤    ≈  2,000 Token
  Threads / Reddit 內容    ≈  2,000 Token
  ────────────────────────────────────
  實際工作小計             ≈ 13,000 Token

總計                       ≈ 25,000 Token

問題所在：固定讀取佔了將近一半，
而且每次對話都要重新讀一遍。

理解了這個結構，優化方向就很清楚：壓縮固定讀取、讓實際工作更精準。以下是 6 個具體步驟。

步驟一：壓縮 CLAUDE.md（立即省 57% 固定讀取）

CLAUDE.md 是 Claude Code 每次對話都會自動讀入的設定檔，相當於 AI 的「工作手冊」。問題是，很多人的 CLAUDE.md 越寫越長，塞進了大量細節說明，導致每次對話一開始就耗費大量 Token。

📌 【名詞解釋】CLAUDE.md
白話定義：放在專案根目錄的設定檔，Claude Code 每次啟動時自動讀取，用來告訴 AI「這個專案的規則是什麼」。
具體功能：設定工作原則、任務流程、禁止事項等長期規則。
底層邏輯：每次對話都全文讀入，文件越長消耗越多 Token。

如何壓縮？

原則：CLAUDE.md 只放「觸發規則和指向連結」，細節移到各任務資料夾的 流程.md。

❌ 不好的 CLAUDE.md 寫法（細節全塞進來）：

### 任務一：增加廣告收益
目標：每月 300 美元 AdSense 收益
步驟一：用 WebSearch 搜尋關鍵字...
步驟二：從搜尋結果選出瀏覽量高的文章...
步驟三：用 WebFetch 抓取該文章完整內容...
[繼續 10 個步驟的詳細說明]
→ 光這一個任務就 800 字，多個任務加起來 3,000+ 字

✅ 好的 CLAUDE.md 寫法（只留觸發點）：

### 任務一：廣告收益
目標：AdSense $300/月，發AI教學文
詳細流程：任務一_增加廣告收益/流程.md
→ 只需 2 行，減少 95% Token 消耗

實測結果：將 CLAUDE.md 從 4,200 Token 壓縮到 1,800 Token，每次對話立刻省下 2,400 Token，相當於固定讀取成本降低 57%。

執行步驟：

打開你的 CLAUDE.md 檔案
把每個任務的「詳細步驟說明」剪下，貼到對應任務資料夾的 流程.md
CLAUDE.md 中的任務描述改為：任務名稱 + 一句目標 + 「詳見 xxx/流程.md」
確認 CLAUDE.md 總字數控制在 1,000 字以內（約 1,500 Token）

步驟二：在對話中段使用 /compact 指令

當一個任務執行到一半，對話歷史已經累積很長，後續操作的成本會越來越高，因為 AI 每次回答前都要「回顧」整段對話記錄。

📌 【名詞解釋】/compact 指令
白話定義：Claude Code 內建的「壓縮對話歷史」指令，把前面的長對話濃縮成一份摘要，釋放 Context 空間。
具體功能：保留工作進度和關鍵結果，清除不必要的對話細節。
底層邏輯：Context Window（上下文視窗）有上限，越早壓縮，後續操作成本越低。

最佳執行時機：發文任務中，文章寫完之後、開始發布到 WordPress 之前。這個時間點剛好是任務的分界線——寫作階段已完成，後續操作（發布、Search Console、Threads）不太需要回頭看寫作過程的細節。

在 Claude Code 終端機輸入：

/compact

→ 出現：「已將對話壓縮為摘要，繼續工作。」
→ 代表成功，後續操作的 Token 消耗大幅降低

建議時機：
  寫完文章 → 執行 /compact → 繼續發布流程
           省下約 3,000 Token

注意：/compact 執行後，AI 會「忘記」壓縮前的對話細節，但會記住重要的工作進度。如果後續需要參考先前的具體內容，建議先把重要結果記錄到檔案。

步驟三：確認 Prompt Caching 已啟用

這是 Anthropic 官方提供的功能，Claude Code 已預設啟用。原理是：同樣的內容（如 CLAUDE.md）在同一次對話中第二次讀取時，只需要原本成本的 10%。

📌 【名詞解釋】Prompt Caching（提示詞快取）
白話定義：把重複出現的輸入內容快取起來，下次讀取時直接從快取取得，不需要重新處理。
具體效果：快取讀取成本 = 一般成本的 10%，等於省了 90%。
限制：只在同一個對話 Session 內有效；快取內容需超過 2,048 Token 才會觸發。

Prompt Caching 省錢示意：

第 1 次讀取 CLAUDE.md（1,800 Token）：
  → 正常消耗 1,800 Token
  → 同時建立快取

同一對話中第 2 次讀取 CLAUDE.md：
  → 只消耗 180 Token（省 90%！）

實際影響：
  同一對話中盡量不中斷，讓快取發揮作用
  ✅ 一個任務的所有步驟在同一對話完成
  ❌ 不要頻繁開新對話（快取會失效）

你需要做的事：不需要任何設定。唯一要養成的習慣是「一個任務從頭到尾在同一個對話完成」，不要中途開新對話。

步驟四：用 Python 腳本取代瀏覽器操作

每次要求 Claude Code 「開啟瀏覽器、點擊按鈕、截圖確認」，背後的 Token 消耗遠比你想像的多——AI 要讀取截圖、分析畫面、找到按鈕位置，這些視覺分析非常耗 Token。

解決方法：把重複性的操作寫成 Python 腳本，直接呼叫 API，完全跳過瀏覽器。

以「發布 WordPress 文章」為例：

瀏覽器方式（耗 Token）：
  開啟 Chrome → 截圖確認 → 找到文章標題欄位
  → 輸入內容 → 截圖確認 → 找發布按鈕 → 點擊
  → 截圖確認發布成功
  消耗：約 4,000-6,000 Token

Python API 方式（省 Token）：
  import wp_api
  wp_api.publish_post(title, content, slug, tags...)
  → 直接呼叫 WordPress REST API
  → 回傳文章 ID 和 URL
  消耗：約 200 Token

省下：80-95% 的操作 Token

如何建立自己的 API 腳本？

找出你最常重複操作的平台（WordPress、Notion、Google Sheets 等）
確認該平台有提供 REST API（大多數都有）
請 Claude Code 幫你寫一個對應的 Python 腳本（一次性成本）
之後所有操作都呼叫這個腳本，不再用瀏覽器

建立腳本是一次性投資，之後每次執行都大幅省 Token，任務越重複越划算。

步驟五：知識庫查詢改用 Graphify 知識圖譜

當你的知識庫（文件、程式碼、筆記）超過 20 個檔案，每次要 AI 查找資訊，它就要把所有檔案都讀一遍——Token 大量消耗。Graphify 的解法是：先建一次圖譜，之後查詢走圖譜不讀全文。

沒有 Graphify（每次查詢都讀全部）：
  50 個檔案 × 平均 500 Token = 25,000 Token / 次查詢

有 Graphify（查圖譜）：
  圖譜摘要約 350 Token / 次查詢
  節省：(25,000 - 350) / 25,000 = 98.6%（即官方說的 71.5 倍）

安裝步驟：
  pip install graphifyy        # 安裝套件
  graphify install             # 在 Claude Code 中安裝技能
  /graphify ./你的資料夾       # 建立知識圖譜（一次性）
  /graphify query "你的問題"   # 之後查詢都走圖譜

圖譜建立一次後永久可用（存成 graph.json），除非資料夾有大量新增，否則不需要重建。

步驟六：建立 Token 消耗追蹤，每 3 次自動分析

優化的最後一步是「量化」——如果不追蹤，你永遠不知道哪個步驟最耗 Token，也無法評估每次優化的效果。

做法是建立一個簡單的 Python 追蹤腳本，每次任務完成後記錄消耗估算，累積 3 次後自動輸出分析報告。

# token_tracker.py 使用方式

# 每次任務完成後記錄（估算 Token 數）：
python3 token_tracker.py log "發文_AI工具教學" 18000 "首次使用/compact"

# 累積 3 次後執行分析：
python3 token_tracker.py analyze

# 分析報告輸出：
# ============================
# 📊 Token 消耗分析報告
# ============================
# 發文次數：3 次
# 平均消耗：19,333 Token
# 最佳記錄：18,000 Token
# 與目標差距：3,333 Token (22.2%)
#
# 💡 優化建議：
#   ⚠️  平均超過 15,000 Token，建議：
#      1. 發文中段執行 /compact
#      2. 知識庫查詢改用 Graphify 圖譜
# ============================

這個追蹤機制讓「Token 優化」從感覺變成數據，你可以清楚看到每次改進的效果，也能在效率退步時立刻發現。

6 個步驟的整體效果

步驟	方法	省下 Token	難度
步驟一	CLAUDE.md 壓縮到 1,500 字以內	2,400 / 次（-57%）	低，只需編輯文字
步驟二	文章寫完後執行 /compact	3,000 / 次（-40%）	低，輸入一個指令
步驟三	同一對話完成所有任務步驟	2,000 / 次（-20%）	低，改變習慣即可
步驟四	Python 腳本取代瀏覽器操作	4,000 / 次（-80%）	中，一次性建立腳本
步驟五	Graphify 知識圖譜（知識庫 >20 個檔案）	依知識庫大小	低，一行安裝
步驟六	token_tracker.py 追蹤分析	量化優化成果	低，一行指令記錄
合計		約省 10,000 Token

優化前後對比：

優化前：每次發文 ≈ 25,000 Token
                    ↓
優化後：每次發文 ≈ 15,000 Token

節省幅度：40%

如果你使用 Claude Code Pro（$20 / 月）：
  優化後可執行的任務數量增加約 67%
  也就是同樣的費用，能做更多事

建議執行順序

以下是根據「難度 vs 效益」排列的優先順序，建議從最簡單的開始：

今天就做（5 分鐘內完成）：
  ✅ 步驟三：不要中途開新對話
  ✅ 步驟二：任務中段輸入 /compact

這週做（需要 30 分鐘）：
  ✅ 步驟一：整理 CLAUDE.md，細節移到流程.md
  ✅ 步驟六：建立 token_tracker.py 開始追蹤

有需要再做（視情況）：
  ✅ 步驟四：常用平台建立 API 腳本（一次性投資）
  ✅ 步驟五：知識庫超過 20 個檔案後安裝 Graphify

工具	功能	適合場景	費用
Graphify	知識圖譜，省 71.5 倍查詢 Token	知識庫 >20 個檔案	免費
/compact 指令	壓縮對話歷史	長任務中段	內建
Prompt Caching	重複內容省 90%	所有情境（自動）	內建
token_tracker.py	追蹤消耗、分析優化	建立長期改善機制	免費（自建）

結論

Token 優化不是一次性的工作，而是一個持續改進的過程。這 6 個步驟的邏輯是：先壓縮固定成本（步驟一），再優化執行效率（步驟二到五），最後建立追蹤機制確保持續改善（步驟六）。

從今天開始，試著先做步驟一（整理 CLAUDE.md）和步驟二（使用 /compact），這兩個步驟合計可以在不改變任何工作流程的情況下，降低約 20-40% 的 Token 消耗。

有任何問題或你自己發現的省 Token 技巧，歡迎在留言區分享！

📚 延伸閱讀：你可能也有興趣

➜ 查看更多 AI 數位應用與雲林房地產分析文章

❓ 常見問題 FAQ

Claude Code Token 一天大概會消耗多少？

依使用強度不同，輕度使用（每天 2-3 小時）約消耗 50,000-100,000 Token；重度使用可能超過 300,000 Token。建議用 /usage 指令查看即時消耗狀況。

哪個方法最快減少 Claude Code Token 消耗？

最立竿見影的是啟用「Prompt Caching」和使用 /compact 指令壓縮對話記錄。前者可減少重複讀取程式碼的費用，後者在對話過長時特別有效，平均可省 30-50% Token。

Claude Code 免費版有 Token 限制嗎？

有。免費版每天有使用量上限，達到上限後需等到隔天重置。Claude Pro（$20/月）有更高限額，Claude Max（$100/月）提供最高用量。如果常超出限制建議升級方案。

📬 不錯過任何 AI 工具教學

阿宥每週整理最實用的 AI 工具心得，都是實際用過才寫的。

🔔 RSS 訂閱（Feedly / NetNewsWire）

🧵 追蹤 Threads

📬 不錯過任何 AI 工具教學

阿宥每週整理最實用的 AI 工具心得，都是實際用過才寫的。

或追蹤 Threads @ayu.ai.house

🤖 購買 Claude Code 記憶與技能套件，讓 Claude Code 記住你

解壓縮 → 拖入 Claude Code → 輸入序號，5 分鐘完成安裝

✅ 套件內含功能：

🧠 雙層記憶系統（跨對話長期記憶，越用越懂你）

🔄 智慧規則載入（自動選最相關規則，省最高 89% Token）

📊 品質評估閘門（文章／程式碼送出前自動評分把關）

⚡ 自動學習任務框架（自動記錯誤→優化流程→持續進化）

🛠️ 11 個內建技能（知識餵養・網頁爬取・每日收尾等）

☁️ Google Drive 雲端同步引導

🔒 單一裝置授權，資料不外傳

原價 NT$1,288

NT$600

前 100 名限定優惠價格

加 LINE 聯繫購買 → 0906707964
了解更多 →

每組序號第一裝置限一用・不可轉讓或分享

Claude Code Token 消耗太快？6 個步驟立即省下 57%，全程實測有效（2026）

先搞懂：Token 到底在哪裡被消耗掉？

步驟一：壓縮 CLAUDE.md（立即省 57% 固定讀取）

如何壓縮？

步驟二：在對話中段使用 /compact 指令

步驟三：確認 Prompt Caching 已啟用

步驟四：用 Python 腳本取代瀏覽器操作

步驟五：知識庫查詢改用 Graphify 知識圖譜

步驟六：建立 Token 消耗追蹤，每 3 次自動分析

6 個步驟的整體效果

建議執行順序

推薦工具對比

結論

📚 延伸閱讀：你可能也有興趣

❓ 常見問題 FAQ

📬 不錯過任何 AI 工具教學

Compare Listings

Compare