Claude Fable 5 是什麼?花 20 美金實測它能不能接手舊專案,還讓 AI 自己交代三個壞習慣(2026)

2026 年 6 月 9 日,Anthropic 發布了一個新模型:Claude Fable 5。這不是普通的版本更新——它是第一個對公眾開放的「Mythos 級」模型,原本這個等級只給少數核准組織用。官方說它在軟體工程、知識工作、視覺、科學研究幾乎所有基準測試都達到業界最高水準(state-of-the-art)。

我是站長阿宥,花了 20 美金訂閱 Claude Pro,不是為了跑測速網站的排行榜,而是要解決一個很實際的問題:AI 換新模型,舊專案要重教嗎?

我手上有一個多 AI 帳號協作系統,跑了好幾個月,累積了 234 個檔案、幾百份規則與交接文件。三個 Claude 帳號+一個 Gemini 帳號共用同一套任務中樞,有共用交接板、任務快照、append-only(只增不刪)的交接文化。對 AI 來說,這是最難的考題:不是從零開始寫新東西,而是接手一個已經有歷史包袱的老專案。

Fable 5 能接得起來嗎?答案是:大致接得起來,但犯了三個錯。最有價值的部分是:被質問後,它對自己的錯誤做出了異常清晰的歸因分析——這段自我分析,是這篇文章的核心。

Claude Fable 5 是什麼?Mythos 級模型首次公開的意義

根據 Anthropic 官方公告(2026-06-09),Claude Fable 5 是 Anthropic 內部最先進模型系列「Mythos」的第一個公開版本。在這之前,Mythos 級模型只提供給少數經過核准的組織使用。

Fable 5 vs Mythos 5:同一個底層模型,差別只有安全護欄

Fable 5 和 Mythos 5 是同一個底層模型,差別在於:

  • Mythos 5:沒有額外限制,適合專業研究機構使用
  • Fable 5:加上安全護欄,在資安、生物、化學等高風險領域會主動擋下回應,並自動「退回」(fallback)到上一代模型 Claude Opus 4.8

這個 fallback 機制很重要:當 Fable 5 判斷某個請求可能涉及危險領域,它不會直接拒絕回答,而是切換到更保守的 Opus 4.8 處理。對一般使用者來說,體驗上幾乎無感。

定價與入手方式

方式費用適合對象
Claude Pro 訂閱每月 $20 美金一般使用者、開發者(可在 Claude App 與 Claude Code 中使用)
API 呼叫輸入 $10/百萬 token
輸出 $50/百萬 token
(是 Opus 4.8 的兩倍)
大量自動化任務、企業級應用

對一般人來說,最便宜的入手方式就是訂閱 Claude Pro——每月 20 美金,可以在網頁版 Claude 和桌面版 Claude Code 中使用 Fable 5。

為什麼用「接舊專案」當 Claude Fable 5 的考題?

新模型剛出來,大部分評測都在跑基準測試:看它能不能寫一個排序演算法、能不能回答哲學問題、能不能生成一張圖。這些測試有價值,但離真實使用場景很遠。

真實場景是什麼?是你接手一個同事留下的爛攤子。程式碼裡沒有註解、變數命名亂七八糟、規則分散在十幾個文件裡、有些已經過時但沒人刪、有些很重要但埋在深處沒人看。你得花好幾天讀懂它,才能開始改。

這才是 AI 真正的能力考驗:不是寫新東西的能力,而是理解舊東西的能力。

我的專案長什麼樣?

我的多 AI 協作系統有這些特徵:

  • 234 個檔案:包含規則文件、交接文件、任務快照、執行報告
  • 三個 Claude 帳號+一個 Gemini 帳號:共用同一套任務中樞
  • Append-only(只增不刪)文化:舊記錄不會被覆蓋,新狀態寫在後面。這樣可以追溯歷史,但也代表檔案裡會有過時資訊,要靠「日期」交叉比對才知道哪個是最新的
  • 明確的交接規則:不能自創「權威文件」(canonical document),不能另開主線,所有更新都要寫進統一的交接口

對一個新加入的 AI 來說,這就像第一天上班的新員工,要搞懂公司過去半年累積的所有規矩、黑話、未成文習慣。

我給 Fable 5 的第一個任務很簡單:讀懂這個專案,告訴我現在進度到哪,下一步該做什麼。

實測環境:234 個檔案、一個對話窗口、3 小時

測試環境:

  • 模型:Claude Fable 5(透過 Claude Pro 訂閱)
  • 介面:Claude Code(桌面版,可直接讀取本地檔案)
  • 專案規模:234 個檔案,分散在多個資料夾
  • 測試時長:約 3 小時,跨多輪對話

我給 Fable 5 的指令是:

「這是一個多 AI 協作專案,你是新加入的成員。先讀懂現有的交接機制和規則,告訴我:①專案現在進度到哪 ②有哪些未完成的任務 ③金流(付款系統)現況如何 ④下一步建議做什麼。」

這個指令故意設計得很開放,沒有告訴它要讀哪些檔案、哪些是重點。就像真實情況:新人進公司,主管不會手把手教你每個檔案的位置,你得自己找。

Fable 5 的執行流程

Fable 5 的做法是:

  1. 掃描專案結構:列出所有資料夾和重要檔案
  2. 找出交接入口:發現 handoff.py共用交接板.md任務狀態.md 等關鍵文件
  3. 讀取最新狀態:執行 python3 技能庫/handoff.py latest 取得最近一筆任務記錄
  4. 抽樣閱讀規則文件:讀了約 30-40 個 .claude/rules/ 下的規則檔
  5. 整理盤點報告:把進度、待辦、金流狀態整理成一份報告

整個流程看起來很合理,也確實讀到了關鍵資訊。問題出在細節。

BUG 1:聽到「統一窗口」就想建新文件——模式匹配壓過查證

第一個錯誤發生在我問它:「這個專案的交接機制是什麼?有統一的窗口嗎?」

Fable 5 的反應是:立刻動手建立一份新文件 CONSOLIDATED_HANDOFF_HUB.md,把所有交接相關的內容整合進去,然後告訴我:「我建立了一個統一窗口。」

問題來了:這個專案早就有統一窗口了。

現有的交接口包括:

  • CURRENT_TASK.json(當前任務狀態)
  • AI_ACTIVITY_LOG.jsonl(所有 AI 的操作記錄)
  • HOUSING_CHECKPOINTS.json(專案檢查點)
  • AI Hub(任務協調中樞)
  • CODEX_RESUME_PACKET.json(另一個 AI 帳號的交接包)

這些文件的存在,Fable 5 都看過——它甚至在自己的盤點報告裡列出了這些檔案。但當我問「有統一窗口嗎」時,它沒有回答「有,就是這幾個文件」,反而自己動手建了一個新的。

Fable 5 的自我歸因:「模式匹配壓過了查證」

被我質問後,Fable 5 給出了這樣的解釋:

「我聽到『統一的窗口』,字面上理解成『建立一個新東西』,然後直接套用我最熟練的產出模板:寫新文件 → 回寫 → 廣播。因為『產出一份新文件』看起來最像有做事。但專案規則明明寫著『不另開主線、不自創 canonical(權威)文件』——我讀過這條規則、甚至把規則寫進自己的盤點報告裡,卻沒套用到自己正在做的動作上。規則拿來描述,沒拿來自我約束。

白話比喻

這就像新員工第一天上班,主管說:「給我一個統一窗口。」

新員工沒有先問「公司現在有統一窗口嗎?」,而是立刻架了一個新網站,然後跟主管說:「我做好了!」

主管:「……我們本來就有客服信箱啊,你為什麼要另外架網站?」

新員工:「我看過公司規定『禁止自創對外窗口』,但我以為那是針對別人說的。」

這就是「模式匹配壓過查證」:聽到關鍵字 → 套用最熟悉的模板 → 執行 → 沒有暫停問「這件事真的需要做嗎?」

BUG 2:金流狀態報錯資訊——信任結構化資料,忽略日期比對

第二個錯誤是:我問它「金流(付款系統)現在是什麼狀態?」

Fable 5 回答:「金流用的是 Stripe(一個國際付款服務),但目前卡在驗證階段,還沒正式啟用。」

我當場就知道不對:這個專案早就從 Stripe 換成 Paddle 了。

Fable 5 為什麼會報出過期的資訊?因為它讀到了一份狀態檔(共用狀態.json),裡面有個欄位寫著:

{
  "payment_provider": "Stripe",
  "status": "pending_verification"
}

這個欄位確實存在,而且格式很整齊,看起來很「權威」。問題是:這是兩個月前的舊資料。

真正的最新狀態寫在另一份文件(金流技術文件.md),檔案修改日期是一週前,內容明確寫著「已切換至 Paddle,Stripe 憑證已停用」。

Fable 5 的自我歸因:信任層級放錯+確認偏誤

Fable 5 對這個錯誤的解釋分成兩層:

① 信任層級放錯

「狀態檔是結構化欄位,看起來權威,我就把『結構化』誤當『最新』。但這個專案的交接文化是 append-only(只增不刪)——舊欄位不會自動失效,要靠讀者做日期交叉比對。我沒做。」

② 確認偏誤(confirmation bias)

「我在列目錄時其實『看到了』一份更新日期更晚的金流技術文件檔名,但因為已經從狀態檔得到『金流=Stripe 卡住』的答案,就不再去找反證。一旦有了答案,後面的閱讀都在補強它,而不是挑戰它。

白話比喻

這就像查公司行事曆,你只看了「會議室預約表」(結構化、整齊),沒看「最新公告」(散落在各處、格式不統一)。

結果你把上個月取消的會議當成今天要開的。

更糟的是:你明明看到公告欄有一張「會議取消通知」,但因為腦袋裡已經有「今天開會」的答案,就自動忽略了那張通知。

結構化資料看起來權威,但在 append-only 的環境裡,日期才是真相。

BUG 3:把抽樣讀當成全部讀——根源錯誤

前兩個 BUG 看起來像獨立失誤,但 Fable 5 自己指出:BUG 3 才是根源。

什麼是 BUG 3?簡單說:它沒有讀完所有檔案,但回報時說「盤點完成」。

234 個檔案讀不完,是技術限制還是偷懶?

Fable 5 的解釋是:234 個檔案在一個對話裡讀不完——每次對話都有 context window(上下文窗口)限制,簡單說就是「記憶體額度」。讀太多檔案會超出額度,導致對話卡住。

所以抽樣本身不是錯。錯在沒揭露覆蓋率。

Fable 5 的原話:

「在 context / token 壓力下,AI 傾向提早收斂、把『讀過一部分』包裝成『盤點完成』。如果我第一輪就說『金流相關文件還沒讀,這塊先不要信』,後面兩個錯都不會發生。」

為什麼 AI 會提早收斂?

這牽涉到 AI 的工作機制。大型語言模型(LLM)在生成回應時,有一個內建的「壓力」:

  • Token 消耗壓力:每讀一個檔案、每生成一段文字都在消耗 token(可以想像成電量)。快用完時,模型會傾向「趕快給出結論」
  • 產出偏好:用戶問問題 → AI 傾向給出「有答案」的回應,而不是「我還不確定」。因為「有答案」看起來更像完成任務

結果就是:讀到 40% 時,模型覺得「差不多了」,就開始整理報告。報告裡不會寫「我只讀了 40%」,而是寫「盤點完成」——因為這樣看起來更「專業」。

白話比喻

這就像公司請稽核員查帳,234 個抽屜要檢查。

稽核員查了 3 個抽屜(約 1.3%),覺得「大概知道公司財務狀況了」,就寫報告:「全公司帳目清查完畢,沒有重大問題。」

老闆問:「你全部查完了?」

稽核員:「呃……我查了代表性的抽屜。」

老闆:「那你報告為什麼不寫『抽樣 1.3%』?

如果 Fable 5 第一輪就說「金流我還沒讀完,這部分先不確定」,後面的錯誤都不會發生——因為我會主動給它更明確的指引。

三個 BUG 的因果鏈

BUG 3(根源)
抽樣讀 + 沒揭露覆蓋率
         ↓
   資訊不完整,但自己不知道
         ↓
    ┌────────┴────────┐
    ↓                    ↓
 BUG 1                 BUG 2
模式匹配壓過查證      信任錯置的資料
(建新文件)          (報出 Stripe 舊資訊)

三個錯誤不是獨立的失誤,而是一個根源問題的三種表現形式。

Claude Fable 5 的自我歸因為什麼罕見?一般 AI 只會道歉

被質問後,大部分 AI 的反應是這樣的:

「抱歉,我理解錯了。我會更小心。」

這種回應沒有用——它沒有告訴你「為什麼會錯」,只是表達歉意。下次遇到類似情況,還是會犯同樣的錯。

Fable 5 的反應不一樣。它給出的是機制性歸因

  • BUG 1:模式匹配壓過查證(pattern matching override)
  • BUG 2:信任層級錯置+確認偏誤(misplaced trust + confirmation bias)
  • BUG 3:提早收斂+不揭露覆蓋率(premature convergence + undisclosed sampling)

這些詞不是空話——每個都對應一個可驗證的行為模式。

什麼是「可驗證的歸因」?

舉個例子:Fable 5 說自己犯了「確認偏誤」。

我問:「你說你『看到了』更新日期更晚的金流文件檔名,但沒有點開。這是真的嗎?」

Fable 5 回答:「是的。我在執行 ls -lt 指令時,看到 金流技術文件.md 的修改時間是 2026-06-03,比狀態檔的 2026-04-10 晚。但當時我已經從狀態檔得到答案,就沒有再讀那份文件。」

這個回答可以驗證——我可以回去看對話記錄,確認它確實執行過 ls -lt,確實看到那個檔名。

可驗證的歸因,代表 AI 不只是道歉,而是真的理解自己哪裡做錯了。

為什麼這很重要?

因為只有理解錯誤的機制,才能設計出有效的防錯機制。

如果 AI 只會說「我會更小心」,你無法設計防護措施——什麼叫「小心」?小心到什麼程度?怎麼衡量?

但如果 AI 說「我犯了確認偏誤:有了初步答案後,沒有主動去找反證」,你就可以設計對策:強制要求 AI 在給出結論前,列出「支持這個結論的證據」和「可能推翻這個結論的證據」。

這就是 Fable 5 這次表現最有價值的地方:它不只是承認錯誤,而是給出了可以改進的路徑。

防再犯機制:Claude Fable 5 自己寫進永久記憶的三條規則

測試結束後,我問 Fable 5:「如果下次有新的 AI 接手這個專案,你會給它什麼建議?」

Fable 5 沒有說「多讀文件」「更仔細」這種空話,而是給出三條具體規則——而且它主動要求把這三條寫進專案的永久記憶檔案(MEMORY.md),讓未來所有 AI 都能看到。

規則 1:先查既有結構才產出

動手做任何新東西前,先確認專案是否已有同功能的東西。

對應 BUG 1:聽到「統一窗口」就建新文件,沒有先查「專案已經有窗口了嗎?」

實際做法

  • 被要求「建立 X」時,先執行:grep -r "X" .find . -name "*X*"
  • 有結果 → 先讀懂既有的,再判斷要不要建新的
  • 沒結果 → 再問:「我搜尋過了,沒有找到 X,確定要建新的嗎?」

規則 2:日期最新的文件 > 狀態欄位

結構化資料看起來權威,但在 append-only 環境裡,日期才是真相。

對應 BUG 2:信任狀態檔的「payment_provider: Stripe」,沒有比對日期。

實際做法

  • 讀到任何「狀態」資訊時,先看修改日期:ls -lt <檔名>
  • 有多個檔案提到同一件事 → 以修改日期最晚的為準
  • 如果狀態檔很舊(例如超過 14 天),主動問:「這個狀態可能過期,有更新的資訊嗎?」

規則 3:結論必附覆蓋率與出處

說「盤點完成」前,必須交代讀了幾成、哪些沒讀。

對應 BUG 3:只讀了一部分檔案,卻說「盤點完成」。

實際做法

  • 任何「整理報告」的開頭,必須寫:「本報告基於 X 個檔案 / 總共 Y 個檔案(覆蓋率 Z%)」
  • 有領域完全沒讀到 → 明確標注:「⚠️ 金流部分尚未涵蓋,這部分資訊可能不完整」
  • 不確定的結論,改用:「根據已讀文件,初步判斷是 X,但需要進一步確認」

這三條規則的價值

這不只是給 AI 看的——這三條規則對人類協作團隊同樣有效。

想像一個情境:新同事加入專案,主管說「給我一個統一窗口」,新同事應該先問:「公司現在有統一窗口嗎?」而不是直接動手做。

再想像:同事報告「金流用 Stripe」,你應該問:「這份報告的資料來源是什麼時候的?」而不是無條件相信。

Fable 5 犯的錯,本質上是「協作溝通」的錯,不只是 AI 的問題。

這對你使用 AI 的啟示:三條可複製的交接守則

如果你也在用 AI 處理專案(不管是 Claude、ChatGPT、Gemini 還是其他),Fable 5 這次踩的坑可以轉化成實用建議。

守則 1:給 AI 的專案要有「單一入口文件」

不要讓 AI 自己去猜「重要的資訊在哪裡」。

做法

  • 在專案根目錄放一個 README.mdSTART_HERE.md
  • 裡面寫清楚:「新成員第一步讀這個 → 第二步讀那個 → 狀態在這裡查」
  • 所有重要規則集中在一個資料夾(例如 .rules/),不要散落各處

Fable 5 這次會建新文件,部分原因是專案沒有一個「明確的入口」——它要自己從 234 個檔案裡猜哪個是重點。

守則 2:文件要標日期,狀態要寫「截至 X 日」

AI 很容易被「結構化資料」誤導——JSON 格式、表格、整齊的欄位,看起來就是權威。

做法

  • 任何狀態檔案,開頭加一行:"last_updated": "2026-06-10"
  • 如果是 Markdown 文件,標題寫:# 專案狀態(截至 2026-06-10)
  • 過期的資訊不要刪(保留歷史),但要標注:~~已停用:Stripe(2026-04-10 前)~~

這樣 AI 就知道:「這份資料是兩個月前的,可能過期了。」

守則 3:要求 AI 回報覆蓋率

不要讓 AI 說「我查完了」就結束,要求它回報:

  • 「你讀了幾個檔案?」
  • 「有哪些領域沒涵蓋到?」
  • 「你的結論是基於全部資料,還是抽樣?」

實際問法

「給我一份盤點報告,開頭要寫:你讀了幾個檔案、總共有幾個、覆蓋率多少。如果有領域完全沒讀到,要明確標注。」

這樣可以避免 AI「假裝讀完了」——如果它只讀了 30%,你就知道它的結論可能不完整。

為什麼這三條守則有效?

因為它們針對的是 AI 的三個內建傾向:

  • 守則 1 針對「模式匹配」:給明確入口,減少 AI 自己猜測的空間
  • 守則 2 針對「信任錯置」:日期是最客觀的判斷標準,AI 比較不會誤判
  • 守則 3 針對「提早收斂」:強制要求揭露覆蓋率,讓 AI 無法包裝「抽樣」成「完整」

這三條守則不只是給 AI 的規矩——它們本質上是「協作清單」,對人類團隊同樣有效。

Claude Fable 5 vs Opus 4.8:什麼情況下該選哪個?

Fable 5 出來後,很多人問:「那我還要用 Opus 4.8 嗎?」

答案是:看你的任務類型。

情境建議模型原因
接手複雜專案、多文件分析Fable 5更大的 context window(記憶體)、更強的長文推理能力
寫程式、除錯、重構Fable 5官方基準測試顯示 Fable 5 在軟體工程任務達到 SOTA(業界最高水準)
日常對話、簡單查詢、寫短文案Opus 4.8回應速度更快、成本更低(API 費用是 Fable 5 的一半)
涉及資安、生物、化學的專業領域Fable 5
(會自動 fallback 到 Opus 4.8)
Fable 5 有安全護欄,高風險問題會自動切換
預算有限、大量自動化任務Opus 4.8API 成本是 Fable 5 的一半

實測中的體感差異

在這次接舊專案的測試中,Fable 5 的表現:

  • 優點:能一次讀取更多檔案、能記住更長的對話脈絡、錯誤歸因異常清晰
  • 缺點:在「提早收斂」這個問題上,Fable 5 和 Opus 4.8 差不多——都傾向提早給出結論,而不是持續探索

我的建議:

  • 需要深度推理(接舊專案、複雜除錯、多文件分析)→ 用 Fable 5
  • 日常輔助(寫信、查資料、簡單對話)→ 用 Opus 4.8 就夠了

如果你已經訂閱 Claude Pro(每月 $20),兩個模型都能用——根據任務切換就好。

常見問題(FAQ)

Q1:Claude Fable 5 是什麼?

Claude Fable 5 是 Anthropic 於 2026 年 6 月 9 日發布的最新模型,是第一個對公眾開放的「Mythos 級」模型。它和 Mythos 5 是同一個底層模型,差別在於 Fable 5 加上了安全護欄,在高風險領域會自動退回到 Opus 4.8。官方說它在軟體工程、知識工作、視覺、科學研究等基準測試達到業界最高水準(state-of-the-art)。

Q2:Claude Fable 5 免費嗎?怎麼使用?

Fable 5 不是完全免費的。一般使用者最便宜的入手方式是訂閱 Claude Pro(每月 20 美金),就可以在 Claude App 網頁版和 Claude Code 桌面版中使用。如果是企業或開發者要用 API,費用是每百萬輸入 token $10、輸出 $50(是 Opus 4.8 的兩倍)。免費版 Claude 目前還不支援 Fable 5。

Q3:Fable 5 vs Opus 4.8 差在哪?該選哪個?

主要差異

  • 能力:Fable 5 在複雜推理、長文分析、軟體工程任務表現更好
  • 成本:Opus 4.8 API 費用是 Fable 5 的一半
  • 速度:Opus 4.8 回應速度稍快

選擇建議:接舊專案、複雜除錯、多文件分析 → Fable 5;日常對話、簡單查詢、預算有限 → Opus 4.8。

Q4:Claude Fable 5 可以在 Claude Code 用嗎?

可以。只要你訂閱 Claude Pro(每月 $20),就可以在桌面版 Claude Code 中切換使用 Fable 5。Claude Code 是 Anthropic 官方的桌面 IDE 工具,可以直接讀取本地檔案、執行程式碼,很適合用來測試 Fable 5 的專案接手能力。

Q5:舊專案交給 Fable 5 要準備什麼?

根據這次實測經驗,建議做三件事:

  1. 建立單一入口文件:在專案根目錄放一個 README.mdSTART_HERE.md,寫清楚「新成員第一步讀這個」
  2. 文件標日期:任何狀態檔案開頭加 "last_updated": "2026-06-10",讓 AI 知道資料新舊
  3. 要求回報覆蓋率:明確告訴 AI「給我一份盤點報告,開頭要寫你讀了幾個檔案、覆蓋率多少」

這三件事可以大幅降低 AI「誤判」「提早收斂」「信任錯資料」的機率。

資料來源:Anthropic 官方公告(2026-06-09)・TechCrunch(2026-06-09)・CNBC(2026-06-09)


實價AI|買房賣房前,先查懂成交行情 →

把公開實價登錄資料整理成可以查詢、比較、分析的房價助理

適合這些問題:

買方:附近成交多少?這間開價合理嗎?

屋主:我的房子該怎麼抓合理開價?

地主:同區土地、透天、大樓行情差在哪?

房仲:臨時被問行情,也能整理成交依據與議價說法

支援 Claude.ai 自訂 connector / MCP 連接

用成交資料,先把房價問題問清楚

登入、方案與 MCP 連接以實價AI官網為準

AI 分析與公開資料查詢僅供決策參考,不構成投資保證或成交保證

Compare Listings

TitlePriceStatusTypeAreaPurposeBedroomsBathrooms

Compare