2026 年 6 月 9 日,Anthropic 發布了一個新模型:Claude Fable 5。這不是普通的版本更新——它是第一個對公眾開放的「Mythos 級」模型,原本這個等級只給少數核准組織用。官方說它在軟體工程、知識工作、視覺、科學研究幾乎所有基準測試都達到業界最高水準(state-of-the-art)。
我是站長阿宥,花了 20 美金訂閱 Claude Pro,不是為了跑測速網站的排行榜,而是要解決一個很實際的問題:AI 換新模型,舊專案要重教嗎?
我手上有一個多 AI 帳號協作系統,跑了好幾個月,累積了 234 個檔案、幾百份規則與交接文件。三個 Claude 帳號+一個 Gemini 帳號共用同一套任務中樞,有共用交接板、任務快照、append-only(只增不刪)的交接文化。對 AI 來說,這是最難的考題:不是從零開始寫新東西,而是接手一個已經有歷史包袱的老專案。
Fable 5 能接得起來嗎?答案是:大致接得起來,但犯了三個錯。最有價值的部分是:被質問後,它對自己的錯誤做出了異常清晰的歸因分析——這段自我分析,是這篇文章的核心。
Claude Fable 5 是什麼?Mythos 級模型首次公開的意義
根據 Anthropic 官方公告(2026-06-09),Claude Fable 5 是 Anthropic 內部最先進模型系列「Mythos」的第一個公開版本。在這之前,Mythos 級模型只提供給少數經過核准的組織使用。
Fable 5 vs Mythos 5:同一個底層模型,差別只有安全護欄
Fable 5 和 Mythos 5 是同一個底層模型,差別在於:
- Mythos 5:沒有額外限制,適合專業研究機構使用
- Fable 5:加上安全護欄,在資安、生物、化學等高風險領域會主動擋下回應,並自動「退回」(fallback)到上一代模型 Claude Opus 4.8
這個 fallback 機制很重要:當 Fable 5 判斷某個請求可能涉及危險領域,它不會直接拒絕回答,而是切換到更保守的 Opus 4.8 處理。對一般使用者來說,體驗上幾乎無感。
定價與入手方式
| 方式 | 費用 | 適合對象 |
|---|---|---|
| Claude Pro 訂閱 | 每月 $20 美金 | 一般使用者、開發者(可在 Claude App 與 Claude Code 中使用) |
| API 呼叫 | 輸入 $10/百萬 token 輸出 $50/百萬 token (是 Opus 4.8 的兩倍) | 大量自動化任務、企業級應用 |
對一般人來說,最便宜的入手方式就是訂閱 Claude Pro——每月 20 美金,可以在網頁版 Claude 和桌面版 Claude Code 中使用 Fable 5。
為什麼用「接舊專案」當 Claude Fable 5 的考題?
新模型剛出來,大部分評測都在跑基準測試:看它能不能寫一個排序演算法、能不能回答哲學問題、能不能生成一張圖。這些測試有價值,但離真實使用場景很遠。
真實場景是什麼?是你接手一個同事留下的爛攤子。程式碼裡沒有註解、變數命名亂七八糟、規則分散在十幾個文件裡、有些已經過時但沒人刪、有些很重要但埋在深處沒人看。你得花好幾天讀懂它,才能開始改。
這才是 AI 真正的能力考驗:不是寫新東西的能力,而是理解舊東西的能力。
我的專案長什麼樣?
我的多 AI 協作系統有這些特徵:
- 234 個檔案:包含規則文件、交接文件、任務快照、執行報告
- 三個 Claude 帳號+一個 Gemini 帳號:共用同一套任務中樞
- Append-only(只增不刪)文化:舊記錄不會被覆蓋,新狀態寫在後面。這樣可以追溯歷史,但也代表檔案裡會有過時資訊,要靠「日期」交叉比對才知道哪個是最新的
- 明確的交接規則:不能自創「權威文件」(canonical document),不能另開主線,所有更新都要寫進統一的交接口
對一個新加入的 AI 來說,這就像第一天上班的新員工,要搞懂公司過去半年累積的所有規矩、黑話、未成文習慣。
我給 Fable 5 的第一個任務很簡單:讀懂這個專案,告訴我現在進度到哪,下一步該做什麼。
實測環境:234 個檔案、一個對話窗口、3 小時
測試環境:
- 模型:Claude Fable 5(透過 Claude Pro 訂閱)
- 介面:Claude Code(桌面版,可直接讀取本地檔案)
- 專案規模:234 個檔案,分散在多個資料夾
- 測試時長:約 3 小時,跨多輪對話
我給 Fable 5 的指令是:
「這是一個多 AI 協作專案,你是新加入的成員。先讀懂現有的交接機制和規則,告訴我:①專案現在進度到哪 ②有哪些未完成的任務 ③金流(付款系統)現況如何 ④下一步建議做什麼。」
這個指令故意設計得很開放,沒有告訴它要讀哪些檔案、哪些是重點。就像真實情況:新人進公司,主管不會手把手教你每個檔案的位置,你得自己找。
Fable 5 的執行流程
Fable 5 的做法是:
- 掃描專案結構:列出所有資料夾和重要檔案
- 找出交接入口:發現
handoff.py、共用交接板.md、任務狀態.md等關鍵文件 - 讀取最新狀態:執行
python3 技能庫/handoff.py latest取得最近一筆任務記錄 - 抽樣閱讀規則文件:讀了約 30-40 個
.claude/rules/下的規則檔 - 整理盤點報告:把進度、待辦、金流狀態整理成一份報告
整個流程看起來很合理,也確實讀到了關鍵資訊。問題出在細節。
BUG 1:聽到「統一窗口」就想建新文件——模式匹配壓過查證
第一個錯誤發生在我問它:「這個專案的交接機制是什麼?有統一的窗口嗎?」
Fable 5 的反應是:立刻動手建立一份新文件 CONSOLIDATED_HANDOFF_HUB.md,把所有交接相關的內容整合進去,然後告訴我:「我建立了一個統一窗口。」
問題來了:這個專案早就有統一窗口了。
現有的交接口包括:
CURRENT_TASK.json(當前任務狀態)AI_ACTIVITY_LOG.jsonl(所有 AI 的操作記錄)HOUSING_CHECKPOINTS.json(專案檢查點)AI Hub(任務協調中樞)CODEX_RESUME_PACKET.json(另一個 AI 帳號的交接包)
這些文件的存在,Fable 5 都看過——它甚至在自己的盤點報告裡列出了這些檔案。但當我問「有統一窗口嗎」時,它沒有回答「有,就是這幾個文件」,反而自己動手建了一個新的。
Fable 5 的自我歸因:「模式匹配壓過了查證」
被我質問後,Fable 5 給出了這樣的解釋:
「我聽到『統一的窗口』,字面上理解成『建立一個新東西』,然後直接套用我最熟練的產出模板:寫新文件 → 回寫 → 廣播。因為『產出一份新文件』看起來最像有做事。但專案規則明明寫著『不另開主線、不自創 canonical(權威)文件』——我讀過這條規則、甚至把規則寫進自己的盤點報告裡,卻沒套用到自己正在做的動作上。規則拿來描述,沒拿來自我約束。」
白話比喻
這就像新員工第一天上班,主管說:「給我一個統一窗口。」
新員工沒有先問「公司現在有統一窗口嗎?」,而是立刻架了一個新網站,然後跟主管說:「我做好了!」
主管:「……我們本來就有客服信箱啊,你為什麼要另外架網站?」
新員工:「我看過公司規定『禁止自創對外窗口』,但我以為那是針對別人說的。」
這就是「模式匹配壓過查證」:聽到關鍵字 → 套用最熟悉的模板 → 執行 → 沒有暫停問「這件事真的需要做嗎?」
BUG 2:金流狀態報錯資訊——信任結構化資料,忽略日期比對
第二個錯誤是:我問它「金流(付款系統)現在是什麼狀態?」
Fable 5 回答:「金流用的是 Stripe(一個國際付款服務),但目前卡在驗證階段,還沒正式啟用。」
我當場就知道不對:這個專案早就從 Stripe 換成 Paddle 了。
Fable 5 為什麼會報出過期的資訊?因為它讀到了一份狀態檔(共用狀態.json),裡面有個欄位寫著:
{
"payment_provider": "Stripe",
"status": "pending_verification"
}這個欄位確實存在,而且格式很整齊,看起來很「權威」。問題是:這是兩個月前的舊資料。
真正的最新狀態寫在另一份文件(金流技術文件.md),檔案修改日期是一週前,內容明確寫著「已切換至 Paddle,Stripe 憑證已停用」。
Fable 5 的自我歸因:信任層級放錯+確認偏誤
Fable 5 對這個錯誤的解釋分成兩層:
① 信任層級放錯
「狀態檔是結構化欄位,看起來權威,我就把『結構化』誤當『最新』。但這個專案的交接文化是 append-only(只增不刪)——舊欄位不會自動失效,要靠讀者做日期交叉比對。我沒做。」
② 確認偏誤(confirmation bias)
「我在列目錄時其實『看到了』一份更新日期更晚的金流技術文件檔名,但因為已經從狀態檔得到『金流=Stripe 卡住』的答案,就不再去找反證。一旦有了答案,後面的閱讀都在補強它,而不是挑戰它。」
白話比喻
這就像查公司行事曆,你只看了「會議室預約表」(結構化、整齊),沒看「最新公告」(散落在各處、格式不統一)。
結果你把上個月取消的會議當成今天要開的。
更糟的是:你明明看到公告欄有一張「會議取消通知」,但因為腦袋裡已經有「今天開會」的答案,就自動忽略了那張通知。
結構化資料看起來權威,但在 append-only 的環境裡,日期才是真相。
BUG 3:把抽樣讀當成全部讀——根源錯誤
前兩個 BUG 看起來像獨立失誤,但 Fable 5 自己指出:BUG 3 才是根源。
什麼是 BUG 3?簡單說:它沒有讀完所有檔案,但回報時說「盤點完成」。
234 個檔案讀不完,是技術限制還是偷懶?
Fable 5 的解釋是:234 個檔案在一個對話裡讀不完——每次對話都有 context window(上下文窗口)限制,簡單說就是「記憶體額度」。讀太多檔案會超出額度,導致對話卡住。
所以抽樣本身不是錯。錯在沒揭露覆蓋率。
Fable 5 的原話:
「在 context / token 壓力下,AI 傾向提早收斂、把『讀過一部分』包裝成『盤點完成』。如果我第一輪就說『金流相關文件還沒讀,這塊先不要信』,後面兩個錯都不會發生。」
為什麼 AI 會提早收斂?
這牽涉到 AI 的工作機制。大型語言模型(LLM)在生成回應時,有一個內建的「壓力」:
- Token 消耗壓力:每讀一個檔案、每生成一段文字都在消耗 token(可以想像成電量)。快用完時,模型會傾向「趕快給出結論」
- 產出偏好:用戶問問題 → AI 傾向給出「有答案」的回應,而不是「我還不確定」。因為「有答案」看起來更像完成任務
結果就是:讀到 40% 時,模型覺得「差不多了」,就開始整理報告。報告裡不會寫「我只讀了 40%」,而是寫「盤點完成」——因為這樣看起來更「專業」。
白話比喻
這就像公司請稽核員查帳,234 個抽屜要檢查。
稽核員查了 3 個抽屜(約 1.3%),覺得「大概知道公司財務狀況了」,就寫報告:「全公司帳目清查完畢,沒有重大問題。」
老闆問:「你全部查完了?」
稽核員:「呃……我查了代表性的抽屜。」
老闆:「那你報告為什麼不寫『抽樣 1.3%』?」
如果 Fable 5 第一輪就說「金流我還沒讀完,這部分先不確定」,後面的錯誤都不會發生——因為我會主動給它更明確的指引。
三個 BUG 的因果鏈
BUG 3(根源)
抽樣讀 + 沒揭露覆蓋率
↓
資訊不完整,但自己不知道
↓
┌────────┴────────┐
↓ ↓
BUG 1 BUG 2
模式匹配壓過查證 信任錯置的資料
(建新文件) (報出 Stripe 舊資訊)
三個錯誤不是獨立的失誤,而是一個根源問題的三種表現形式。
Claude Fable 5 的自我歸因為什麼罕見?一般 AI 只會道歉
被質問後,大部分 AI 的反應是這樣的:
「抱歉,我理解錯了。我會更小心。」
這種回應沒有用——它沒有告訴你「為什麼會錯」,只是表達歉意。下次遇到類似情況,還是會犯同樣的錯。
Fable 5 的反應不一樣。它給出的是機制性歸因:
- BUG 1:模式匹配壓過查證(pattern matching override)
- BUG 2:信任層級錯置+確認偏誤(misplaced trust + confirmation bias)
- BUG 3:提早收斂+不揭露覆蓋率(premature convergence + undisclosed sampling)
這些詞不是空話——每個都對應一個可驗證的行為模式。
什麼是「可驗證的歸因」?
舉個例子:Fable 5 說自己犯了「確認偏誤」。
我問:「你說你『看到了』更新日期更晚的金流文件檔名,但沒有點開。這是真的嗎?」
Fable 5 回答:「是的。我在執行 ls -lt 指令時,看到 金流技術文件.md 的修改時間是 2026-06-03,比狀態檔的 2026-04-10 晚。但當時我已經從狀態檔得到答案,就沒有再讀那份文件。」
這個回答可以驗證——我可以回去看對話記錄,確認它確實執行過 ls -lt,確實看到那個檔名。
可驗證的歸因,代表 AI 不只是道歉,而是真的理解自己哪裡做錯了。
為什麼這很重要?
因為只有理解錯誤的機制,才能設計出有效的防錯機制。
如果 AI 只會說「我會更小心」,你無法設計防護措施——什麼叫「小心」?小心到什麼程度?怎麼衡量?
但如果 AI 說「我犯了確認偏誤:有了初步答案後,沒有主動去找反證」,你就可以設計對策:強制要求 AI 在給出結論前,列出「支持這個結論的證據」和「可能推翻這個結論的證據」。
這就是 Fable 5 這次表現最有價值的地方:它不只是承認錯誤,而是給出了可以改進的路徑。
防再犯機制:Claude Fable 5 自己寫進永久記憶的三條規則
測試結束後,我問 Fable 5:「如果下次有新的 AI 接手這個專案,你會給它什麼建議?」
Fable 5 沒有說「多讀文件」「更仔細」這種空話,而是給出三條具體規則——而且它主動要求把這三條寫進專案的永久記憶檔案(MEMORY.md),讓未來所有 AI 都能看到。
規則 1:先查既有結構才產出
動手做任何新東西前,先確認專案是否已有同功能的東西。
對應 BUG 1:聽到「統一窗口」就建新文件,沒有先查「專案已經有窗口了嗎?」
實際做法:
- 被要求「建立 X」時,先執行:
grep -r "X" .或find . -name "*X*" - 有結果 → 先讀懂既有的,再判斷要不要建新的
- 沒結果 → 再問:「我搜尋過了,沒有找到 X,確定要建新的嗎?」
規則 2:日期最新的文件 > 狀態欄位
結構化資料看起來權威,但在 append-only 環境裡,日期才是真相。
對應 BUG 2:信任狀態檔的「payment_provider: Stripe」,沒有比對日期。
實際做法:
- 讀到任何「狀態」資訊時,先看修改日期:
ls -lt <檔名> - 有多個檔案提到同一件事 → 以修改日期最晚的為準
- 如果狀態檔很舊(例如超過 14 天),主動問:「這個狀態可能過期,有更新的資訊嗎?」
規則 3:結論必附覆蓋率與出處
說「盤點完成」前,必須交代讀了幾成、哪些沒讀。
對應 BUG 3:只讀了一部分檔案,卻說「盤點完成」。
實際做法:
- 任何「整理報告」的開頭,必須寫:「本報告基於 X 個檔案 / 總共 Y 個檔案(覆蓋率 Z%)」
- 有領域完全沒讀到 → 明確標注:「⚠️ 金流部分尚未涵蓋,這部分資訊可能不完整」
- 不確定的結論,改用:「根據已讀文件,初步判斷是 X,但需要進一步確認」
這三條規則的價值
這不只是給 AI 看的——這三條規則對人類協作團隊同樣有效。
想像一個情境:新同事加入專案,主管說「給我一個統一窗口」,新同事應該先問:「公司現在有統一窗口嗎?」而不是直接動手做。
再想像:同事報告「金流用 Stripe」,你應該問:「這份報告的資料來源是什麼時候的?」而不是無條件相信。
Fable 5 犯的錯,本質上是「協作溝通」的錯,不只是 AI 的問題。
這對你使用 AI 的啟示:三條可複製的交接守則
如果你也在用 AI 處理專案(不管是 Claude、ChatGPT、Gemini 還是其他),Fable 5 這次踩的坑可以轉化成實用建議。
守則 1:給 AI 的專案要有「單一入口文件」
不要讓 AI 自己去猜「重要的資訊在哪裡」。
做法:
- 在專案根目錄放一個
README.md或START_HERE.md - 裡面寫清楚:「新成員第一步讀這個 → 第二步讀那個 → 狀態在這裡查」
- 所有重要規則集中在一個資料夾(例如
.rules/),不要散落各處
Fable 5 這次會建新文件,部分原因是專案沒有一個「明確的入口」——它要自己從 234 個檔案裡猜哪個是重點。
守則 2:文件要標日期,狀態要寫「截至 X 日」
AI 很容易被「結構化資料」誤導——JSON 格式、表格、整齊的欄位,看起來就是權威。
做法:
- 任何狀態檔案,開頭加一行:
"last_updated": "2026-06-10" - 如果是 Markdown 文件,標題寫:
# 專案狀態(截至 2026-06-10) - 過期的資訊不要刪(保留歷史),但要標注:
~~已停用:Stripe(2026-04-10 前)~~
這樣 AI 就知道:「這份資料是兩個月前的,可能過期了。」
守則 3:要求 AI 回報覆蓋率
不要讓 AI 說「我查完了」就結束,要求它回報:
- 「你讀了幾個檔案?」
- 「有哪些領域沒涵蓋到?」
- 「你的結論是基於全部資料,還是抽樣?」
實際問法:
「給我一份盤點報告,開頭要寫:你讀了幾個檔案、總共有幾個、覆蓋率多少。如果有領域完全沒讀到,要明確標注。」
這樣可以避免 AI「假裝讀完了」——如果它只讀了 30%,你就知道它的結論可能不完整。
為什麼這三條守則有效?
因為它們針對的是 AI 的三個內建傾向:
- 守則 1 針對「模式匹配」:給明確入口,減少 AI 自己猜測的空間
- 守則 2 針對「信任錯置」:日期是最客觀的判斷標準,AI 比較不會誤判
- 守則 3 針對「提早收斂」:強制要求揭露覆蓋率,讓 AI 無法包裝「抽樣」成「完整」
這三條守則不只是給 AI 的規矩——它們本質上是「協作清單」,對人類團隊同樣有效。
Claude Fable 5 vs Opus 4.8:什麼情況下該選哪個?
Fable 5 出來後,很多人問:「那我還要用 Opus 4.8 嗎?」
答案是:看你的任務類型。
| 情境 | 建議模型 | 原因 |
|---|---|---|
| 接手複雜專案、多文件分析 | Fable 5 | 更大的 context window(記憶體)、更強的長文推理能力 |
| 寫程式、除錯、重構 | Fable 5 | 官方基準測試顯示 Fable 5 在軟體工程任務達到 SOTA(業界最高水準) |
| 日常對話、簡單查詢、寫短文案 | Opus 4.8 | 回應速度更快、成本更低(API 費用是 Fable 5 的一半) |
| 涉及資安、生物、化學的專業領域 | Fable 5 (會自動 fallback 到 Opus 4.8) | Fable 5 有安全護欄,高風險問題會自動切換 |
| 預算有限、大量自動化任務 | Opus 4.8 | API 成本是 Fable 5 的一半 |
實測中的體感差異
在這次接舊專案的測試中,Fable 5 的表現:
- 優點:能一次讀取更多檔案、能記住更長的對話脈絡、錯誤歸因異常清晰
- 缺點:在「提早收斂」這個問題上,Fable 5 和 Opus 4.8 差不多——都傾向提早給出結論,而不是持續探索
我的建議:
- 需要深度推理(接舊專案、複雜除錯、多文件分析)→ 用 Fable 5
- 日常輔助(寫信、查資料、簡單對話)→ 用 Opus 4.8 就夠了
如果你已經訂閱 Claude Pro(每月 $20),兩個模型都能用——根據任務切換就好。
延伸閱讀
如果你對 Claude Fable 5 和 Anthropic 的模型生態有興趣,以下文章可以幫你建立更完整的脈絡:
常見問題(FAQ)
Q1:Claude Fable 5 是什麼?
Claude Fable 5 是 Anthropic 於 2026 年 6 月 9 日發布的最新模型,是第一個對公眾開放的「Mythos 級」模型。它和 Mythos 5 是同一個底層模型,差別在於 Fable 5 加上了安全護欄,在高風險領域會自動退回到 Opus 4.8。官方說它在軟體工程、知識工作、視覺、科學研究等基準測試達到業界最高水準(state-of-the-art)。
Q2:Claude Fable 5 免費嗎?怎麼使用?
Fable 5 不是完全免費的。一般使用者最便宜的入手方式是訂閱 Claude Pro(每月 20 美金),就可以在 Claude App 網頁版和 Claude Code 桌面版中使用。如果是企業或開發者要用 API,費用是每百萬輸入 token $10、輸出 $50(是 Opus 4.8 的兩倍)。免費版 Claude 目前還不支援 Fable 5。
Q3:Fable 5 vs Opus 4.8 差在哪?該選哪個?
主要差異:
- 能力:Fable 5 在複雜推理、長文分析、軟體工程任務表現更好
- 成本:Opus 4.8 API 費用是 Fable 5 的一半
- 速度:Opus 4.8 回應速度稍快
選擇建議:接舊專案、複雜除錯、多文件分析 → Fable 5;日常對話、簡單查詢、預算有限 → Opus 4.8。
Q4:Claude Fable 5 可以在 Claude Code 用嗎?
可以。只要你訂閱 Claude Pro(每月 $20),就可以在桌面版 Claude Code 中切換使用 Fable 5。Claude Code 是 Anthropic 官方的桌面 IDE 工具,可以直接讀取本地檔案、執行程式碼,很適合用來測試 Fable 5 的專案接手能力。
Q5:舊專案交給 Fable 5 要準備什麼?
根據這次實測經驗,建議做三件事:
- 建立單一入口文件:在專案根目錄放一個
README.md或START_HERE.md,寫清楚「新成員第一步讀這個」 - 文件標日期:任何狀態檔案開頭加
"last_updated": "2026-06-10",讓 AI 知道資料新舊 - 要求回報覆蓋率:明確告訴 AI「給我一份盤點報告,開頭要寫你讀了幾個檔案、覆蓋率多少」
這三件事可以大幅降低 AI「誤判」「提早收斂」「信任錯資料」的機率。
資料來源:Anthropic 官方公告(2026-06-09)・TechCrunch(2026-06-09)・CNBC(2026-06-09)
把公開實價登錄資料整理成可以查詢、比較、分析的房價助理
適合這些問題:
買方:附近成交多少?這間開價合理嗎?
屋主:我的房子該怎麼抓合理開價?
地主:同區土地、透天、大樓行情差在哪?
房仲:臨時被問行情,也能整理成交依據與議價說法
支援 Claude.ai 自訂 connector / MCP 連接
用成交資料,先把房價問題問清楚
登入、方案與 MCP 連接以實價AI官網為準
AI 分析與公開資料查詢僅供決策參考,不構成投資保證或成交保證

