AI幻覺是什麼?KPMG用AI寫報告,整篇被抓到說謊、緊急撤稿(2026)

一、這是什麼:AI幻覺的定義

AI幻覺(AI Hallucination)是指 AI 模型生成的內容看起來很合理、很專業,但實際上是憑空捏造、與事實不符的現象。

2026年6月,全球四大會計師事務所之一的 KPMG 就踩到了這個大坑。根據 TechCrunch 2026年6月13日報導,KPMG 在 2025年10月發布了一份名為「Redefining excellence in the age of agentic AI」的報告,這份報告用 AI 撰寫,聲稱分析了多家大公司的 AI 應用情況。

問題是,研究組織 GPTZero 發現這份報告充斥著 AI 幻覺:

  • UBS(瑞銀集團)表示報告中關於他們的描述「不實或誤導性」
  • 英國 NHS(國民保健署)同樣否認報告內容
  • 瑞士聯邦鐵路(Swiss Federal Railways)也跳出來澄清
  • 倫敦交通局(Transport for London)也表示內容有誤

最終,KPMG 緊急撤稿並下架整份報告。

這不是個案。同樣是四大會計師事務所的 EY(安永),也曾撤回一份含有 AI 捏造腳注的忠誠度獎勵報告。

AI幻覺不是 AI 故意說謊,而是 AI 模型的結構性問題:它會用看起來很專業的語言,組裝出根本不存在的「事實」。

二、比喻:像一個很自信但記性超差的員工

想像你公司有個員工,講話超級流暢、PPT 做得很漂亮、數據圖表排版專業,但問題是——他講的內容有一半是他自己腦補的

你問他:「上個月 UBS 有沒有用我們的 AI 系統?」

他回答:「有!而且他們用了三個月,效率提升 40%,員工滿意度提高 25%。」

聽起來超專業對吧?數字精確、用詞嚴謹。

結果你打電話給 UBS 確認,對方說:「我們根本沒用過你們的系統。」

這就是 AI 幻覺。

AI 模型訓練時吸收了大量文字,它學會了「顧問報告應該長什麼樣子」,但它並不知道哪些是真的、哪些是假的。當它找不到答案時,它會用「聽起來很合理」的方式填補空白——這就是幻覺的來源。

三、拆解:KPMG AI 報告事件完整時間軸

2025年10月:報告發布

KPMG 發布一份名為「Redefining excellence in the age of agentic AI」的報告,主題是企業如何應用 AI 代理(Agentic AI)技術。

報告中引用了多家大公司的案例,包括:

  • UBS 的 AI 客戶服務系統
  • NHS 的醫療記錄 AI 分析
  • 瑞士聯邦鐵路的調度優化
  • 倫敦交通局的運輸規劃 AI

報告寫得很專業,引用數據、圖表、分析框架一應俱全。

2026年初:GPTZero 開始調查

AI 偵測工具公司 GPTZero 注意到這份報告,開始進行事實查證。

他們聯繫報告中提到的公司,逐一確認內容是否屬實。

2026年6月:真相曝光

GPTZero 發現,報告中大量內容根本沒有事實依據

  • UBS 回應:報告中關於我們的描述「不實或誤導性」
  • NHS 回應:我們沒有部署報告中提到的 AI 系統
  • 瑞士聯邦鐵路 回應:報告內容與實際情況不符
  • 倫敦交通局 回應:報告中的案例描述有誤

2026年6月13日:KPMG 緊急撤稿

事件曝光後,KPMG 迅速下架整份報告,並發布聲明強調:

「企業必須確保人工監督來驗證內容獨立核實來源。」

諷刺的是,這正是 KPMG 自己沒有做到的事。

四、故事:其他 AI 幻覺真實案例

案例一:EY 的忠誠度獎勵報告

同樣是四大會計師事務所的 EY(安永),也曾發布一份關於企業忠誠度獎勵計劃的研究報告。

報告中引用了大量學術研究和統計數據,看起來非常專業。

問題是,有讀者發現報告中的腳注引用根本查不到原文——那些論文、期刊、研究報告,全是 AI 捏造的。

EY 最終也緊急撤回報告。

案例二:律師用 ChatGPT 引用不存在的判決

2023年,美國一位律師在法庭提交的文件中,引用了六個判例來支持他的論點。

問題是,這六個判例全部不存在

原來這位律師用 ChatGPT 搜尋相關判例,ChatGPT 生成了看起來很真實的案號、法官名字、判決摘要——但全是幻覺。

法官發現後非常生氣,這位律師最終被罰款並受到紀律處分。

案例三:學術論文的假引用

有研究者用 AI 撰寫論文初稿,AI 生成了十幾條看起來很學術的引用文獻。

結果去圖書館查證時發現:

  • 有些期刊名稱根本不存在
  • 有些作者名字是真的,但從沒寫過那篇論文
  • 有些論文標題看起來很合理,但搜遍資料庫都找不到

AI 完美模仿了「學術引用格式」,但內容全是捏造。

五、發問:為什麼這樣的事還在發生?為什麼大公司也會中招?

問題一:AI 看起來太專業了

KPMG 這種等級的顧問公司,員工都是受過嚴格訓練的專業人士。

但 AI 生成的內容格式完美、用詞專業、數據漂亮——這讓人很容易誤以為「內容也一定是對的」。

實際上,格式正確≠內容正確

問題二:驗證成本太高

想像一下,你用 AI 生成了一份 50 頁的報告,裡面有 100 個數據點、20 個案例、30 條引用。

要逐一驗證這些內容是否屬實,可能需要花比寫報告還多的時間。

很多公司為了省時間,選擇「相信 AI」——結果就出事了。

問題三:AI 幻覺很難被發現

AI 不會生成明顯的錯誤,比如「1+1=3」這種。

它生成的幻覺內容通常是:

  • 聽起來很合理
  • 符合常識邏輯
  • 用詞專業精準
  • 數據看起來很真實

只有實際去查證原始來源,才會發現「這根本不存在」。

問題四:過度信任 AI

KPMG 自己在聲明中強調「需要人工監督」,但他們自己顯然沒做到。

很多公司把 AI 當成「萬能工具」,以為 AI 生成的內容可以直接使用,不需要檢查。

這是最危險的心態。

六、總結:AI 幻覺不是 AI 的「謊言」,而是模型的結構性問題

很多人會問:「AI 為什麼要說謊?」

答案是:AI 根本不知道什麼是謊言

AI 語言模型的運作方式是:

  1. 根據訓練資料,學習「什麼樣的文字應該接在什麼文字後面」
  2. 當你問它問題時,它會預測「最可能的答案是什麼」
  3. 如果訓練資料中沒有答案,它會用「聽起來最合理」的方式填補

AI 不會說「我不知道」,因為它的設計目標就是「無論如何都要生成一個答案」

這就是為什麼 AI 會生成:

  • 不存在的論文引用
  • 捏造的公司案例
  • 虛構的統計數據
  • 編造的判決案例

而且全部都看起來很真

KPMG 事件告訴我們:

  • AI 可以提高效率 — 這是事實
  • 但 AI 不能取代查證 — 這是底線

七、步驟:企業如何防範 AI 幻覺的實用5步驟

步驟一:建立查證機制

所有 AI 生成的內容,必須經過人工查證才能對外發布。

查證重點:

  • 引用的來源是否真實存在?
  • 數據是否有官方出處?
  • 案例是否經過當事人確認?

步驟二:分層使用 AI

不同風險等級的內容,使用不同程度的 AI:

  • 低風險內容(內部會議記錄、草稿整理)— 可以大量使用 AI
  • 中風險內容(行銷文案、部落格文章)— AI 生成後,人工編輯確認
  • 高風險內容(法律文件、顧問報告、學術論文)— AI 只能輔助研究,最終內容必須人工撰寫並查證

步驟三:要求 AI 附上來源

使用 AI 時,明確要求它:

  • 「請附上每個數據的來源連結」
  • 「請標注哪些是事實、哪些是推測」
  • 「如果不確定,請明確說『我不確定』」

有些 AI 工具(如 Perplexity、Bing Chat)會自動附上來源連結,這類工具相對安全。

步驟四:交叉驗證

不要只依賴一個 AI 工具的輸出。

可以:

  • 用不同 AI 工具生成同一主題的內容,比對差異
  • 用 AI 生成初稿,再用另一個 AI 做事實查核
  • 重要資訊直接去官方網站或資料庫確認

步驟五:建立問責機制

明確規定:

  • 誰負責查證 AI 生成的內容?
  • 出錯時誰要負責?
  • 什麼類型的內容禁止使用 AI?

KPMG 事件就是因為沒有明確的查證責任歸屬,導致一份充滿幻覺的報告直接對外發布。

八、指令:你用 AI 工具的時候,有沒有遇過明顯的幻覺?

AI 幻覺不只發生在大公司的顧問報告,也可能出現在你每天使用的 AI 工具中。

你可能遇過:

  • 問 ChatGPT「XX書的作者是誰」,它給你一個錯誤答案
  • 問 AI「某個軟體有沒有XX功能」,它說有,結果根本沒有
  • 問 AI「XX公司的創辦人是誰」,它給你一個聽起來很合理但完全錯誤的名字

這些都是 AI 幻覺的日常版本。

重要提醒

  • AI 是強大的輔助工具,但不是萬能的真理機器
  • 越重要的資訊,越需要查證
  • 「AI 說的」≠「事實」

KPMG 這種全球頂尖顧問公司都會栽在 AI 幻覺上,我們一般使用者更要小心。

下次用 AI 時,記得多問一句:「這是真的嗎?來源在哪裡?」

常見問題(FAQ)

AI幻覺是什麼意思?

AI幻覺(AI Hallucination)是指 AI 模型生成看起來很專業、很合理,但實際上是憑空捏造、與事實不符的內容。AI 會用正確的格式、專業的用詞,組裝出根本不存在的「事實」,比如虛構的論文引用、編造的公司案例、捏造的統計數據等。

AI幻覺為什麼會發生?

AI 語言模型的設計目標是「無論如何都要生成一個答案」。當訓練資料中沒有答案時,AI 會用「聽起來最合理」的方式填補空白。AI 並不知道什麼是真、什麼是假,它只學會了「什麼樣的文字應該接在什麼文字後面」,所以會生成看起來很真實但實際上是虛構的內容。

怎麼確認 AI 的回答有沒有幻覺?

最有效的方法是查證原始來源。如果 AI 提供數據,去官方網站確認;如果 AI 引用論文,去學術資料庫查詢;如果 AI 描述公司案例,直接聯繫該公司確認。使用有附來源連結功能的 AI 工具(如 Perplexity、Bing Chat)會相對安全,但重要資訊仍需人工查證。

KPMG 為什麼要撤掉 AI 報告?

KPMG 在 2025年10月發布的「Redefining excellence in the age of agentic AI」報告中,引用了 UBS、NHS、瑞士聯邦鐵路、倫敦交通局等大型組織的 AI 應用案例。但 GPTZero 調查發現,這些組織紛紛表示報告內容「不實或誤導性」。因為報告充滿 AI 幻覺內容,KPMG 最終在 2026年6月緊急撤稿。

企業用 AI 寫報告有哪些風險?

主要風險包括:①內容不實(AI 可能捏造數據、案例、引用)②信譽受損(如 KPMG、EY 的撤稿事件)③法律風險(如律師引用不存在的判例被罰款)④商業決策錯誤(基於錯誤資訊做決策)。企業必須建立查證機制,高風險內容(法律文件、顧問報告)不能完全依賴 AI 生成。

延伸閱讀

關於作者

我是阿宥,雲林的 AI 教學老師,專門幫助零基礎的人學會使用 AI 工具提升工作效率。如果你想學更多 AI 實用技巧,歡迎追蹤我的教學內容。

資料來源:TechCrunch(2024-06-13)GPTZero


實價AI|買房賣房前,先查懂成交行情 →

把公開實價登錄資料整理成可以查詢、比較、分析的房價助理

適合這些問題:

買方:附近成交多少?這間開價合理嗎?

屋主:我的房子該怎麼抓合理開價?

地主:同區土地、透天、大樓行情差在哪?

房仲:臨時被問行情,也能整理成交依據與議價說法

支援 Claude.ai 自訂 connector / MCP 連接

用成交資料,先把房價問題問清楚

登入、方案與 MCP 連接以實價AI官網為準

AI 分析與公開資料查詢僅供決策參考,不構成投資保證或成交保證

Compare Listings

TitlePriceStatusTypeAreaPurposeBedroomsBathrooms

Compare