2026 年 3 月,以色列軟體工程師 Daniel Abraham 突然收到陌生人的 WhatsApp 訊息,對方說是透過 Gemini 查詢客服電話時得到他的號碼。這不是個案——根據 MIT Technology Review 報導,AI 洩漏個人電話問題正在快速擴大,過去 7 個月相關投訴增加 400%。整理你需要知道的關鍵事實:為什麼 AI 會洩漏真實電話號碼、哪些人風險最高、目前能做什麼保護措施。
AI 洩漏電話號碼是怎麼發生的?
AI 洩漏個人電話的機制源自大型語言模型(LLM)的訓練資料來源:這些模型透過爬取大量網路公開資料來學習,過程中不可避免地記住了個人資料,包括電話號碼、電子郵件、地址等。
與多數人的直覺相反,並非只有高頻出現的資料才會被記住。研究顯示,LLM 會逐字記憶訓練資料中的內容,即使是只出現過一次的電話號碼,也可能在特定查詢條件下被模型輸出。
加州資料中介商登記資料顯示,578 家資料仲介商中有 31 家(5.4%)在過去一年向 AI 公司出售資料。這些資料可能包含從公開來源彙整的個人聯絡方式,進一步增加你的號碼被 AI 記住的機會。
真實案例:這些人的號碼是怎麼被 Gemini 說出來的
案例一:PayBox 客服查詢變成私人號碼
以色列軟體工程師 Daniel Abraham 在 2026 年 3 月被陌生人透過 WhatsApp 聯繫。對方解釋:他在 Gemini 查詢 PayBox(以色列付款服務)的客服電話時,AI 直接給出 Abraham 的私人手機號碼。Abraham 從未在任何公開文章或網站上公布這個號碼,推測可能是資料仲介商彙整後被 AI 訓練資料收錄。
案例二:律師事務所電話變成個人號碼
一位 Reddit 用戶在一個月內接到大量陌生來電,詢問法律諮詢服務。經查證後發現,Google AI(包含搜尋整合的 AI 功能)把他的個人號碼當成某律師事務所的聯絡電話,導致需要法律服務的人直接打給他。
案例三:學術圈內部號碼外洩
華盛頓大學一位 PhD 候選人在測試 Gemini 時,詢問同事的聯絡方式,Gemini 直接給出同事從未公開的私人手機號碼。這顯示即使是小範圍流通的資料(如學校內部通訊錄、會議簽到表),也可能透過某些途徑進入 AI 訓練資料。
💡 反直覺事實:多數人以為刪了網路文章就安全,但 2015 年留在論壇的一則貼文,2026 年仍可能被 AI 引用——因為訓練資料快照早已存檔。
為什麼刪掉舊文章也沒用?(訓練資料機制說明)
AI 訓練資料的「快照特性」決定了刪除現有網頁內容無法阻止 AI 洩漏個資。
當 AI 公司(如 OpenAI、Google、Anthropic)爬取網路資料時,他們會建立資料快照(snapshot)並存檔。即使你在 2026 年刪除了 2018 年發布的部落格文章,AI 公司在 2023 年爬取時已經把那篇文章(包含你留的電話號碼)存進訓練資料集。
模型記憶機制:不只記住常見資料
過去研究顯示,大型語言模型會逐字記憶訓練資料(verbatim memorization),而非只萃取統計模式。這表示:
- 你的號碼只需要出現過一次,就可能被記住
- 查詢條件符合時(如「PayBox 客服電話」),模型可能直接輸出記憶中的資料
- 即使資料來源已下架,模型仍保有記憶
資料仲介商的角色
根據加州法律要求公開的登記資料,5.4% 的資料仲介商(31/578 家)曾在過去一年向 AI 公司出售資料。這些公司彙整公開來源(如黃頁、商業登記、社群媒體)的個人資料後打包販售,進一步擴大你的資料被 AI 記住的管道。
哪些人的電話最容易被 AI 引用?(風險族群)
風險評估框架:你的號碼被 AI 洩漏的機率取決於以下條件
高風險族群 1:曾在公開網頁刊載號碼
- 自營業者、律師、會計師、房仲:官網、黃頁、Google 商家檔案上的號碼
- 學術研究者:論文聯絡方式、會議網站、機構目錄
- 社團幹部、活動主辦人:活動網站、報名表單、新聞稿
高風險族群 2:資料出現在資料仲介商資料庫
即使你從未主動公開號碼,以下情況仍可能讓資料仲介商取得你的資料:
- 過去曾在論壇、拍賣網站、租屋平台留下號碼(即使已刪除)
- 公司登記、不動產交易等公開紀錄
- 社群媒體朋友公開的合照標註或貼文提及
中風險族群:內部通訊錄外洩
學校、公司、社團的內部通訊錄若曾被上傳至雲端、分享給外部協作者,或被駭客外洩,你的號碼就可能進入訓練資料。華盛頓大學案例顯示,即使是小範圍流通的資料也有風險。
較低風險族群
從未在任何線上平台留下號碼、不曾註冊需要手機驗證的服務、個人資料未出現在公開紀錄的人,風險相對較低——但仍無法完全排除(例如朋友可能在社群貼文中提及你的號碼)。
DeleteMe 數據:AI 隱私投訴增加 400%
DeleteMe 是一家專門協助用戶從資料仲介商網站下架個人資料的公司,他們的客服數據提供了 AI 隱私問題擴大的直接證據。
核心數據:過去 7 個月增加 400%
根據 MIT Technology Review 報導,DeleteMe 表示過去 7 個月收到的 AI 相關隱私投訴增加 400%,總數達數千件。這些投訴主要涉及:
- AI 聊天機器人(如 ChatGPT、Gemini、Claude)給出用戶的真實電話號碼
- Google 搜尋結果的 AI 摘要(AI Overview)顯示錯誤或私密的聯絡方式
- 用戶發現自己的資料出現在 AI 訓練資料外洩事件中
提及比例分布
在這些投訴中,55% 提及 ChatGPT、20% Gemini、15% Claude、10% 其他 AI 工具。ChatGPT 比例最高可能與其市佔率和使用量有關,但 Gemini 個資外洩問題也占了五分之一,顯示這不是單一 AI 公司的問題。
趨勢意義
400% 的增長速度顯示兩個現象:①大眾開始意識到 AI 隱私風險 ②AI 工具普及後,個資被引用的實際案例快速增加。DeleteMe 指出,目前沒有用戶可自行防止自己號碼被 AI 引用的簡單方法,只能事後透過資料下架服務降低風險。
目前 AI 公司做了什麼保護措施?(Anthropic/Google/OpenAI 比較)
各 AI 公司對個資保護的政策與實際執行情況不一,以下整理三大主流 AI 的現況:
Anthropic(Claude):明確政策但執行有限
Anthropic 在 Claude 的系統指引(Constitutional AI)中明確要求「選擇含最少他人個人資料的回應」。這表示當模型有多個回應選項時,應優先選擇不包含個資的版本。
然而,這項政策的實際效果有限:①只在「有其他選項」時才生效,若模型只記得一個答案且包含個資,仍會輸出 ②15% 的 DeleteMe 投訴仍提及 Claude,顯示政策未完全阻止洩漏。
Google(Gemini):問題最嚴重的平台之一
Gemini 在 DeleteMe 投訴中占 20%,且多起真實案例(Daniel Abraham、華盛頓大學)都與 Gemini 有關。Google 目前尚未公開說明針對訓練資料中個資的具體過濾機制。
Google 搜尋整合的 AI Overview 功能也有類似問題:Reddit 用戶案例顯示,AI Overview 可能把私人號碼當成商業聯絡方式顯示在搜尋結果頂端。
OpenAI(ChatGPT):投訴最多但政策不透明
ChatGPT 電話號碼外洩問題占 DeleteMe 投訴的 55%——這可能反映其最高的市佔率,而非政策最差。OpenAI未公開說明如何處理訓練資料中的個資,也未提供用戶主動要求移除資料的管道。
產業現況:缺乏統一標準
目前沒有 AI 公司提供「用戶主動要求從訓練資料移除個資」的簡單機制。即使歐盟 GDPR 賦予「被遺忘權」,但 AI 公司多主張訓練資料已去識別化或受合理使用保護,實際執行困難。
現在能怎麼做?(有限的防護方法)
目前沒有完全阻止 AI 洩漏你號碼的方法,但以下措施可降低風險:
方法 1:使用資料下架服務(事後補救)
DeleteMe、Optery、Incogni 等服務會幫你向資料仲介商提交下架要求。雖然無法移除已進入 AI 訓練資料的記錄,但可減少未來新一輪訓練時被收錄的機會。
- 費用:年費約 $100-200 美元
- 效果:可下架大部分資料仲介商網站,但無法保證 AI 不再輸出你的資料
方法 2:Google 帳號設定「不納入 AI 訓練」(有限效果)
Google 允許用戶在帳號設定中選擇「不使用我的活動改善 AI 服務」,但這只適用於你的搜尋歷史和互動資料,不影響公開網頁上的資料被爬取。
方法 3:檢查並移除公開網頁上的號碼(預防性)
- 搜尋
"你的電話號碼"(加引號)找出所有包含號碼的網頁 - 向網站管理員或平台客服要求移除或修改聯絡方式
- 若是自己的網站,改用聯絡表單取代直接顯示號碼
方法 4:使用虛擬號碼(最有效的預防)
若需在公開場合留聯絡方式,使用Google Voice、Skype 號碼等虛擬電話,可隨時停用或更換,不影響真實號碼。
現實限制
即使執行上述所有措施,已進入 AI 訓練資料的記錄無法移除。除非 AI 公司重新訓練模型並排除個資(成本極高且技術困難),否則你的號碼可能在未來數年仍被模型記住。
AI 洩漏電話號碼流程圖
═══════════════════════════════════════════════════════════════
Step 1: 資料來源 Step 2: AI 訓練 Step 3: 用戶查詢
┌─────────────────┐ ┌─────────────────┐ ┌──────────────┐
│ 公開網頁 │ │ 網路爬蟲 │ │ 用戶問 AI │
│ - 商業網站 │────────────▶│ 建立資料快照 │─────────▶│ 「PayBox │
│ - 論壇貼文 │ │ 逐字記憶訓練 │ │ 客服電話?」│
│ - 學術通訊錄 │ └─────────────────┘ └──────────────┘
└─────────────────┘ │ │
│ │
┌─────────────────┐ ▼ ▼
│ 資料仲介商 │ ┌─────────────────┐ ┌──────────────┐
│ - 31/578 家 │────────────▶│ 模型內部記憶 │─────────▶│ AI 輸出 │
│ - 彙整公開資料 │ │ - 電話號碼 │ │ 真實號碼 │
│ - 賣給 AI 公司 │ │ - 即使只出現1次 │ │ (非官方號碼) │
└─────────────────┘ └─────────────────┘ └──────────────┘
⚠️
刪除原始網頁無法移除模型記憶
資料快照已永久存檔於訓練集
常見問題(FAQ)
我從沒公開過號碼,為什麼 AI 還是知道?
可能有三個來源:①資料仲介商從公開紀錄(如公司登記、不動產交易)彙整後賣給 AI 公司 ②你曾在已刪除的舊文章、論壇貼文留過號碼,但 AI 爬蟲在刪除前已存檔 ③內部通訊錄(學校、公司)被外洩或分享給協作者時被收錄。即使你本人沒公開,第三方仍可能讓你的資料進入訓練集。
刪除網頁上的號碼後,AI 還會繼續輸出嗎?
會。AI 訓練資料採用「快照機制」——爬蟲在特定時間點存檔網頁內容後,即使你刪除原始網頁,訓練集中的記錄仍然存在。除非 AI 公司重新訓練模型並排除個資(技術上困難且成本極高),否則模型會持續記住已學過的資料。這就是為什麼 2015 年的論壇貼文在 2026 年仍可能被引用。
ChatGPT、Gemini、Claude 哪個最容易洩漏個資?
根據 DeleteMe 數據,ChatGPT 占投訴 55%、Gemini 20%、Claude 15%。ChatGPT 比例最高可能反映其市佔率最大,而非政策最差。Gemini 雖然占比較低,但實際案例(Daniel Abraham、華盛頓大學)多與 Gemini 有關。Anthropic 的 Claude 有明確政策要求「選擇含最少個資的回應」,但仍無法完全阻止洩漏。目前沒有任何一家 AI 公司能保證完全不輸出個資。
可以要求 AI 公司從訓練資料刪除我的號碼嗎?
目前沒有簡單的申請管道。雖然歐盟 GDPR 賦予「被遺忘權」,但 AI 公司多主張訓練資料已去識別化或屬於合理使用範圍。實務上,從已訓練完成的模型中移除特定資料(稱為「機器遺忘」machine unlearning)技術困難且成本極高。OpenAI、Google、Anthropic 目前都未提供用戶主動要求移除訓練資料的功能。
使用資料下架服務(如 DeleteMe)有用嗎?
有限度有用。這類服務可幫你向資料仲介商提交下架要求,減少未來新一輪 AI 訓練時被收錄的機會。但無法移除已進入現有訓練集的資料——那些記錄已永久存在於模型記憶中。適合對象:高風險族群(自營業者、公眾人物)或已發現號碼被 AI 引用的人。費用約年費 $100-200 美元,需持續訂閱才能維持下架狀態。
延伸閱讀
- Claude Code Custom Instructions 是什麼?自訂指令完整教學(2026)
- Anthropic Prompt Caching 是什麼?省 90% API 費用完整說明
- OpenAI Realtime API 是什麼?語音對話 API 完整說明(2026)
- MCP Protocol 是什麼?Model Context Protocol 完整說明(2026)
- AI 訓練資料隱私問題整理:你的對話會被拿去訓練嗎?(2026)
關於作者
我是雲林AI老師,整理 AI 工具與技術更新給需要的人。這篇文章根據 MIT Technology Review 2026-05-13 報導改寫,涵蓋 Gemini 個資外洩真實案例、DeleteMe 數據、AI 公司政策比較與實際可用的防護方法。有任何 AI 隱私問題想了解,歡迎參考網站其他文章。
資料來源:MIT Technology Review(2026-05-13)
解壓縮 → 拖入 Claude Code → 輸入任意一句話,5 分鐘完成安裝
✅ EvoForge 核心功能:
🧠 三層記憶系統,50 Token 完成查詢(關掉不再忘記)
🔗 85-Token 跨對話橋接,任務中斷秒速恢復不重頭來
⚡ DCI 動態 Context 注入,省 70%+ Token
📈 Stop Hook 自動進化,同類任務 3 次自動腳本化
🛠️ 12 個核心技能,/斜線指令開箱即用
🤖 3 個子代理協作,不消耗主對話 Token
原價 NT$1,288
NT$600
前 100 名優惠 · 買斷不收月費 · MIT 授權可自由修改
Mac & Windows 適用 · 確認匯款後立即出貨 · LINE:kenemail2

