AI 洩漏你的真實電話號碼？Gemini 個資外洩原因與防護整理（2026）

Q: 可以要求 AI 公司從訓練資料刪除我的號碼嗎？

目前沒有簡單的申請管道。實務上,從已訓練完成的模型中移除特定資料（稱為「機器遺忘」machine unlearning）技術困難且成本極高。OpenAI、Google、Anthropic 目前都未提供用戶主動要求移除訓練資料的功能。

2026 年 3 月，以色列軟體工程師 Daniel Abraham 突然收到陌生人的 WhatsApp 訊息，對方說是透過 Gemini 查詢客服電話時得到他的號碼。這不是個案——根據 MIT Technology Review 報導，AI 洩漏個人電話問題正在快速擴大，過去 7 個月相關投訴增加 400%。整理你需要知道的關鍵事實：為什麼 AI 會洩漏真實電話號碼、哪些人風險最高、目前能做什麼保護措施。

AI 洩漏電話號碼是怎麼發生的？

AI 洩漏個人電話的機制源自大型語言模型（LLM）的訓練資料來源：這些模型透過爬取大量網路公開資料來學習，過程中不可避免地記住了個人資料，包括電話號碼、電子郵件、地址等。

與多數人的直覺相反，並非只有高頻出現的資料才會被記住。研究顯示，LLM 會逐字記憶訓練資料中的內容，即使是只出現過一次的電話號碼，也可能在特定查詢條件下被模型輸出。

加州資料中介商登記資料顯示，578 家資料仲介商中有 31 家（5.4%）在過去一年向 AI 公司出售資料。這些資料可能包含從公開來源彙整的個人聯絡方式，進一步增加你的號碼被 AI 記住的機會。

真實案例：這些人的號碼是怎麼被 Gemini 說出來的

案例一：PayBox 客服查詢變成私人號碼

以色列軟體工程師 Daniel Abraham 在 2026 年 3 月被陌生人透過 WhatsApp 聯繫。對方解釋：他在 Gemini 查詢 PayBox（以色列付款服務）的客服電話時，AI 直接給出 Abraham 的私人手機號碼。Abraham 從未在任何公開文章或網站上公布這個號碼，推測可能是資料仲介商彙整後被 AI 訓練資料收錄。

案例二：律師事務所電話變成個人號碼

一位 Reddit 用戶在一個月內接到大量陌生來電，詢問法律諮詢服務。經查證後發現，Google AI（包含搜尋整合的 AI 功能）把他的個人號碼當成某律師事務所的聯絡電話，導致需要法律服務的人直接打給他。

案例三：學術圈內部號碼外洩

華盛頓大學一位 PhD 候選人在測試 Gemini 時，詢問同事的聯絡方式，Gemini 直接給出同事從未公開的私人手機號碼。這顯示即使是小範圍流通的資料（如學校內部通訊錄、會議簽到表），也可能透過某些途徑進入 AI 訓練資料。

💡 反直覺事實：多數人以為刪了網路文章就安全，但 2015 年留在論壇的一則貼文，2026 年仍可能被 AI 引用——因為訓練資料快照早已存檔。

為什麼刪掉舊文章也沒用？（訓練資料機制說明）

AI 訓練資料的「快照特性」決定了刪除現有網頁內容無法阻止 AI 洩漏個資。

當 AI 公司（如 OpenAI、Google、Anthropic）爬取網路資料時，他們會建立資料快照（snapshot）並存檔。即使你在 2026 年刪除了 2018 年發布的部落格文章，AI 公司在 2023 年爬取時已經把那篇文章（包含你留的電話號碼）存進訓練資料集。

模型記憶機制：不只記住常見資料

過去研究顯示，大型語言模型會逐字記憶訓練資料（verbatim memorization），而非只萃取統計模式。這表示：

你的號碼只需要出現過一次，就可能被記住
查詢條件符合時（如「PayBox 客服電話」），模型可能直接輸出記憶中的資料
即使資料來源已下架，模型仍保有記憶

資料仲介商的角色

根據加州法律要求公開的登記資料，5.4% 的資料仲介商（31/578 家）曾在過去一年向 AI 公司出售資料。這些公司彙整公開來源（如黃頁、商業登記、社群媒體）的個人資料後打包販售,進一步擴大你的資料被 AI 記住的管道。

哪些人的電話最容易被 AI 引用？（風險族群）

風險評估框架：你的號碼被 AI 洩漏的機率取決於以下條件

高風險族群 1：曾在公開網頁刊載號碼

自營業者、律師、會計師、房仲：官網、黃頁、Google 商家檔案上的號碼
學術研究者：論文聯絡方式、會議網站、機構目錄
社團幹部、活動主辦人:活動網站、報名表單、新聞稿

高風險族群 2：資料出現在資料仲介商資料庫

即使你從未主動公開號碼，以下情況仍可能讓資料仲介商取得你的資料：

過去曾在論壇、拍賣網站、租屋平台留下號碼（即使已刪除）
公司登記、不動產交易等公開紀錄
社群媒體朋友公開的合照標註或貼文提及

中風險族群：內部通訊錄外洩

學校、公司、社團的內部通訊錄若曾被上傳至雲端、分享給外部協作者,或被駭客外洩,你的號碼就可能進入訓練資料。華盛頓大學案例顯示，即使是小範圍流通的資料也有風險。

較低風險族群

從未在任何線上平台留下號碼、不曾註冊需要手機驗證的服務、個人資料未出現在公開紀錄的人,風險相對較低——但仍無法完全排除（例如朋友可能在社群貼文中提及你的號碼）。

DeleteMe 數據：AI 隱私投訴增加 400%

DeleteMe 是一家專門協助用戶從資料仲介商網站下架個人資料的公司，他們的客服數據提供了 AI 隱私問題擴大的直接證據。

核心數據：過去 7 個月增加 400%

根據 MIT Technology Review 報導，DeleteMe 表示過去 7 個月收到的 AI 相關隱私投訴增加 400%，總數達數千件。這些投訴主要涉及：

AI 聊天機器人（如 ChatGPT、Gemini、Claude）給出用戶的真實電話號碼
Google 搜尋結果的 AI 摘要（AI Overview）顯示錯誤或私密的聯絡方式
用戶發現自己的資料出現在 AI 訓練資料外洩事件中

提及比例分布

在這些投訴中，55% 提及 ChatGPT、20% Gemini、15% Claude、10% 其他 AI 工具。ChatGPT 比例最高可能與其市佔率和使用量有關，但 Gemini 個資外洩問題也占了五分之一，顯示這不是單一 AI 公司的問題。

趨勢意義

400% 的增長速度顯示兩個現象：①大眾開始意識到 AI 隱私風險 ②AI 工具普及後，個資被引用的實際案例快速增加。DeleteMe 指出，目前沒有用戶可自行防止自己號碼被 AI 引用的簡單方法，只能事後透過資料下架服務降低風險。

目前 AI 公司做了什麼保護措施？（Anthropic/Google/OpenAI 比較）

各 AI 公司對個資保護的政策與實際執行情況不一，以下整理三大主流 AI 的現況：

Anthropic（Claude）：明確政策但執行有限

Anthropic 在 Claude 的系統指引（Constitutional AI）中明確要求「選擇含最少他人個人資料的回應」。這表示當模型有多個回應選項時，應優先選擇不包含個資的版本。

然而，這項政策的實際效果有限：①只在「有其他選項」時才生效，若模型只記得一個答案且包含個資，仍會輸出 ②15% 的 DeleteMe 投訴仍提及 Claude，顯示政策未完全阻止洩漏。

Google（Gemini）：問題最嚴重的平台之一

Gemini 在 DeleteMe 投訴中占 20%，且多起真實案例（Daniel Abraham、華盛頓大學）都與 Gemini 有關。Google 目前尚未公開說明針對訓練資料中個資的具體過濾機制。

Google 搜尋整合的 AI Overview 功能也有類似問題：Reddit 用戶案例顯示，AI Overview 可能把私人號碼當成商業聯絡方式顯示在搜尋結果頂端。

OpenAI（ChatGPT）：投訴最多但政策不透明

ChatGPT 電話號碼外洩問題占 DeleteMe 投訴的 55%——這可能反映其最高的市佔率，而非政策最差。OpenAI未公開說明如何處理訓練資料中的個資，也未提供用戶主動要求移除資料的管道。

產業現況：缺乏統一標準

目前沒有 AI 公司提供「用戶主動要求從訓練資料移除個資」的簡單機制。即使歐盟 GDPR 賦予「被遺忘權」，但 AI 公司多主張訓練資料已去識別化或受合理使用保護，實際執行困難。

現在能怎麼做？（有限的防護方法）

目前沒有完全阻止 AI 洩漏你號碼的方法，但以下措施可降低風險：

方法 1：使用資料下架服務（事後補救）

DeleteMe、Optery、Incogni 等服務會幫你向資料仲介商提交下架要求。雖然無法移除已進入 AI 訓練資料的記錄，但可減少未來新一輪訓練時被收錄的機會。

費用：年費約 $100-200 美元
效果：可下架大部分資料仲介商網站，但無法保證 AI 不再輸出你的資料

方法 2：Google 帳號設定「不納入 AI 訓練」（有限效果）

Google 允許用戶在帳號設定中選擇「不使用我的活動改善 AI 服務」，但這只適用於你的搜尋歷史和互動資料，不影響公開網頁上的資料被爬取。

方法 3：檢查並移除公開網頁上的號碼（預防性）

搜尋 "你的電話號碼"（加引號）找出所有包含號碼的網頁
向網站管理員或平台客服要求移除或修改聯絡方式
若是自己的網站，改用聯絡表單取代直接顯示號碼

方法 4：使用虛擬號碼（最有效的預防）

若需在公開場合留聯絡方式，使用Google Voice、Skype 號碼等虛擬電話，可隨時停用或更換，不影響真實號碼。

現實限制

即使執行上述所有措施，已進入 AI 訓練資料的記錄無法移除。除非 AI 公司重新訓練模型並排除個資（成本極高且技術困難），否則你的號碼可能在未來數年仍被模型記住。


AI 洩漏電話號碼流程圖
═══════════════════════════════════════════════════════════════

Step 1: 資料來源                Step 2: AI 訓練              Step 3: 用戶查詢
┌─────────────────┐             ┌─────────────────┐          ┌──────────────┐
│ 公開網頁        │             │ 網路爬蟲        │          │ 用戶問 AI    │
│ - 商業網站      │────────────▶│ 建立資料快照    │─────────▶│ 「PayBox     │
│ - 論壇貼文      │             │ 逐字記憶訓練    │          │  客服電話？」│
│ - 學術通訊錄    │             └─────────────────┘          └──────────────┘
└─────────────────┘                      │                           │
                                         │                           │
┌─────────────────┐                      ▼                           ▼
│ 資料仲介商      │             ┌─────────────────┐          ┌──────────────┐
│ - 31/578 家     │────────────▶│ 模型內部記憶    │─────────▶│ AI 輸出      │
│ - 彙整公開資料  │             │ - 電話號碼      │          │ 真實號碼     │
│ - 賣給 AI 公司  │             │ - 即使只出現1次 │          │ (非官方號碼) │
└─────────────────┘             └─────────────────┘          └──────────────┘

                                        ⚠️
                        刪除原始網頁無法移除模型記憶
                        資料快照已永久存檔於訓練集

常見問題（FAQ）

我從沒公開過號碼，為什麼 AI 還是知道？

可能有三個來源：①資料仲介商從公開紀錄（如公司登記、不動產交易）彙整後賣給 AI 公司 ②你曾在已刪除的舊文章、論壇貼文留過號碼，但 AI 爬蟲在刪除前已存檔 ③內部通訊錄（學校、公司）被外洩或分享給協作者時被收錄。即使你本人沒公開，第三方仍可能讓你的資料進入訓練集。

刪除網頁上的號碼後,AI 還會繼續輸出嗎？

會。AI 訓練資料採用「快照機制」——爬蟲在特定時間點存檔網頁內容後,即使你刪除原始網頁,訓練集中的記錄仍然存在。除非 AI 公司重新訓練模型並排除個資（技術上困難且成本極高）,否則模型會持續記住已學過的資料。這就是為什麼 2015 年的論壇貼文在 2026 年仍可能被引用。

ChatGPT、Gemini、Claude 哪個最容易洩漏個資？

根據 DeleteMe 數據,ChatGPT 占投訴 55%、Gemini 20%、Claude 15%。ChatGPT 比例最高可能反映其市佔率最大,而非政策最差。Gemini 雖然占比較低,但實際案例（Daniel Abraham、華盛頓大學）多與 Gemini 有關。Anthropic 的 Claude 有明確政策要求「選擇含最少個資的回應」,但仍無法完全阻止洩漏。目前沒有任何一家 AI 公司能保證完全不輸出個資。

可以要求 AI 公司從訓練資料刪除我的號碼嗎？

目前沒有簡單的申請管道。雖然歐盟 GDPR 賦予「被遺忘權」,但 AI 公司多主張訓練資料已去識別化或屬於合理使用範圍。實務上,從已訓練完成的模型中移除特定資料（稱為「機器遺忘」machine unlearning）技術困難且成本極高。OpenAI、Google、Anthropic 目前都未提供用戶主動要求移除訓練資料的功能。

使用資料下架服務（如 DeleteMe）有用嗎？

有限度有用。這類服務可幫你向資料仲介商提交下架要求,減少未來新一輪 AI 訓練時被收錄的機會。但無法移除已進入現有訓練集的資料——那些記錄已永久存在於模型記憶中。適合對象：高風險族群（自營業者、公眾人物）或已發現號碼被 AI 引用的人。費用約年費 $100-200 美元,需持續訂閱才能維持下架狀態。

關於作者

我是雲林AI老師，整理 AI 工具與技術更新給需要的人。這篇文章根據 MIT Technology Review 2026-05-13 報導改寫，涵蓋 Gemini 個資外洩真實案例、DeleteMe 數據、AI 公司政策比較與實際可用的防護方法。有任何 AI 隱私問題想了解，歡迎參考網站其他文章。

資料來源：MIT Technology Review（2026-05-13）

🚀 想讓 Claude Code 記住你的偏好與工作流程？

省下每次對話都要重複說明的時間，讓 AI 助理真正變成你的助理。

查看 Claude Code 記憶與技能套件

🚀 EvoForge 進化工坊｜讓 Claude Code 會記憶、會學習、會進化 →

解壓縮 → 拖入 Claude Code → 輸入任意一句話，5 分鐘完成安裝

✅ EvoForge 核心功能：

🧠 三層記憶系統，50 Token 完成查詢（關掉不再忘記）

🔗 85-Token 跨對話橋接，任務中斷秒速恢復不重頭來

⚡ DCI 動態 Context 注入，省 70%+ Token

📈 Stop Hook 自動進化，同類任務 3 次自動腳本化

🛠️ 12 個核心技能，/斜線指令開箱即用

🤖 3 個子代理協作，不消耗主對話 Token

原價 NT$1,288

NT$600

前 100 名優惠 · 買斷不收月費 · MIT 授權可自由修改

加 LINE 立即購買 → 0906707964
📖 了解更多完整介紹 →

Mac & Windows 適用 · 確認匯款後立即出貨 · LINE：kenemail2