AI 洩漏你的真實電話號碼?Gemini 個資外洩原因與防護整理(2026)

2026 年 3 月,以色列軟體工程師 Daniel Abraham 突然收到陌生人的 WhatsApp 訊息,對方說是透過 Gemini 查詢客服電話時得到他的號碼。這不是個案——根據 MIT Technology Review 報導,AI 洩漏個人電話問題正在快速擴大,過去 7 個月相關投訴增加 400%。整理你需要知道的關鍵事實:為什麼 AI 會洩漏真實電話號碼、哪些人風險最高、目前能做什麼保護措施。

AI 洩漏電話號碼是怎麼發生的?

AI 洩漏個人電話的機制源自大型語言模型(LLM)的訓練資料來源:這些模型透過爬取大量網路公開資料來學習,過程中不可避免地記住了個人資料,包括電話號碼、電子郵件、地址等。

與多數人的直覺相反,並非只有高頻出現的資料才會被記住。研究顯示,LLM 會逐字記憶訓練資料中的內容,即使是只出現過一次的電話號碼,也可能在特定查詢條件下被模型輸出。

加州資料中介商登記資料顯示,578 家資料仲介商中有 31 家(5.4%)在過去一年向 AI 公司出售資料。這些資料可能包含從公開來源彙整的個人聯絡方式,進一步增加你的號碼被 AI 記住的機會。

真實案例:這些人的號碼是怎麼被 Gemini 說出來的

案例一:PayBox 客服查詢變成私人號碼

以色列軟體工程師 Daniel Abraham 在 2026 年 3 月被陌生人透過 WhatsApp 聯繫。對方解釋:他在 Gemini 查詢 PayBox(以色列付款服務)的客服電話時,AI 直接給出 Abraham 的私人手機號碼。Abraham 從未在任何公開文章或網站上公布這個號碼,推測可能是資料仲介商彙整後被 AI 訓練資料收錄。

案例二:律師事務所電話變成個人號碼

一位 Reddit 用戶在一個月內接到大量陌生來電,詢問法律諮詢服務。經查證後發現,Google AI(包含搜尋整合的 AI 功能)把他的個人號碼當成某律師事務所的聯絡電話,導致需要法律服務的人直接打給他。

案例三:學術圈內部號碼外洩

華盛頓大學一位 PhD 候選人在測試 Gemini 時,詢問同事的聯絡方式,Gemini 直接給出同事從未公開的私人手機號碼。這顯示即使是小範圍流通的資料(如學校內部通訊錄、會議簽到表),也可能透過某些途徑進入 AI 訓練資料。

💡 反直覺事實:多數人以為刪了網路文章就安全,但 2015 年留在論壇的一則貼文,2026 年仍可能被 AI 引用——因為訓練資料快照早已存檔。

為什麼刪掉舊文章也沒用?(訓練資料機制說明)

AI 訓練資料的「快照特性」決定了刪除現有網頁內容無法阻止 AI 洩漏個資。

當 AI 公司(如 OpenAI、Google、Anthropic)爬取網路資料時,他們會建立資料快照(snapshot)並存檔。即使你在 2026 年刪除了 2018 年發布的部落格文章,AI 公司在 2023 年爬取時已經把那篇文章(包含你留的電話號碼)存進訓練資料集。

模型記憶機制:不只記住常見資料

過去研究顯示,大型語言模型會逐字記憶訓練資料(verbatim memorization),而非只萃取統計模式。這表示:

  • 你的號碼只需要出現過一次,就可能被記住
  • 查詢條件符合時(如「PayBox 客服電話」),模型可能直接輸出記憶中的資料
  • 即使資料來源已下架,模型仍保有記憶

資料仲介商的角色

根據加州法律要求公開的登記資料,5.4% 的資料仲介商(31/578 家)曾在過去一年向 AI 公司出售資料。這些公司彙整公開來源(如黃頁、商業登記、社群媒體)的個人資料後打包販售,進一步擴大你的資料被 AI 記住的管道。

哪些人的電話最容易被 AI 引用?(風險族群)

風險評估框架:你的號碼被 AI 洩漏的機率取決於以下條件

高風險族群 1:曾在公開網頁刊載號碼

  • 自營業者、律師、會計師、房仲:官網、黃頁、Google 商家檔案上的號碼
  • 學術研究者:論文聯絡方式、會議網站、機構目錄
  • 社團幹部、活動主辦人:活動網站、報名表單、新聞稿

高風險族群 2:資料出現在資料仲介商資料庫

即使你從未主動公開號碼,以下情況仍可能讓資料仲介商取得你的資料:

  • 過去曾在論壇、拍賣網站、租屋平台留下號碼(即使已刪除)
  • 公司登記、不動產交易等公開紀錄
  • 社群媒體朋友公開的合照標註或貼文提及

中風險族群:內部通訊錄外洩

學校、公司、社團的內部通訊錄若曾被上傳至雲端、分享給外部協作者,或被駭客外洩,你的號碼就可能進入訓練資料。華盛頓大學案例顯示,即使是小範圍流通的資料也有風險

較低風險族群

從未在任何線上平台留下號碼、不曾註冊需要手機驗證的服務、個人資料未出現在公開紀錄的人,風險相對較低——但仍無法完全排除(例如朋友可能在社群貼文中提及你的號碼)。

DeleteMe 數據:AI 隱私投訴增加 400%

DeleteMe 是一家專門協助用戶從資料仲介商網站下架個人資料的公司,他們的客服數據提供了 AI 隱私問題擴大的直接證據。

核心數據:過去 7 個月增加 400%

根據 MIT Technology Review 報導,DeleteMe 表示過去 7 個月收到的 AI 相關隱私投訴增加 400%,總數達數千件。這些投訴主要涉及:

  • AI 聊天機器人(如 ChatGPT、Gemini、Claude)給出用戶的真實電話號碼
  • Google 搜尋結果的 AI 摘要(AI Overview)顯示錯誤或私密的聯絡方式
  • 用戶發現自己的資料出現在 AI 訓練資料外洩事件中

提及比例分布

在這些投訴中,55% 提及 ChatGPT、20% Gemini、15% Claude、10% 其他 AI 工具。ChatGPT 比例最高可能與其市佔率和使用量有關,但 Gemini 個資外洩問題也占了五分之一,顯示這不是單一 AI 公司的問題。

趨勢意義

400% 的增長速度顯示兩個現象:①大眾開始意識到 AI 隱私風險 ②AI 工具普及後,個資被引用的實際案例快速增加。DeleteMe 指出,目前沒有用戶可自行防止自己號碼被 AI 引用的簡單方法,只能事後透過資料下架服務降低風險。

目前 AI 公司做了什麼保護措施?(Anthropic/Google/OpenAI 比較)

各 AI 公司對個資保護的政策與實際執行情況不一,以下整理三大主流 AI 的現況:

Anthropic(Claude):明確政策但執行有限

Anthropic 在 Claude 的系統指引(Constitutional AI)中明確要求「選擇含最少他人個人資料的回應」。這表示當模型有多個回應選項時,應優先選擇不包含個資的版本。

然而,這項政策的實際效果有限:①只在「有其他選項」時才生效,若模型只記得一個答案且包含個資,仍會輸出 ②15% 的 DeleteMe 投訴仍提及 Claude,顯示政策未完全阻止洩漏。

Google(Gemini):問題最嚴重的平台之一

Gemini 在 DeleteMe 投訴中占 20%,且多起真實案例(Daniel Abraham、華盛頓大學)都與 Gemini 有關。Google 目前尚未公開說明針對訓練資料中個資的具體過濾機制

Google 搜尋整合的 AI Overview 功能也有類似問題:Reddit 用戶案例顯示,AI Overview 可能把私人號碼當成商業聯絡方式顯示在搜尋結果頂端。

OpenAI(ChatGPT):投訴最多但政策不透明

ChatGPT 電話號碼外洩問題占 DeleteMe 投訴的 55%——這可能反映其最高的市佔率,而非政策最差。OpenAI未公開說明如何處理訓練資料中的個資,也未提供用戶主動要求移除資料的管道。

產業現況:缺乏統一標準

目前沒有 AI 公司提供「用戶主動要求從訓練資料移除個資」的簡單機制。即使歐盟 GDPR 賦予「被遺忘權」,但 AI 公司多主張訓練資料已去識別化或受合理使用保護,實際執行困難。

現在能怎麼做?(有限的防護方法)

目前沒有完全阻止 AI 洩漏你號碼的方法,但以下措施可降低風險:

方法 1:使用資料下架服務(事後補救)

DeleteMe、Optery、Incogni 等服務會幫你向資料仲介商提交下架要求。雖然無法移除已進入 AI 訓練資料的記錄,但可減少未來新一輪訓練時被收錄的機會。

  • 費用:年費約 $100-200 美元
  • 效果:可下架大部分資料仲介商網站,但無法保證 AI 不再輸出你的資料

方法 2:Google 帳號設定「不納入 AI 訓練」(有限效果)

Google 允許用戶在帳號設定中選擇「不使用我的活動改善 AI 服務」,但這只適用於你的搜尋歷史和互動資料,不影響公開網頁上的資料被爬取

方法 3:檢查並移除公開網頁上的號碼(預防性)

  • 搜尋 "你的電話號碼"(加引號)找出所有包含號碼的網頁
  • 向網站管理員或平台客服要求移除或修改聯絡方式
  • 若是自己的網站,改用聯絡表單取代直接顯示號碼

方法 4:使用虛擬號碼(最有效的預防)

若需在公開場合留聯絡方式,使用Google Voice、Skype 號碼等虛擬電話,可隨時停用或更換,不影響真實號碼。

現實限制

即使執行上述所有措施,已進入 AI 訓練資料的記錄無法移除。除非 AI 公司重新訓練模型並排除個資(成本極高且技術困難),否則你的號碼可能在未來數年仍被模型記住。


AI 洩漏電話號碼流程圖
═══════════════════════════════════════════════════════════════

Step 1: 資料來源                Step 2: AI 訓練              Step 3: 用戶查詢
┌─────────────────┐             ┌─────────────────┐          ┌──────────────┐
│ 公開網頁        │             │ 網路爬蟲        │          │ 用戶問 AI    │
│ - 商業網站      │────────────▶│ 建立資料快照    │─────────▶│ 「PayBox     │
│ - 論壇貼文      │             │ 逐字記憶訓練    │          │  客服電話?」│
│ - 學術通訊錄    │             └─────────────────┘          └──────────────┘
└─────────────────┘                      │                           │
                                         │                           │
┌─────────────────┐                      ▼                           ▼
│ 資料仲介商      │             ┌─────────────────┐          ┌──────────────┐
│ - 31/578 家     │────────────▶│ 模型內部記憶    │─────────▶│ AI 輸出      │
│ - 彙整公開資料  │             │ - 電話號碼      │          │ 真實號碼     │
│ - 賣給 AI 公司  │             │ - 即使只出現1次 │          │ (非官方號碼) │
└─────────────────┘             └─────────────────┘          └──────────────┘

                                        ⚠️
                        刪除原始網頁無法移除模型記憶
                        資料快照已永久存檔於訓練集

常見問題(FAQ)

我從沒公開過號碼,為什麼 AI 還是知道?

可能有三個來源:①資料仲介商從公開紀錄(如公司登記、不動產交易)彙整後賣給 AI 公司 ②你曾在已刪除的舊文章、論壇貼文留過號碼,但 AI 爬蟲在刪除前已存檔 ③內部通訊錄(學校、公司)被外洩或分享給協作者時被收錄。即使你本人沒公開,第三方仍可能讓你的資料進入訓練集。

刪除網頁上的號碼後,AI 還會繼續輸出嗎?

會。AI 訓練資料採用「快照機制」——爬蟲在特定時間點存檔網頁內容後,即使你刪除原始網頁,訓練集中的記錄仍然存在。除非 AI 公司重新訓練模型並排除個資(技術上困難且成本極高),否則模型會持續記住已學過的資料。這就是為什麼 2015 年的論壇貼文在 2026 年仍可能被引用。

ChatGPT、Gemini、Claude 哪個最容易洩漏個資?

根據 DeleteMe 數據,ChatGPT 占投訴 55%、Gemini 20%、Claude 15%。ChatGPT 比例最高可能反映其市佔率最大,而非政策最差。Gemini 雖然占比較低,但實際案例(Daniel Abraham、華盛頓大學)多與 Gemini 有關。Anthropic 的 Claude 有明確政策要求「選擇含最少個資的回應」,但仍無法完全阻止洩漏。目前沒有任何一家 AI 公司能保證完全不輸出個資。

可以要求 AI 公司從訓練資料刪除我的號碼嗎?

目前沒有簡單的申請管道。雖然歐盟 GDPR 賦予「被遺忘權」,但 AI 公司多主張訓練資料已去識別化或屬於合理使用範圍。實務上,從已訓練完成的模型中移除特定資料(稱為「機器遺忘」machine unlearning)技術困難且成本極高。OpenAI、Google、Anthropic 目前都未提供用戶主動要求移除訓練資料的功能。

使用資料下架服務(如 DeleteMe)有用嗎?

有限度有用。這類服務可幫你向資料仲介商提交下架要求,減少未來新一輪 AI 訓練時被收錄的機會。但無法移除已進入現有訓練集的資料——那些記錄已永久存在於模型記憶中。適合對象:高風險族群(自營業者、公眾人物)或已發現號碼被 AI 引用的人。費用約年費 $100-200 美元,需持續訂閱才能維持下架狀態。

延伸閱讀


關於作者

我是雲林AI老師,整理 AI 工具與技術更新給需要的人。這篇文章根據 MIT Technology Review 2026-05-13 報導改寫,涵蓋 Gemini 個資外洩真實案例、DeleteMe 數據、AI 公司政策比較與實際可用的防護方法。有任何 AI 隱私問題想了解,歡迎參考網站其他文章


資料來源:MIT Technology Review(2026-05-13)

🚀 想讓 Claude Code 記住你的偏好與工作流程?

省下每次對話都要重複說明的時間,讓 AI 助理真正變成你的助理。

查看 Claude Code 記憶與技能套件

🚀 EvoForge 進化工坊|讓 Claude Code 會記憶、會學習、會進化 →

解壓縮 → 拖入 Claude Code → 輸入任意一句話,5 分鐘完成安裝

✅ EvoForge 核心功能:

🧠 三層記憶系統,50 Token 完成查詢(關掉不再忘記)

🔗 85-Token 跨對話橋接,任務中斷秒速恢復不重頭來

⚡ DCI 動態 Context 注入,省 70%+ Token

📈 Stop Hook 自動進化,同類任務 3 次自動腳本化

🛠️ 12 個核心技能,/斜線指令開箱即用

🤖 3 個子代理協作,不消耗主對話 Token

原價 NT$1,288

NT$600

前 100 名優惠 · 買斷不收月費 · MIT 授權可自由修改

Mac & Windows 適用 · 確認匯款後立即出貨 · LINE:kenemail2

Compare Listings

TitlePriceStatusTypeAreaPurposeBedroomsBathrooms

Compare