AI 模型要在瀏覽器執行,不用伺服器、保護隱私,還能離線運作?Transformers.js Chrome 擴充套件讓開發者把模型直接放進瀏覽器,完全本地端推理。今天根據 Hugging Face 官方教學,整理這個開源方案的架構與適用情境。
Transformers.js 是什麼?
Transformers.js 是 Hugging Face 推出的 JavaScript 版機器學習函式庫,讓 AI 模型完全在瀏覽器或 Node.js 執行,不需要 Python、不用架伺服器,所有推理計算都在使用者的裝置完成。
根據 Hugging Face 官方說明,Transformers.js 支援文字生成、文本分類、問答系統、嵌入向量等功能。模型採用 ONNX 格式,量化壓縮後可在瀏覽器高效運作。
這次 Hugging Face 發布的 Chrome 擴充套件範例,展示如何把這個技術整合進瀏覽器工具,讓使用者在網頁閱讀時直接啟動本地端 AI 助理。
為什麼要在瀏覽器本地端跑 AI 模型?
1. 保護隱私:資料不離開使用者裝置,敏感內容不會傳送到雲端,符合 GDPR 等隱私法規。
2. 離線可用:模型載入後可完全離線執行,飛機上或網路不穩定的環境仍可使用。
3. 零 API 費用:不需呼叫 OpenAI 等付費 API,推理成本是零,適合提供免費 AI 功能。
4. 即時回應:無網路來回傳輸延遲,小模型(如嵌入向量模型)執行速度非常快。
Chrome 擴充套件的架構說明
這個範例採用 Manifest V3 架構(現行 Chrome 擴充套件規範),分成三個核心元件:
背景服務工作者(background.js):負責模型初始化與推理。載入 gemma-4-E2B-it-ONNX(q4f16 量化)做文字生成,載入 all-MiniLM-L6-v2-ONNX 做嵌入向量。
側邊欄 UI(sidebar.html):提供聊天介面,透過訊息系統與背景服務工作者溝通。
內容腳本(content.ts):注入到網頁中,提取 DOM 內容(文章段落、標題),使用者選取文字後啟動分析。
狀態管理三層:會話歷史存記憶體、設定存 chrome.storage.local、向量資料存 IndexedDB。
💡 限制:瀏覽器本地端推理速度受裝置效能限制。大型模型在一般筆電較慢,建議選擇量化後的小模型(<3GB)。
適合哪些人使用?
想建立隱私優先 AI 工具的開發者:使用者資料不離開裝置,符合隱私法規,可提供完全免費的 AI 功能。
需要離線使用 AI 助理的使用者:模型初次下載後可永久離線使用,不依賴網路連線。
學習瀏覽器 AI 技術的開發者:這個開源範例提供完整的 ONNX 量化、Chrome Extension、本地端推理參考實作。
總結
Transformers.js Chrome 擴充套件展示了瀏覽器本地端 AI 的完整實作方式。最大優勢是隱私保護與離線可用,開發者可以建立完全不依賴雲端的 AI 工具。
Hugging Face 提供的開源程式碼可直接參考,適合想學習瀏覽器本地端 AI 技術的開發者。量化模型技術持續進步,未來會有更多輕量模型可在瀏覽器高效執行。
資料來源:Hugging Face Blog(2026-04-23)
📚 延伸閱讀:你可能也有興趣
- Google Cloud TPU 8t 與 8i 是什麼?完整解析(2026)
- Noscroll 怎麼用?AI 幫你自動整理社群媒體(2026)
- YouTube AI 肖像偵測功能完整介紹(2026)
- GPT-5.5 正式發布!功能介紹與使用方法(2026)
- 被 Google 拒絕過?Aravind Srinivas 如何讓 Perplexity AI 威脅搜尋霸主
解壓縮 → 拖入 Claude Code → 輸入序號,5 分鐘完成安裝
✅ 套件內含功能:
🧠 雙層記憶系統(跨對話長期記憶,越用越懂你)
🔄 智慧規則載入(自動選最相關規則,省最高 89% Token)
📊 品質評估閘門(文章/程式碼送出前自動評分把關)
⚡ 自動學習任務框架(自動記錯誤→優化流程→持續進化)
🛠️ 11 個內建技能(知識餵養・網頁爬取・每日收尾等)
☁️ Google Drive 雲端同步引導
🔒 單一裝置授權,資料不外傳
原價 NT$1,288
NT$600
前 100 名限定優惠價格
每組序號第一裝置限一用・不可轉讓或分享

