你有沒有想過,花大把錢訂閱 OpenAI API,但其實有更聰明的方式?Hugging Face 推出的 Inference Provider,讓你只需一個免費帳號的 Token,就能透過統一 API 存取 Groq、SambaNova、Together AI 等 16 家頂級 AI 服務商,部分模型完全免費使用。這篇文章帶你從零開始,手把手完成設定。
什麼是 Hugging Face Inference Provider?
先用白話解釋:
Hugging Face Inference Provider = 一個「AI 模型中繼站」,你用一組 HF Token 連線,它幫你轉接到最快或最便宜的服務商,不需要分別申請 16 組 API Key。
傳統上,如果你想同時使用 OpenAI、Groq、Together AI 的模型,你需要:
- 分別去 16 個網站申請帳號
- 記住 16 組 API Key
- 學習每家不同的 API 格式
- 分別管理費用
現在有了 HF Inference Provider,你只需要一個 Hugging Face 免費帳號,透過以下統一入口呼叫所有服務商:
API 入口:https://router.huggingface.co/v1
格式:OpenAI 完全相容(只改 base_url 就好)為什麼值得用?4 大優勢
| 優勢 | 說明 |
|---|---|
| ✅ 免費門檻低 | Hugging Face 帳號免費申請,有基本免費額度 |
| ✅ 不被綁死 | 一套程式碼,可隨時換 Groq、Together、SambaNova 等 16 家 |
| ✅ OpenAI 相容 | 原本用 OpenAI SDK 的程式碼,只改一行 base_url 即可 |
| ✅ 自動選廠商 | 加 :fastest 自動選最快、:cheapest 自動選最便宜 |
支援的 16 家服務商一覽
| 服務商 | 支援功能 | 特色 |
|---|---|---|
| Groq | LLM 文字、視覺模型 | 推理速度最快之一 |
| SambaNova | LLM 文字 | 企業級,大量 token |
| Together AI | LLM、圖片生成 | 開源模型豐富 |
| Fal AI | 圖片、影片、語音 | 多媒體生成強 |
| Replicate | 圖片、影片、語音 | FLUX.1 圖片生成 |
| Cerebras | LLM 文字 | 超低延遲晶片 |
| HF Inference | 全功能(文字/圖/語音) | 官方,支援最多任務 |
| Cohere | LLM、嵌入向量 | 搜尋與 RAG 應用 |
| Fireworks | LLM 文字、視覺 | 快速推理 |
| Novita | LLM、影片 | 影片生成 |
| Nscale | LLM、圖片 | 高效能 |
| Hyperbolic | LLM 文字 | 大型模型 |
| OVHcloud | LLM 文字 | 歐洲資料主權 |
| WaveSpeedAI | 圖片、影片 | 高速生成 |
| Scaleway | LLM、嵌入 | 法國雲端 |
| Z.ai | LLM(含視覺) | GLM 系列中文強 |
架構圖:一個 Token 存取所有服務商
你的程式
│
▼
HF Token(一組)
│
▼
router.huggingface.co/v1
│
├──→ Groq(最快)
├──→ Together AI
├──→ SambaNova
├──→ Fal AI(圖片/影片)
├──→ Replicate(FLUX.1)
└──→ 其他 11 家...
Step 1:申請免費 HF Token(3 分鐘完成)
- 前往 https://huggingface.co/settings/tokens
- 點擊「New token」→ 選擇「fine-grained」
- 在「Permissions」中勾選:Make calls to Inference Providers
- 點擊「Create token」,複製 Token(格式:
hf_xxxxxxxxxx) - 設定環境變數:
export HF_TOKEN=hf_你的token
💡 什麼是 Token? 把它想成一把「通行鑰匙」,讓你的程式可以證明身份並使用服務。就像你的會員卡號碼,不能給別人看。
Step 2:安裝 Python 套件
在終端機(就是你電腦的命令列介面)輸入:
pip install huggingface_hub openai💡 什麼是 pip? pip 是 Python 的「App Store」,輸入
pip install 套件名稱就能安裝各種功能。
Step 3:呼叫 AI 模型(3 種方式)
方式一:原生 HuggingFace 客戶端(推薦新手)
import os
from huggingface_hub import InferenceClient
client = InferenceClient(token=os.environ["HF_TOKEN"])
# 呼叫 DeepSeek R1 推理模型
result = client.chat_completion(
model="deepseek-ai/DeepSeek-R1:cheapest", # :cheapest = 自動選最便宜
messages=[{"role": "user", "content": "用繁體中文解釋量子電腦"}],
)
print(result.choices[0].message.content)方式二:OpenAI SDK 相容模式(原有程式碼只改一行)
import os
from openai import OpenAI
# 只改這一行 base_url,其他程式碼完全不用動
client = OpenAI(
base_url="https://router.huggingface.co/v1",
api_key=os.environ["HF_TOKEN"],
)
completion = client.chat.completions.create(
model="deepseek-ai/DeepSeek-R1:fastest", # :fastest = 自動選最快
messages=[{"role": "user", "content": "寫一篇關於 AI 的短文"}],
)
print(completion.choices[0].message.content)方式三:直接用 cURL 指令測試
curl https://router.huggingface.co/v1/chat/completions -H "Authorization: Bearer $HF_TOKEN" -H "Content-Type: application/json" -d '{
"model": "deepseek-ai/DeepSeek-R1:fastest",
"messages": [{"role": "user", "content": "你好"}]
}'Step 4:免費生成圖片(文章封面圖)
使用 FLUX.1-dev 模型生成高品質圖片,完全透過 HF Token 免費使用:
import os
from huggingface_hub import InferenceClient
client = InferenceClient(api_key=os.environ["HF_TOKEN"])
# 生成圖片(FLUX.1-dev = 目前最高品質的開源圖片生成模型)
image = client.text_to_image(
prompt="AI technology, futuristic interface, blue glow, professional",
model="black-forest-labs/FLUX.1-dev"
)
# 儲存到電腦
image.save("my_article_cover.png")
print("圖片已儲存!")💡 什麼是 FLUX.1-dev? 這是目前開源圖片生成模型中品質最高的之一,由 Black Forest Labs 開發,690 萬人關注。用它生成的圖片接近商業等級。
如何選擇最划算的廠商?
| 模型名稱後綴 | 意思 | 適合場景 |
|---|---|---|
模型名:fastest | 自動選當前最快的服務商 | 即時回應需求、聊天機器人 |
模型名:cheapest | 自動選最低成本服務商 | 大量批次處理、節省成本 |
模型名:sambanova | 指定 SambaNova 這家廠商 | 需要特定廠商的功能 |
| (不加後綴) | 依你設定的偏好順序選 | 自訂優先廠商 |
推薦的免費模型清單(2026 最新)
| 模型 | 特色 | 適合任務 |
|---|---|---|
| deepseek-ai/DeepSeek-R1 | 推理強,免費額度大 | 分析、數學、邏輯推演 |
| zai-org/GLM-4.7-Flash | 中文最強,31B 參數 | 繁體中文生成 |
| black-forest-labs/FLUX.1-dev | 圖片生成,接近商業品質 | 圖片創作 |
| black-forest-labs/FLUX.1-schnell | FLUX 快速版,速度更快 | 批量圖片生成 |
| openai/gpt-oss-120b | OpenAI 開源版 120B | 通用對話 |
適合誰用?
- ✅ 想省錢的開發者:原本花 OpenAI API 費用,現在可以用 :cheapest 找最低成本替代
- ✅ 想測試多種模型的人:一套程式碼快速切換 16 家服務商比較
- ✅ 做 AI 應用的小團隊:不用管理多組 API Key,統一計費
- ✅ 想生成圖片的創作者:免費用 FLUX.1 生成高品質圖片
- ⚠️ 不適合:需要 OpenAI 獨有功能(如 DALL-E 3、語音合成特定版本)
立刻開始使用
三個步驟就能開始:
步驟一:前往 https://huggingface.co 免費註冊
↓
步驟二:到 Settings → Tokens 申請 HF_TOKEN
↓
步驟三:pip install huggingface_hub,貼上程式碼執行有任何問題,歡迎在留言區發問,或前往 Hugging Face 官方文件 查看最新說明。

