ai video pipeline cover

Claude Code + GPT-Image-2 自動生成 AI 影片:2 分鐘、NT$4.5,整理給你看(2026)

整理一個真實跑過的流程給你看:用 Claude Code 搭配 GPT-Image-2,自動生成簡報風格的 AI 影片。 從輸入腳本到拿到成品影片,全程約 2 分鐘,每支影片費用大約台幣 4 塊 5。 不是概念,是實際跑出來的結果。

這個流程在做什麼?

簡單說,就是把一段文字腳本,自動變成一支有圖、有聲音的短影片。

核心是兩個 AI 工具的組合:

  • GPT-Image-2:根據腳本內容,為每個場景生成一張角色圖片。角色照片只要提供一張,GPT-Image-2 會保持角色一致性,場景換但臉不變。
  • Claude Code:負責整個自動化流程的協調——分鏡規劃、呼叫 API、控制 FFmpeg 合成影片、管理檔案輸出。

最後的影片是「簡報風格」:每個場景是一張靜態圖片配上台灣中文配音,圖片有細微的 Ken Burns 縮放效果,看起來不像靜止投影片,比較接近說明型短片。

準備工作(只需做一次)

根據官方文件,這個流程需要兩個帳號,申請都是免費的:

  • KIE.ai:提供 GPT-Image-2 的 API 接口,用 Google 登入後到 kie.ai/api-key 取得 API Key。費用按使用量計,每張圖約 NT$0.9。
  • Cloudinary:圖片托管服務,讓 KIE.ai 能讀取你的角色照片。用 Google 登入後,在後台複製 Cloud Name、API Key、API Secret。免費方案夠用。

本機需要安裝:

  • FFmpeg(影片合成):Mac 用 brew install ffmpeg
  • Python 套件:pip install edge-tts cloudinary python-dotenv requests

這些安裝步驟可以直接叫 Claude Code 執行,不用自己手打。

完整五步驟流程

以下是整理過的流程,每次生成影片都跑一遍:

Step 1|Claude Code 規劃分鏡

告訴 Claude Code 影片主題和長度,Claude 會輸出一份分鏡 JSON 檔案,列出每個場景的旁白文字、圖片描述、鏡頭角度。這一步在對話裡完成,不花 API 費用。

Step 2|GPT-Image-2 生成場景圖

Claude Code 自動把角色照片上傳到 Cloudinary,取得公開連結後,呼叫 KIE.ai 的 GPT-Image-2 API,為每個場景生成一張角色圖片。5 張圖費用約 NT$4.5,生成時間約 60-90 秒。

Step 3|微軟 TTS 生成配音

使用 edge-tts(微軟 Edge 的語音引擎),選擇台灣女聲 zh-TW-HsiaoChenNeural,把每個場景的旁白文字轉成 MP3。這個工具完全免費,說的是正統台灣中文,不是外國腔。

Step 4|FFmpeg 合成每個場景

把每張圖片 + 對應的旁白 MP3,用 FFmpeg 合成成一段小影片。圖片加上 Ken Burns 效果(細微縮放),聲音依旁白長度自動截短。

Step 5|合併輸出成品

把所有場景的小影片串接成一個完整的 final_video.mp4,存到本機指定資料夾。

💡 費用整理:每支影片只要 GPT-Image-2 的圖生圖費用(5張 × NT$0.9 ≈ NT$4.5),配音和影片合成完全免費。生成時間約 2 分鐘。

成品可以怎麼用

這個流程生出來的 MP4 可以直接:

  • 上傳到 YouTube、Instagram Reels、TikTok
  • 嵌入部落格文章或課程頁面
  • 貼到 FB 粉絲頁,留言放文章連結導流

如果要換主題或換人物,只要換一張角色照片,重新給 Claude Code 主題,2 分鐘後就有新一支影片。費用還是 NT$4.5。

這個流程目前的限制是:圖片是靜態的,角色不會有真實動作。適合說明型、介紹型的短片,不適合需要真實動態的廣告。

給 Claude Code 的提示詞

如果你也想用這個流程,以下是可以直接複製給 Claude Code 的說法:

用這張照片 [放入角色照片路徑]
幫我生成一支 30 秒介紹「[你的主題]」的簡報風格影片

Claude Code 會自動:幫你申請帳號、安裝工具、規劃分鏡、生成圖片配音、合成影片、存到電腦。

影片完成後在 ~/pipeline_output/final_video.mp4 取得。


📚 延伸閱讀:你可能也有興趣


🚀 EvoForge 進化工坊|讓 Claude Code 會記憶、會學習、會進化 →

解壓縮 → 拖入 Claude Code → 輸入任意一句話,5 分鐘完成安裝

✅ EvoForge 核心功能:

🧠 三層記憶系統,50 Token 完成查詢(關掉不再忘記)

🔗 85-Token 跨對話橋接,任務中斷秒速恢復不重頭來

⚡ DCI 動態 Context 注入,省 70%+ Token

📈 Stop Hook 自動進化,同類任務 3 次自動腳本化

🛠️ 12 個核心技能,/斜線指令開箱即用

🤖 3 個子代理協作,不消耗主對話 Token

原價 NT$1,288

NT$600

前 100 名優惠 · 買斷不收月費 · MIT 授權可自由修改

Mac & Windows 適用 · 確認匯款後立即出貨 · LINE:kenemail2

Compare Listings

TitlePriceStatusTypeAreaPurposeBedroomsBathrooms

Compare