整理一個真實跑過的流程給你看:用 Claude Code 搭配 GPT-Image-2,自動生成簡報風格的 AI 影片。 從輸入腳本到拿到成品影片,全程約 2 分鐘,每支影片費用大約台幣 4 塊 5。 不是概念,是實際跑出來的結果。
這個流程在做什麼?
簡單說,就是把一段文字腳本,自動變成一支有圖、有聲音的短影片。
核心是兩個 AI 工具的組合:
- GPT-Image-2:根據腳本內容,為每個場景生成一張角色圖片。角色照片只要提供一張,GPT-Image-2 會保持角色一致性,場景換但臉不變。
- Claude Code:負責整個自動化流程的協調——分鏡規劃、呼叫 API、控制 FFmpeg 合成影片、管理檔案輸出。
最後的影片是「簡報風格」:每個場景是一張靜態圖片配上台灣中文配音,圖片有細微的 Ken Burns 縮放效果,看起來不像靜止投影片,比較接近說明型短片。
準備工作(只需做一次)
根據官方文件,這個流程需要兩個帳號,申請都是免費的:
- KIE.ai:提供 GPT-Image-2 的 API 接口,用 Google 登入後到 kie.ai/api-key 取得 API Key。費用按使用量計,每張圖約 NT$0.9。
- Cloudinary:圖片托管服務,讓 KIE.ai 能讀取你的角色照片。用 Google 登入後,在後台複製 Cloud Name、API Key、API Secret。免費方案夠用。
本機需要安裝:
- FFmpeg(影片合成):Mac 用
brew install ffmpeg - Python 套件:
pip install edge-tts cloudinary python-dotenv requests
這些安裝步驟可以直接叫 Claude Code 執行,不用自己手打。
完整五步驟流程
以下是整理過的流程,每次生成影片都跑一遍:
Step 1|Claude Code 規劃分鏡
告訴 Claude Code 影片主題和長度,Claude 會輸出一份分鏡 JSON 檔案,列出每個場景的旁白文字、圖片描述、鏡頭角度。這一步在對話裡完成,不花 API 費用。
Step 2|GPT-Image-2 生成場景圖
Claude Code 自動把角色照片上傳到 Cloudinary,取得公開連結後,呼叫 KIE.ai 的 GPT-Image-2 API,為每個場景生成一張角色圖片。5 張圖費用約 NT$4.5,生成時間約 60-90 秒。
Step 3|微軟 TTS 生成配音
使用 edge-tts(微軟 Edge 的語音引擎),選擇台灣女聲 zh-TW-HsiaoChenNeural,把每個場景的旁白文字轉成 MP3。這個工具完全免費,說的是正統台灣中文,不是外國腔。
Step 4|FFmpeg 合成每個場景
把每張圖片 + 對應的旁白 MP3,用 FFmpeg 合成成一段小影片。圖片加上 Ken Burns 效果(細微縮放),聲音依旁白長度自動截短。
Step 5|合併輸出成品
把所有場景的小影片串接成一個完整的 final_video.mp4,存到本機指定資料夾。
💡 費用整理:每支影片只要 GPT-Image-2 的圖生圖費用(5張 × NT$0.9 ≈ NT$4.5),配音和影片合成完全免費。生成時間約 2 分鐘。
成品可以怎麼用
這個流程生出來的 MP4 可以直接:
- 上傳到 YouTube、Instagram Reels、TikTok
- 嵌入部落格文章或課程頁面
- 貼到 FB 粉絲頁,留言放文章連結導流
如果要換主題或換人物,只要換一張角色照片,重新給 Claude Code 主題,2 分鐘後就有新一支影片。費用還是 NT$4.5。
這個流程目前的限制是:圖片是靜態的,角色不會有真實動作。適合說明型、介紹型的短片,不適合需要真實動態的廣告。
給 Claude Code 的提示詞
如果你也想用這個流程,以下是可以直接複製給 Claude Code 的說法:
用這張照片 [放入角色照片路徑] 幫我生成一支 30 秒介紹「[你的主題]」的簡報風格影片
Claude Code 會自動:幫你申請帳號、安裝工具、規劃分鏡、生成圖片配音、合成影片、存到電腦。
影片完成後在 ~/pipeline_output/final_video.mp4 取得。
📚 延伸閱讀:你可能也有興趣
- Claude Code 記憶系統怎麼設定?EvoForge 讓 Claude Code 永遠記得你(2026)
- Claude Code 怎麼用?真實案例:網站全自動管理、EvoForge 打造你的 AI 工作流程(2026)
- 終端機是什麼?從零開始學 Mac 終端機指令,完整入門教學(2026)
- GPT-5.5 怎麼用?OpenAI 最新模型完整教學(2026)
- ➜ 查看更多 AI 數位應用文章
解壓縮 → 拖入 Claude Code → 輸入任意一句話,5 分鐘完成安裝
✅ EvoForge 核心功能:
🧠 三層記憶系統,50 Token 完成查詢(關掉不再忘記)
🔗 85-Token 跨對話橋接,任務中斷秒速恢復不重頭來
⚡ DCI 動態 Context 注入,省 70%+ Token
📈 Stop Hook 自動進化,同類任務 3 次自動腳本化
🛠️ 12 個核心技能,/斜線指令開箱即用
🤖 3 個子代理協作,不消耗主對話 Token
原價 NT$1,288
NT$600
前 100 名優惠 · 買斷不收月費 · MIT 授權可自由修改
Mac & Windows 適用 · 確認匯款後立即出貨 · LINE:kenemail2

