分鏡圖生影片是什麼?2026 年誰在做這件事
分鏡圖(Storyboard)是影片製作的規劃工具,用表格列出每個場景的角色、動作、台詞、畫面說明與時長。理想的「AI 分鏡圖生影片」流程是:把這份表格丟給 AI,它自動輸出對應的動態影片。
這個需求一直存在,2026 年有兩個工具特別值得比較:
- Gemini Omni:Google 剛在 I/O 2026 發表的整合型多模態模型,聲稱支援分鏡圖→影片工作流
- Seedance 2.0:ByteDance 旗下,2026 年 4 月正式推出,已穩定運行超過一個月
標準分鏡圖格式
| 欄位 | 說明 | 範例 |
|---|---|---|
| 場景編號 | Scene 1, 2, 3… | Scene 1 |
| 角色 | 畫面中出現的人物或物件 | 年輕女性、筆電 |
| 動作 | 角色在這一幕做什麼 | 敲鍵盤、轉頭看鏡頭 |
| 台詞 | 角色說的話或旁白文字 | 「2026 年最強影片生成工具是哪個?」 |
| 畫面說明 | 鏡頭角度、光線、氛圍 | 特寫、柔和自然光 |
| 時長 | 這一幕秒數 | 5 秒 |
Gemini Omni 的分鏡圖生影片能力:理念超前,但剛出爐
Gemini Omni 是 Google 在 2026 年 5 月 19 日 Google I/O 大會上發表的多模態 AI,支援文字、圖片、音訊、影片同時輸入,並以影片為主要輸出格式。
Gemini Omni 的分鏡圖工作流:完整流程在一個模型內完成
Gemini Omni 的設計理念是「對話式影片製作」:
- 輸入文字描述或分鏡圖內容 → 生成分鏡圖靜態圖
- 對話方式調整細節(「把光線改柔和一點」「角色改成側面」)
- 一個指令讓分鏡圖動起來,輸出影片
- 不滿意再用對話方式局部修改
整個流程在同一個模型、同一個 API 呼叫中完成,省去在不同工具之間切換的麻煩。這是 Gemini Omni 相對於傳統「分開生圖 + 分開生影片」工作流的理論優勢。
但有一個關鍵限制
Gemini Omni 剛發表,目前只有 Flash 版本(10 秒短片),API 要幾週後才開放。現在只能透過 Gemini App 和 YouTube Shorts 使用,而且還在陸續推出中,不是所有用戶都能馬上用到。
Google 刻意保留三個功能,目前不開放:從音訊生成圖片、從影片生成音訊、編輯現有影片的語音軌。這些功能列為「長期目標」,目前暫停安全審查中。
Gemini Omni 的理念是對的——從分鏡圖到影片一條龍——但剛發表,現階段限制多,穩定性與可用性都還在建立中。
Seedance 2.0:分鏡圖生影片最成熟的工具
Seedance 2.0 是 ByteDance 旗下 Seed 實驗室開發的影片生成模型,2026 年 4 月 9 日正式對外開放,比 Gemini Omni 早了整整一個多月。
Seedance 2.0 的分鏡圖支援
Seedance 2.0 可以直接接受文字格式的分鏡圖作為輸入:
- 文字分鏡直接輸入:把場景描述文字丟進去,模型自動理解分鏡邏輯
- Image-to-Video:靜態圖片直接轉動態,每格分鏡對應 4-15 秒影片
- 多模態輸入:支援文字、圖片(JPEG/PNG)、影片、音訊同時輸入
- 多鏡頭支援:最多 3 段影片、9 張圖片同時參考,維持視覺風格一致
Seedance 2.0 的市場地位
根據 Artificial Analysis 的評測,Seedance 2.0 的 Image-to-Video Elo 分數達到 1,351 分,目前排名第一,超越 Veo 3、Runway Gen-4.5 等競爭對手。它的優勢包括:
- 動作連貫性強,人物動作自然流暢
- 畫面細節豐富,光影材質保留度高
- 生成穩定,不同批次結果品質一致
- API 已開放(fal.ai、WaveSpeedAI 等平台)
Gemini Omni vs Seedance 2.0 完整比較
把 Gemini Omni 和 Seedance 2.0 放在同一張表格比較:
| 比較項目 | Gemini Omni | Seedance 2.0 |
|---|---|---|
| 發布時間 | 2026 年 5 月 19 日(剛發表) | 2026 年 4 月 9 日(已穩定一個月) |
| 分鏡圖支援 | ✓ 支援,但剛推出不穩定 | ✓ 支援,文字/圖片分鏡皆可 |
| 影片長度 | 目前 10 秒(Flash 版) | 4–15 秒 |
| API 可用 | ✗ 幾週後才開放 | ✓ 已開放(fal.ai、WaveSpeedAI) |
| Image-to-Video | ✓ 支援(推出初期) | ✓ 核心功能,Elo 排名第一 |
| 對話式編輯 | ✓ 核心設計 | ✗ 不支援對話式修改 |
| 生成穩定性 | ⚠️ 剛推出,仍在測試 | ✓ 穩定,評測排名第一 |
| 使用入口 | Gemini App、YouTube Shorts(限量) | fal.ai、WaveSpeedAI、Higgsfield |
| 費用 | 尚未公布完整計費 | 依用量,約 NT$2-4/秒 |
一句話總結:Gemini Omni 設計理念更完整,但太新;Seedance 2.0 現在就能穩定用,是目前分鏡圖生影片的首選。
現在就能用的分鏡圖生影片工作流(Seedance 實作)
如果現在就要做分鏡圖生影片,Seedance 2.0 的工作流最實用:
Step 1:製作文字分鏡圖
用 Google Sheets 或 Notion 製作分鏡表,填入場景、角色、動作、台詞、畫面說明、時長。Seedance 2.0 可以直接接受這份文字描述作為輸入,不需要先轉成圖片。
Step 2(選):分鏡圖生成靜態圖,再用 Image-to-Video
如果想要更精確控制畫面,可以先用 GPT-Image-2 根據每格分鏡的「畫面說明」生成靜態圖,再用 Seedance 的 Image-to-Video 讓圖片動起來。這條路對畫面構圖控制度更高。
Step 3:合併各段影片
ffmpeg -f concat -safe 0 -i filelist.txt -c copy output.mp4Step 4:加配音與字幕
用 ElevenLabs 或 Edge-TTS 生成配音,用 FFmpeg 合併音訊。整個流程從分鏡圖到完成影片,預估 50-80 分鐘,實際時間視場景數量而定。
Gemini Omni 在工作流中的定位
雖然 Gemini Omni 目前不是影片生成的首選,但它在分鏡圖「企劃階段」很有用:
- 根據主題自動生成完整分鏡圖表格
- 台詞撰寫與多語言翻譯
- 場景描述改寫成更適合 Seedance 的提示詞格式
- 分鏡圖邏輯與節奏審查
最佳組合:Gemini Omni 寫腳本與分鏡圖 → Seedance 2.0 生成影片。
2026 年 AI 影片生成工具全覽(含停服工具說明)
2026 年有哪些工具可以做影片生成?以下是目前市場上仍可使用的主要選項:
| 工具 | 開發商 | 特色 | 費用 |
|---|---|---|---|
| Veo 3.1 | Google DeepMind | 最佳整體品質,原生音訊,4K 輸出 | Google AI Pro 訂閱 USD 7.99/月 |
| Kling 3.0 | 快手(Kuaishou) | 多鏡頭分鏡模式,最划算,從 USD 6.99/月起 | 最便宜 |
| Seedance 2.0 | ByteDance | I2V 排名第一,分鏡圖工作流最成熟 | 依用量計費 |
| Runway Gen-4.5 | Runway ML | 角色一致性最強,鏡頭控制精細 | USD 12/月起 |
| Gemini Omni | 對話式編輯,剛發表(2026/05),仍在推出中 | 尚未完整公布 | |
| Sora | OpenAI | ⚠️ 已於 2026 年 4 月 26 日停服,不再可用 | 停服 |
需要特別注意:Sora 已於 2026/04/26 正式停服,網路上許多舊文章還在推薦它,請注意文章日期。
結論:Gemini Omni 是值得等的未來,Seedance 是現在的答案
Gemini Omni 是 Google 在 2026 年給出的重要答案:影片生成應該是對話式的,從分鏡圖到成片在一個模型內完成。理念上,這比現有工具都更前進。
但「剛發表」是最大的現實障礙:
- 目前只有 Flash 版(10 秒片段),Gemini App 限量開放
- API 要幾週後才能用,開發者還無法整合
- 完整功能仍在安全審查,三項能力刻意保留
- 生成品質與穩定性尚待市場驗證
相比之下,Seedance 2.0 從 4 月就穩定運行,API 已開放,評測排名第一。對現在就要做分鏡圖生影片的創作者來說,Seedance 2.0 是目前最可靠的選擇。
給想用 Gemini Omni 的人建議:現在用 Gemini 寫分鏡圖腳本(這是它現在就很擅長的),生成影片的部分等幾個月 API 穩定後再切換。Gemini Omni 是值得期待的未來,Seedance 2.0 是現在就能用的解答。
資料來源:Gemini Omni Video Model at Google I/O 2026・Seedance 2.0 官方發布・Sora 停服說明(2026-05)
解壓縮 → 拖入 Claude Code → 輸入任意一句話,5 分鐘完成安裝
✅ EvoForge 核心功能:
🧠 三層記憶系統,50 Token 完成查詢(關掉不再忘記)
🔗 85-Token 跨對話橋接,任務中斷秒速恢復不重頭來
⚡ DCI 動態 Context 注入,省 70%+ Token
📈 Stop Hook 自動進化,同類任務 3 次自動腳本化
🛠️ 12 個核心技能,/斜線指令開箱即用
🤖 3 個子代理協作,不消耗主對話 Token
原價 NT$1,288
NT$600
前 100 名優惠 · 買斷不收月費 · MIT 授權可自由修改
Mac & Windows 適用 · 確認匯款後立即出貨 · LINE:kenemail2

