Seedance 2.0 + GPT Image 2 API 教學：AI 動作場景製作流程

AI 影片真正的瓶頸不在於輸出畫面看起來不對，而在於它讓人感覺「太慢了」。

1. 為什麼 15 秒的 AI 動作總是顯得平淡

任何真正深入使用過 Seedance 2.0 的人都會遇到同樣的瓶頸：當你要求產生 15 秒的片段時，模型只會給你三到四個鏡頭——然後就結束了。

你輸入一段打鬥場景，出來的結果卻是「戰鬥者走進來 → 舉起武器 → 凍結」。開場、動作、結束。出字幕。

但這並非實際銀幕上打鬥戲的呈現方式。在出拳之前，肩膀會先轉動；閃避之後，反擊動作早已蓄勢待發。遠景追逐會切換到特寫，再切換到慢動作衝擊。張力來自於剪輯密度，而不是讓單一鏡頭變得更漂亮。

無論你如何下 Prompt，模型本身都不會主動給你十六個鏡頭。

這就是問題所在。以下是我們的解決方案。

2. 改變工作流程的三個關鍵轉向

在完整跑過單角色動作演示後，我們歸納出三個重點：

① 動作張力來自剪輯密度，而非單鏡頭畫質。 不要再試圖優化單一鏡頭了。請先將 15 秒拆解為 16 格的分鏡腳本，再將其交給影片模型。

② GPT Image 2 的真正強項在於劇本理解與鏡頭佈局，而非風格一致性。 我們最初希望 GPT Image 2 能在整個流程中鎖定單一風格。測試後我們發現，參考圖轉影片的過程自然會偏向 CG 感——沒有乾淨的方法能強行固定。但 GPT Image 2 能做到的——閱讀劇本、規劃鏡頭、佈局 16 格分鏡——是我們目前池中其他模型無法匹敵的。

③ 整個流水線只需一個 AtlasCloud API Key。 GPT Image 2、Nano Banana 2 和 Seedance 2.0 全部位於 AtlasCloud 的同一個模型池中。一個金鑰、一個端點、一張帳單、一個額度。無需串接多供應商的複雜系統。

3. 單角色壓力測試

為了真正測試 GPT Image 2 的極限，我們選了一個最棘手的角色。

介紹 Ranx —— 一位網路戰術特勤。金沙色雙丸子頭。以及四個完全不對稱的裝備細節：

僅右腿有黑色大腿襪
僅右大腿有紅色硬殼槍套
僅右膝有青色飾條
從腰帶右後方繞到左小腿的粗黑色電纜

我們提供給模型的唯一參考圖是後側方四分之三角度。模型必須從中推導出正面、側面、表情和武器細節，且不能將這四個不對稱部位中的任何一個產生鏡像翻轉。

結果： 一次生成。六個轉身視角、四個頭部特寫、四個表情、武器面板、手部、腳部——全在同一頁。四處不對稱細節全數鎖定。零鏡像翻轉。

我們將環境視為成品的設計參考（賽博龐克風格濕潤後巷，《Stray》遊戲美學）：

場景1-xiao.png

4. 驗證此方法的 A/B 測試

這是整個工作流程賴以建立的實驗。相同的劇本、相同的角色設定、相同的場景參考。唯一的變數是：是否有分鏡腳本。

控制組：僅文字 Prompt，無分鏡腳本

輸入至 Seedance 2.0 參考圖轉影片：

1× 角色設定圖
1× 場景參考圖
一段 15 秒的詳細文字描述，包含四個硬切鏡頭

影片內容清晰且工藝水準尚可，但整體節奏約只有三個慢動作節拍——走到巷子、舉起武器、凍結。看起來像角色展示，不像打鬥。

測試組：使用 16 格分鏡腳本

我們要求 GPT Image 2 將相同劇本拆解為 4×4 = 16 格的分鏡，每個格子標記：

鏡頭編號 (① ② ③ … ⑯)
鏡頭尺寸 (WIDE / MS / CU / ECU)
攝影機移動箭頭 (→ ↘ ↙ ↑ ↓ ↗)
節奏註記 ("static rise" / "hard cut" / "impact" / "kill shot" / "outro")
手寫中文的簡短導演註記——這純粹是密度選擇，中文能在有限的分鏡格中容納更多導演意圖（GPT Image 2 與 Seedance 2.0 對中英文的讀取能力同樣出色）

然後將一段簡短的 Prompt 輸入至 Seedance 2.0 參考圖轉影片：

分鏡222.jpg