bytedance/seedance-v1.5-pro/image-to-video

圖生影片

PRO

Seedance v1.5 Pro Image-to-Video API by ByteDance

bytedance/seedance-v1.5-pro/image-to-video

Image-to-video

Native audio-visual joint generation model by ByteDance. Supports unified multimodal generation with precise audio-visual sync, cinematic camera control, and enhanced narrative coherence.

輸入

正在載入參數設定...

輸出

閒置

生成的影片將在這裡顯示

設定參數後點擊執行開始生成

每次執行將花費 $0.047。$10 可執行約 212 次。

你可以繼續：

Seedance 2.0 Kling v3 Vidu Wan2.7

參數

程式碼範例
import requests
import time

# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "bytedance/seedance-v1.5-pro/image-to-video",
    "prompt": "A beautiful sunset over the ocean with gentle waves",
    "width": 512,
    "height": 512,
    "duration": 3,
    "fps": 24,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] in ["completed", "succeeded"]:
            print("Generated video:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

video_url = check_status()

安裝

安裝所需的相依套件。

pip install requests

驗證

所有 API 請求都需要透過 API Key 進行認證。您可以在 Atlas Cloud 控制台取得 API Key。

export ATLASCLOUD_API_KEY="your-api-key-here"

HTTP 標頭

import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}

保護好您的 API Key

切勿在客戶端程式碼或公開儲存庫中暴露您的 API Key。請使用環境變數或後端代理。

提交請求

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

提交請求

提交一個非同步生成請求。API 會傳回一個 prediction ID，您可以用它來檢查狀態與取得結果。

POST/api/v1/model/generateVideo

請求主體

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "bytedance/seedance-v1.5-pro/image-to-video",
    "prompt": "A beautiful sunset over the ocean with gentle waves"
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['data']['id']}")
print(f"Status: {result['data']['status']}")

回應

{
  "code": 200,
  "data": {
    "id": "pred_abc123",
    "status": "processing",
    "model": "model-name",
    "created_at": "2025-01-01T00:00:00Z"
  }
}

檢查狀態

輪詢 prediction 端點以檢查請求的當前狀態。

GET/api/v1/model/prediction/{prediction_id}

輪詢範例

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

狀態值

processing請求仍在處理中。

completed生成完成，輸出可用。

succeeded生成成功，輸出可用。

failed生成失敗，請檢查 error 欄位。

完成回應

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.mp4"
    ],
    "metrics": {
      "predict_time": 45.2
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

上傳檔案

將檔案上傳到 Atlas Cloud 儲存空間，取得可在 API 請求中使用的 URL。使用 multipart/form-data 上傳。

POST/api/v1/model/uploadMedia

上傳範例

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

回應

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

Input Schema

以下參數在請求主體中被接受。

總計: 0必填: 0選填: 0

暫無可用參數。

範例請求主體

{
  "model": "bytedance/seedance-v1.5-pro/image-to-video"
}

Output Schema

API 傳回包含生成輸出 URL 的 prediction 回應。

idstringrequired

Unique identifier for the prediction.

statusstringrequired

Current status of the prediction.

processingcompletedsucceededfailed

modelstringrequired

The model used for generation.

outputsarray[string]

Array of output URLs. Available when status is "completed".

errorstring

Error message if status is "failed".

metricsobject

Performance metrics.

predict_timenumber

Time taken for video generation in seconds.

created_atstringrequired

ISO 8601 timestamp when the prediction was created.

Format: date-time

completed_atstring

ISO 8601 timestamp when the prediction was completed.

Format: date-time

範例回應

{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.mp4"
  ],
  "metrics": {
    "predict_time": 45.2
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills 將 300+ AI 模型直接整合到您的 AI 程式碼助手中。一條命令安裝，即可用自然語言生成圖片、影片，以及與 LLM 對話。

支援的客戶端

Claude Code

OpenAI Codex

Gemini CLI

Cursor

Windsurf

VS Code

Trae

GitHub Copilot

Cline

Roo Code

Amp

Goose

Replit

40+ 支援的客戶端

安裝

npx skills add AtlasCloudAI/atlas-cloud-skills

設定 API Key

從 Atlas Cloud 控制台取得 API Key，並將其設定為環境變數。

export ATLASCLOUD_API_KEY="your-api-key-here"

功能

安裝完成後，您可以在 AI 助手中使用自然語言存取所有 Atlas Cloud 模型。

圖片生成使用 Nano Banana 2、Z-Image 等模型生成圖片。

影片創作使用 Kling、Vidu、Veo 等從文字或圖片創建影片。

LLM 對話與 Qwen、DeepSeek 及其他大型語言模型對話。

媒體上傳上傳本機檔案用於圖片編輯和圖生影片工作流程。

MCP Server

Atlas Cloud MCP Server 透過 Model Context Protocol 將您的 IDE 與 300+ AI 模型連接。支援任何相容 MCP 的客戶端。

支援的客戶端

Cursor

VS Code

Windsurf

Claude Code

OpenAI Codex

Gemini CLI

Cline

Roo Code

100+ 支援的客戶端

安裝

npx -y atlascloud-mcp

設定

將以下設定新增到您的 IDE 的 MCP 設定檔中。

{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

可用工具

atlas_generate_image根據文字提示生成圖片。

atlas_generate_video從文字或圖片創建影片。

atlas_chat與大型語言模型對話。

atlas_list_models瀏覽 300+ 可用 AI 模型。

atlas_quick_generate一步式內容創建，自動選擇最佳模型。

atlas_upload_media上傳本機檔案用於 API 工作流程。

了解更多

github.com/AtlasCloudAI/mcp-server

API Schema

Schema 不可用

暫無可用範例

載入中...

⚡原生音視頻同步生成

Seedance 1.5 Pro聲畫合一，一氣呵成

字節跳動革命性 AI 模型，通過統一流程同步生成完美協調的音頻和視頻。體驗真正的原生音視頻生成，支持 8+ 語言的毫秒級精準唇形同步。

革命性創新

SeeDANCE 1.5 Pro 的根本性差異

雙分支架構

採用 45 億參數的雙分支擴散 Transformer（DB-DiT），同時生成音頻和視頻——而非順序生成——從一開始就確保完美同步。

音素級唇音同步

理解單個音素並將其正確映射到不同語言的唇形，實現毫秒級精準的音視頻同步。

敘事智能補全

基於提示詞意圖智能填補敘事空白，在角色情感、表情和動作上保持連貫的故事敘述。

核心能力

原生 1080p 畫質

專業高清視頻輸出，24fps 電影級畫質，支持 4-12 秒時長

8+ 語言支持

支持英語、中文、日語、韓語、西班牙語、葡萄牙語、印尼語，以及中文方言

電影級鏡頭控制

複雜鏡頭運動包括推拉變焦、跟蹤鏡頭和專業電影技法

多角色對話

多角色自然對話，獨特的聲音特徵和真實的輪流發言

物理精準運動

真實的頭髮動力學、流體行為和材質交互，呈現逼真視覺效果

角色一致性

跨場景保持服裝、面部和風格，完整的故事連貫性

Seedance 1.5 Pro vs 競品對比

看看 Seedance 如何從其他視頻生成模型中脫穎而出

音視頻同步

原生同步生成

序列後處理

多語言支持

8+ 種語言及方言

有限的語言支持

唇音同步精度

音素級精度

基礎同步

時長

5-12 秒優化

Wan 2.6: 最長 15 秒

鏡頭控制

專業電影攝影

標準鏡頭移動

完美適用於

短劇製作

創作情感豐富的敘事片段，配備真實角色對話和電影級燈光

廣告創意

表現力強的廣告內容，自然演技、完美唇形同步和專業製作價值

多語言內容

用 8+ 語言的原生品質音視頻內容觸達全球受眾

教育視頻

引人入勝的教學內容，配備清晰旁白和同步視覺演示

社交媒體

病毒式傳播的短視頻內容，專業音視頻質量實現最大化互動

影視製作

預可視化和概念開發，真實的角色表演和對話

Seedance 1.5 Pro 文生視頻和圖生視頻 API 集成

強大的文生視頻（T2V）API 和圖生視頻（I2V）API 端點，無縫集成

文生視頻 API（T2V API）

我們的 Seedance 1.5 Pro 文生視頻 API 將文本提示詞轉化為完整的電影級視頻，原生音視頻同步。通過單次文生視頻 API 調用生成場景、鏡頭運動、角色動作和對話。

一步生成，音頻同步

完全控制時長、寬高比和風格

多語言對話，精準唇形同步

從文本描述生成專業電影攝影

完美適用於：

大規模自動化視頻內容創作
動態故事敘述和敘事視頻
營銷活動自動化
教育內容生成

圖生視頻 API（I2V API）

我們的 Seedance 1.5 Pro 圖生視頻 API 讓靜態圖像動起來，配備運動、鏡頭移動和同步音頻。圖生視頻 API 具備高級幀控制，精確定義動畫的起始和結束點。

首幀控制鎖定角色身份

尾幀控制用於轉場端點

保留視覺風格和構圖

跨幀一致的角色外觀

完美適用於：

照片動畫和增強
視頻序列中的角色一致性
帶運動效果的產品展示
建築可視化和漫遊

💡

簡單的文生視頻和圖生視頻 API 集成

文生視頻 API 和圖生視頻 API 兩種模式都支持 RESTful 架構，配備完整文檔。通過 Python、Node.js 等 SDK 在幾分鐘內開始使用。所有 Seedance 1.5 Pro API 端點都包含音素級唇形同步的自動音頻生成，實現無縫視頻創作。

如何開始使用

通過兩個簡單路徑在幾分鐘內開始生成視頻

API 集成

適合開發應用的開發者

註冊並登錄

創建您的 Atlas Cloud 帳戶或登錄訪問控制台

添加支付方式

在帳單部分綁定信用卡為帳戶充值

生成 API 密鑰

導航至控制台 → API 密鑰並創建認證密鑰

開始構建

使用 API 密鑰發起請求並將 SeeDANCE 集成到您的應用中

Playground 體驗

適合快速測試和實驗

註冊並登錄

創建您的 Atlas Cloud 帳戶或登錄訪問平台

添加支付方式

在帳單部分綁定信用卡即可開始

使用 Playground

進入模型 playground，輸入提示詞，通過直觀界面即時生成視頻

💡

專業提示：先使用 Playground 測試提示詞和探索功能，準備好擴展生產工作流時再轉向 API 集成。:

常見問題

Seedance 1.5 Pro 的音視頻同步有何獨特之處？

與其他先生成視頻再添加音頻的模型不同，Seedance 1.5 Pro 使用雙分支架構同時生成兩者。這確保從一開始就完美同步，在所有支持的語言中實現音素級唇形同步精度。

與 Wan 2.5 或 Wan 2.6 相比如何？

Wan 2.6 支持更長時長（最長 15 秒）和文本渲染，而 Seedance 1.5 Pro 在電影級鏡頭控制、多語言/方言支持配合空間音頻、物理精準運動方面表現出色。根據需求選擇：Seedance 適合故事敘述和多語言內容，Wan 適合帶文本的產品演示。

支持哪些視頻格式和分辨率？

Seedance 1.5 Pro 生成原生 1080p 視頻，24fps。支持的寬高比包括 16:9、9:16、4:3、3:4、1:1 和 21:9。時長範圍 4-12 秒，智能時長模式允許模型自動選擇最佳長度。

音頻生成支持哪些語言？

Seedance 1.5 Pro 支持 8+ 語言，包括英語、中文普通話、日語、韓語、西班牙語、葡萄牙語、印尼語，以及粵語和四川話等中文方言。每種語言都具備精準唇形同步和自然發音。

我可以控制特定的鏡頭運動嗎？

可以！Seedance 理解專業電影語法。您可以指定鏡頭技術，如「對主體進行推拉變焦」（希區柯克效果）、跟蹤鏡頭、特寫或廣角鏡頭。模型會解釋這些指令創作出專業的電影效果。

文生視頻和圖生視頻有什麼區別？

文生視頻從文本提示詞生成完整視頻。圖生視頻使用「首幀」鎖定角色身份和燈光，可選「尾幀」控制實現精確的開始和結束點轉場。兩種模式都支持完整音頻生成。

為什麼在 Atlas Cloud 上使用 Seedance 1.5 Pro？

為您的 AI 視頻生成需求提供無與倫比的性能、可靠性和支持

專為 AI 優化的基礎設施

我們的系統專為 AI 模型部署而優化。在為高需求 AI 工作負載和視頻生成量身定制的基礎設施上以最高性能運行 Seedance 1.5 Pro。

統一 API 管理所有模型

通過統一 API 訪問 Seedance 1.5 Pro 以及 300+ 個 AI 模型（LLM、圖像、視頻、音頻）。從單一平台管理所有 AI 需求，認證一致。

極具競爭力的價格

與 AWS 相比節省高達 70%，透明的按需付費定價。無隱藏費用，無最低承諾——只為實際使用付費，提供批量折扣。

SOC I & II 認證安全

您的數據和生成的視頻受到 SOC I & II 認證和 HIPAA 合規保護。企業級安全，加密數據傳輸和存儲。

99.9% 正常運行時間 SLA

企業級可靠性，保證 99.9% 正常運行時間。您的 Seedance 1.5 Pro 視頻生成始終可用於生產應用和關鍵工作流。

輕鬆整合

通過簡單的 REST API 和多語言 SDK（Python、Node.js、Go）在幾分鐘內完成集成。全面的文檔和代碼示例助您快速上手。

99.9%

正常運行時間

70%

低於 AWS 成本

300+

生成式 AI 模型

24/7

專業支持

技術規格

Architecture

雙分支擴散 Transformer（MMDiT）

Parameters

45 億

Resolution

原生 1080p（同時支持 480p、720p）

Frame Rate

24 FPS

Duration

4-12 秒（智能時長可用）

Aspect Ratios

16:9、9:16、4:3、3:4、1:1、21:9

Languages

8+ 種語言含方言

Input Modes

文生視頻、圖生視頻

體驗原生音視頻生成

加入全球電影製作人、廣告商和創作者行列，用 Seedance 1.5 Pro 的突破性技術革新視頻內容創作。

Seedance 1.5 PRO: A Native Audio-Visual Joint Generation Foundation Model

Seedance 1.5 PRO is a foundational model engineered specifically for native joint audio-visual generation, developed by the ByteDance Seed team. It represents a significant leap forward in transforming video generation into a practical, utility-driven tool. By integrating a dual-branch Diffusion Transformer architecture, the model achieves exceptional audio-visual synchronization and superior generation quality, establishing it as a robust engine for professional-grade content creation.

Key Features

Seedance 1.5 PRO introduces several key technical advancements that set a new standard for audio-visual content generation.

Unified Multimodal Generation : Leverages a unified framework based on the MMDiT architecture to facilitate deep cross-modal interaction, ensuring precise temporal synchronization and semantic consistency between visual and auditory streams.
Precise Audio-Visual Sync : Achieves high-fidelity alignment of lip movements, intonation, and performance rhythm. It natively supports multiple languages and regional dialects, accurately capturing unique vocal prosody and emotional tonalities.
Cinematic Camera Control : Possesses autonomous camera scheduling capabilities, enabling the execution of complex movements such as continuous long takes and dolly zooms ("Hitchcock zoom"), significantly enhancing the dynamic tension of the video.
Enhanced Narrative Coherence : Through strengthened semantic understanding, the model significantly improves the overall narrative coordination of audio-visual segments, providing strong support for professional-grade content creation.
Efficient Inference Acceleration : An optimized multi-stage distillation framework, combined with quantization and parallelization, boosts the end-to-end inference speed by over 10x while preserving high performance.

Performance Highlights

The model's capabilities were rigorously evaluated against other state-of-the-art video generation models using the comprehensive SeedVideoBench 1.5 framework. Seedance 1.5 PRO demonstrates significant improvements across both video and audio dimensions.

In Text-to-Video (T2V) and Image-to-Video (I2V) tasks, it achieves a leading position in motion quality and instruction following (alignment). The model also shows strong competitiveness in visual aesthetics and motion dynamics. For audio generation, particularly in Chinese-language contexts, Seedance 1.5 PRO consistently outperforms competitors like Veo 3.1, delivering superior audio quality and audio-visual synchronization.

Use Cases

Seedance 1.5 PRO is well-suited for a wide range of professional applications, including:

Film and Short Drama Production: Creating high-quality, emotionally resonant scenes with precise character performances.
Advertising and Social Media: Generating engaging and dynamic video content for marketing campaigns.
Cultural and Artistic Expression: Faithfully rendering traditional performing arts, such as Chinese opera, by capturing distinctive cadences and stylized gestures.
Multi-Lingual Content: Producing content in various languages and dialects with accurate lip-sync and intonation.

探索類似模型

NEW

圖生影片

Seedance 2.0 Fast Reference-to-Video

Fast multimodal video generation from reference images, videos, and audio. Supports video editing and extension.

Seedance 2.0 Fast Image-to-Video

Fast video generation from first-frame image (and optional last-frame) with native audio.

Seedance 2.0 Fast Text-to-Video

Fast video generation from text prompts with native audio.

Seedance 2.0 Reference-to-Video

Multimodal video generation from reference images, videos, and audio. Supports video editing and extension.

Seedance 2.0 Image-to-Video

Generate videos from a first-frame image (and optional last-frame) with native audio.

Seedance 2.0 Text-to-Video

Generate videos from text prompts with native audio and optional web search.

Seedance v1.5 Pro Text-to-Video

Native audio-visual joint generation model by ByteDance. Supports unified multimodal generation with precise audio-visual sync, cinematic camera control, and enhanced narrative coherence.

Seedance v1.5 Pro Image-to-Video Fast

Native audio-visual joint generation model by ByteDance. Supports unified multimodal generation with precise audio-visual sync, cinematic camera control, and enhanced narrative coherence.

Seedance v1.5 Pro Text-to-Video Fast

Native audio-visual joint generation model by ByteDance. Supports unified multimodal generation with precise audio-visual sync, cinematic camera control, and enhanced narrative coherence.

Seedance v1 Pro Fast Text-to-video

An efficient text-to-video model geared toward fast, cost-effective generation. Ideal for prototyping short narrative clips (2–12 s) with stylistic flexibility and prompt-faithful motion.

Seedance v1 Pro Fast Image-to-video

Seedance Pro’s image-to-video mode transforms still visuals into cinematic motion, maintaining visual consistency and expressive animation across frames.

Seedance v1 Pro t2v 1080p

A full-fidelity text-to-video model built for cinematic results. Generates multi-shot, 1080p videos with smooth motion, strong prompt adherence, and scene continuity.

Seedance v1 Pro t2v 720p

A full-fidelity text-to-video model built for cinematic results. Generates multi-shot, 1080p videos with smooth motion, strong prompt adherence, and scene continuity.

Seedance v1 Pro t2v 480p

A full-fidelity text-to-video model built for cinematic results. Generates multi-shot, 1080p videos with smooth motion, strong prompt adherence, and scene continuity.

Seedance v1 Pro i2v 720p

Seedance Pro’s image-to-video mode transforms still visuals into cinematic motion, maintaining visual consistency and expressive animation across frames.

Seedance v1 Pro i2v 480p

Seedance Pro’s image-to-video mode transforms still visuals into cinematic motion, maintaining visual consistency and expressive animation across frames.

From$0.024/秒

$0.022/秒

-10%

一個 API，暢享全模態 AI。

探索全部模型