
Seedance v1.5 Pro Image-to-Video API by ByteDance
Native audio-visual joint generation model by ByteDance. Supports unified multimodal generation with precise audio-visual sync, cinematic camera control, and enhanced narrative coherence.
WEJŚCIE
WYJŚCIE
BezczynnyKażde uruchomienie będzie kosztować $0.047. Za $10 możesz uruchomić ten model około 212 razy.
Co możesz zrobić dalej:
Przykład kodu
import requests
import time
# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "bytedance/seedance-v1.5-pro/image-to-video",
"prompt": "A beautiful sunset over the ocean with gentle waves",
"width": 512,
"height": 512,
"duration": 3,
"fps": 24,
}
generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]
# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
def check_status():
while True:
response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
result = response.json()
if result["data"]["status"] in ["completed", "succeeded"]:
print("Generated video:", result["data"]["outputs"][0])
return result["data"]["outputs"][0]
elif result["data"]["status"] == "failed":
raise Exception(result["data"]["error"] or "Generation failed")
else:
# Still processing, wait 2 seconds
time.sleep(2)
video_url = check_status()Instalacja
Zainstaluj wymagany pakiet dla swojego języka programowania.
pip install requestsUwierzytelnianie
Wszystkie żądania API wymagają uwierzytelnienia za pomocą klucza API. Klucz API możesz uzyskać z panelu Atlas Cloud.
export ATLASCLOUD_API_KEY="your-api-key-here"Nagłówki HTTP
import os
API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {API_KEY}"
}Nigdy nie ujawniaj swojego klucza API w kodzie po stronie klienta ani w publicznych repozytoriach. Zamiast tego użyj zmiennych środowiskowych lub proxy backendowego.
Wyślij żądanie
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "your-model",
"prompt": "A beautiful landscape"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())Wyślij żądanie
Wyślij asynchroniczne żądanie generowania. API zwróci identyfikator predykcji, którego możesz użyć do sprawdzania statusu i pobierania wyniku.
/api/v1/model/generateVideoTreść żądania
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "bytedance/seedance-v1.5-pro/image-to-video",
"input": {
"prompt": "A beautiful sunset over the ocean with gentle waves"
}
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")Odpowiedź
{
"id": "pred_abc123",
"status": "processing",
"model": "model-name",
"created_at": "2025-01-01T00:00:00Z"
}Sprawdź status
Odpytuj endpoint predykcji, aby sprawdzić bieżący status żądania.
/api/v1/model/prediction/{prediction_id}Przykład odpytywania
import requests
import time
prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
while True:
response = requests.get(url, headers=headers)
result = response.json()
status = result["data"]["status"]
print(f"Status: {status}")
if status in ["completed", "succeeded"]:
output_url = result["data"]["outputs"][0]
print(f"Output URL: {output_url}")
break
elif status == "failed":
print(f"Error: {result['data'].get('error', 'Unknown')}")
break
time.sleep(3)Wartości statusu
processingŻądanie jest wciąż przetwarzane.completedGenerowanie zakończone. Wyniki są dostępne.succeededGenerowanie powiodło się. Wyniki są dostępne.failedGenerowanie nie powiodło się. Sprawdź pole błędu.Odpowiedź ukończona
{
"data": {
"id": "pred_abc123",
"status": "completed",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}
}Prześlij pliki
Prześlij pliki do magazynu Atlas Cloud i uzyskaj URL, którego możesz użyć w swoich żądaniach API. Użyj multipart/form-data do przesyłania.
/api/v1/model/uploadMediaPrzykład przesyłania
import requests
url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
with open("image.png", "rb") as f:
files = {"file": ("image.png", f, "image/png")}
response = requests.post(url, headers=headers, files=files)
result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")Odpowiedź
{
"data": {
"download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
"file_name": "image.png",
"content_type": "image/png",
"size": 1024000
}
}Schema wejściowy
Następujące parametry są akceptowane w treści żądania.
Brak dostępnych parametrów.
Przykładowa treść żądania
{
"model": "bytedance/seedance-v1.5-pro/image-to-video"
}Schema wyjściowy
API zwraca odpowiedź predykcji z URL-ami wygenerowanych wyników.
Przykładowa odpowiedź
{
"id": "pred_abc123",
"status": "completed",
"model": "model-name",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}Atlas Cloud Skills
Atlas Cloud Skills integruje ponad 300 modeli AI bezpośrednio z Twoim asystentem kodowania AI. Jedno polecenie do instalacji, a następnie używaj języka naturalnego do generowania obrazów, filmów i rozmów z LLM.
Obsługiwani klienci
Instalacja
npx skills add AtlasCloudAI/atlas-cloud-skillsSkonfiguruj klucz API
Uzyskaj klucz API z panelu Atlas Cloud i ustaw go jako zmienną środowiskową.
export ATLASCLOUD_API_KEY="your-api-key-here"Możliwości
Po zainstalowaniu możesz używać języka naturalnego w swoim asystencie AI, aby uzyskać dostęp do wszystkich modeli Atlas Cloud.
Serwer MCP
Serwer MCP Atlas Cloud łączy Twoje IDE z ponad 300 modelami AI za pośrednictwem Model Context Protocol. Działa z każdym klientem kompatybilnym z MCP.
Obsługiwani klienci
Instalacja
npx -y atlascloud-mcpKonfiguracja
Dodaj następującą konfigurację do pliku ustawień MCP w swoim IDE.
{
"mcpServers": {
"atlascloud": {
"command": "npx",
"args": [
"-y",
"atlascloud-mcp"
],
"env": {
"ATLASCLOUD_API_KEY": "your-api-key-here"
}
}
}
}Dostępne narzędzia
API Schema
Schema niedostępnaZaloguj się, aby wyświetlić historię zapytań
Musisz być zalogowany, aby uzyskać dostęp do historii zapytań modelu.
Zaloguj sięSeedance 1.5 ProDźwięk i Obraz, Wszystko w Jednym Ujęciu
Rewolucyjny model AI ByteDance, który generuje idealnie zsynchronizowany dźwięk i wideo jednocześnie z jednego zunifikowanego procesu. Doświadcz prawdziwej natywnej generacji audio-wizualnej z synchronizacją warg o precyzji milisekundowej w ponad 8 językach.
Rewolucyjna Innowacja
Co czyni SeeDANCE 1.5 Pro fundamentalnie innym
Architektura Dwugałęziowa
Wykorzystuje Dwugałęziowy Transformer Dyfuzyjny (DB-DiT) z 4,5 miliarda parametrów, który generuje dźwięk i wideo jednocześnie—nie sekwencyjnie—zapewniając idealną synchronizację od samego początku.
Synchronizacja Warg na Poziomie Fonemów
Rozumie poszczególne fonemy i mapuje je poprawnie na kształty warg w różnych językach, osiągając synchronizację audio-wizualną o precyzji milisekundowej.
Automatyczne Uzupełnianie Narracji
Inteligentnie wypełnia luki narracyjne w oparciu o intencję promptu, utrzymując spójne opowiadanie poprzez emocje, wyrazy i działania postaci.
Główne Możliwości
Natywna Jakość 1080p
Profesjonalne wyjście wideo HD o kinematograficznej jakości w 24fps, obsługujące czasy trwania 4-12 sekund
Wsparcie dla 8+ Języków
Angielski, mandaryński, japoński, koreański, hiszpański, portugalski, indonezyjski, plus chińskie dialekty
Kinematograficzna Kontrola Kamery
Złożone ruchy kamery obejmujące dolly zoomy, ujęcia śledzące i profesjonalne techniki filmowe
Dialog Wielomówców
Naturalne rozmowy z wieloma postaciami, wyraźne tożsamości głosowe i realistyczna wymiana zdań
Fizycznie Dokładny Ruch
Realistyczna dynamika włosów, zachowania płynów i interakcje materiałów dla prawdziwych wizualizacji
Spójność Postaci
Utrzymuje ubrania, twarze i styl w scenach dla pełnej ciągłości historii
Seedance 1.5 Pro vs Konkurencja
Odkryj, jak Seedance wyróżnia się spośród innych modeli generacji wideo
Idealne Do
Produkcja Krótkich Dramatów
Twórz emocjonalne klipy narracyjne z realistycznymi dialogami postaci i kinematograficznym oświetleniem
Kreacje Reklamowe
Treści reklamowe skoncentrowane na wydajności z naturalną grą aktorską, idealną synchronizacją warg i profesjonalną wartością produkcyjną
Treści Wielojęzyczne
Dotrzyj do globalnej publiczności z treściami audio-wizualnymi o natywnej jakości w ponad 8 językach
Filmy Edukacyjne
Angażujące treści instruktażowe z wyraźną narracją i zsynchronizowanymi demonstracjami wizualnymi
Media Społecznościowe
Gotowe do viralowości krótkie treści z profesjonalną jakością audio-wizualną dla maksymalnego zaangażowania
Produkcja Filmowa
Pre-wizualizacja i rozwój koncepcji z realistycznymi występami postaci i dialogami
Integracja API T2V i I2V Seedance 1.5 Pro
Potężne endpointy API Text-to-Video (T2V) i Image-to-Video (I2V) dla bezproblemowej integracji
API Text-to-Video (T2V API)
Nasze API T2V Seedance 1.5 Pro przekształca prompty tekstowe w kompletne kinematograficzne filmy z natywną synchronizacją audio-wizualną. Generuj sceny, ruchy kamery, akcje postaci i dialogi w jednym wywołaniu API Text-to-Video.
Idealne do:
- Automatyzacja tworzenia treści wideo na skalę
- Dynamiczne opowiadanie historii i filmy narracyjne
- Automatyzacja kampanii marketingowych
- Generowanie treści edukacyjnych
API Image-to-Video (I2V API)
Nasze API I2V Seedance 1.5 Pro ożywia nieruchome obrazy ruchem, ruchem kamery i zsynchronizowanym dźwiękiem. API Image-to-Video oferuje zaawansowaną kontrolę klatek do definiowania precyzyjnych punktów początkowych i końcowych dla animacji.
Idealne do:
- Animacja i ulepszanie zdjęć
- Spójność postaci w sekwencjach wideo
- Prezentacja produktów z efektami ruchu
- Wizualizacja architektoniczna i wirtualne spacery
Prosta Integracja API T2V i I2V
Zarówno tryby API T2V, jak i I2V obsługują architekturę RESTful z kompleksową dokumentacją. Zacznij w kilka minut z SDK dla Python, Node.js i więcej. Wszystkie endpointy API Seedance 1.5 Pro zawierają automatyczne generowanie dźwięku z synchronizacją warg na poziomie fonemów dla bezproblemowego tworzenia wideo.
Jak Zacząć
Zacznij generować filmy w kilka minut dwiema prostymi ścieżkami
Integracja API
Dla programistów budujących aplikacje
Zarejestruj się i Zaloguj
Utwórz konto Atlas Cloud lub zaloguj się, aby uzyskać dostęp do konsoli
Dodaj Metodę Płatności
Powiąż kartę kredytową w sekcji Rozliczenia, aby zasilić konto
Wygeneruj Klucz API
Przejdź do Konsola → Klucze API i utwórz klucz uwierzytelniania
Zacznij Budować
Użyj klucza API do wysyłania żądań i zintegruj SeeDANCE ze swoją aplikacją
Doświadczenie Playground
Do szybkich testów i eksperymentów
Zarejestruj się i Zaloguj
Utwórz konto Atlas Cloud lub zaloguj się, aby uzyskać dostęp do platformy
Dodaj Metodę Płatności
Powiąż kartę kredytową w sekcji Rozliczenia, aby rozpocząć
Użyj Playground
Przejdź do playground modelu, wprowadź prompt i generuj filmy natychmiast z intuicyjnym interfejsem
Często Zadawane Pytania
Co czyni synchronizację audio-wizualną Seedance 1.5 Pro wyjątkową?
W przeciwieństwie do innych modeli, które najpierw generują wideo, a następnie dodają dźwięk, Seedance 1.5 Pro wykorzystuje architekturę dwugałęziową do jednoczesnego generowania obu. Zapewnia to idealną synchronizację od samego początku, z dokładnością synchronizacji warg na poziomie fonemów we wszystkich obsługiwanych językach.
Jak wypada w porównaniu z Wan 2.5 lub Wan 2.6?
Chociaż Wan 2.6 obsługuje dłuższe czasy trwania (do 15s) i renderowanie tekstu, Seedance 1.5 Pro wyróżnia się kinematograficzną kontrolą kamery, obsługą wielu języków/dialektów z dźwiękiem przestrzennym i fizycznie dokładnym ruchem. Wybieraj według potrzeb: Seedance do opowiadania historii i treści wielojęzycznych, Wan do dem produktowych z tekstem.
Jakie formaty wideo i rozdzielczości są obsługiwane?
Seedance 1.5 Pro generuje natywne wideo 1080p w 24fps. Obsługiwane proporcje obejmują 16:9, 9:16, 4:3, 3:4, 1:1 i 21:9. Czas trwania wynosi 4-12 sekund, a Inteligentny Czas Trwania pozwala modelowi automatycznie wybrać optymalną długość.
Jakie języki są obsługiwane do generowania dźwięku?
Seedance 1.5 Pro obsługuje ponad 8 języków, w tym angielski, mandaryński chiński, japoński, koreański, hiszpański, portugalski, indonezyjski oraz chińskie dialekty takie jak kantoński i syczuański. Każdy język oferuje dokładną synchronizację warg i naturalną wymowę.
Czy mogę kontrolować konkretne ruchy kamery?
Tak! Seedance rozumie techniczną gramatykę filmową. Możesz określić techniki kamery takie jak "Dolly Zoom na podmiot" (efekt Hitchcocka), ujęcia śledzące, zbliżenia lub szerokie ujęcia. Model interpretuje je, aby stworzyć profesjonalne kinematograficzne rezultaty.
Jaka jest różnica między Text-to-Video a Image-to-Video?
Text-to-Video generuje kompletne filmy z promptów tekstowych. Image-to-Video używa "Pierwszej Klatki" do zablokowania tożsamości postaci i oświetlenia, z opcjonalną kontrolą "Ostatniej Klatki" dla precyzyjnych przejść początku i końca. Oba tryby obsługują pełne generowanie dźwięku.
Dlaczego Używać Seedance 1.5 Pro na Atlas Cloud?
Doświadcz niezrównanej wydajności, niezawodności i wsparcia dla potrzeb generowania wideo AI
Dedykowana Infrastruktura
Nasz system jest specjalnie zoptymalizowany pod wdrażanie modeli AI. Uruchom Seedance 1.5 Pro z maksymalną wydajnością na infrastrukturze dostosowanej do wymagających obciążeń AI i generowania wideo.
Zunifikowane API dla Wszystkich Modeli
Uzyskaj dostęp do Seedance 1.5 Pro wraz z ponad 300 modelami AI (LLM, obraz, wideo, audio) przez jedno zunifikowane API. Zarządzaj wszystkimi potrzebami AI z jednej platformy z spójnym uwierzytelnianiem.
Konkurencyjne Ceny
Oszczędzaj do 70% w porównaniu z AWS dzięki przejrzystym cenom pay-as-you-go. Bez ukrytych opłat, bez minimalnych zobowiązań—płać tylko za to, czego używasz, z dostępnymi rabatami wolumenowymi.
Certyfikowane Bezpieczeństwo SOC I & II
Twoje dane i wygenerowane filmy są chronione certyfikatami SOC I & II i zgodnością HIPAA. Bezpieczeństwo klasy korporacyjnej z zaszyfrowaną transmisją i przechowywaniem danych.
SLA Dostępności 99,9%
Niezawodność klasy korporacyjnej z gwarantowaną dostępnością 99,9%. Generowanie wideo Seedance 1.5 Pro jest zawsze dostępne dla aplikacji produkcyjnych i krytycznych przepływów pracy.
Łatwa Integracja
Pełna integracja w kilka minut przez nasze proste API REST i wielojęzyczne SDK (Python, Node.js, Go). Kompleksowa dokumentacja i przykłady kodu dla szybkiego startu.
Specyfikacje Techniczne
Doświadcz Natywnej Generacji Audio-Wizualnej
Dołącz do filmowców, reklamodawców i twórców na całym świecie, którzy rewolucjonizują tworzenie treści wideo dzięki przełomowej technologii Seedance 1.5 Pro.
Seedance 1.5 PRO: A Native Audio-Visual Joint Generation Foundation Model
Seedance 1.5 PRO is a foundational model engineered specifically for native joint audio-visual generation, developed by the ByteDance Seed team. It represents a significant leap forward in transforming video generation into a practical, utility-driven tool. By integrating a dual-branch Diffusion Transformer architecture, the model achieves exceptional audio-visual synchronization and superior generation quality, establishing it as a robust engine for professional-grade content creation.
Key Features
Seedance 1.5 PRO introduces several key technical advancements that set a new standard for audio-visual content generation.
- Unified Multimodal Generation : Leverages a unified framework based on the MMDiT architecture to facilitate deep cross-modal interaction, ensuring precise temporal synchronization and semantic consistency between visual and auditory streams.
- Precise Audio-Visual Sync : Achieves high-fidelity alignment of lip movements, intonation, and performance rhythm. It natively supports multiple languages and regional dialects, accurately capturing unique vocal prosody and emotional tonalities.
- Cinematic Camera Control : Possesses autonomous camera scheduling capabilities, enabling the execution of complex movements such as continuous long takes and dolly zooms ("Hitchcock zoom"), significantly enhancing the dynamic tension of the video.
- Enhanced Narrative Coherence : Through strengthened semantic understanding, the model significantly improves the overall narrative coordination of audio-visual segments, providing strong support for professional-grade content creation.
- Efficient Inference Acceleration : An optimized multi-stage distillation framework, combined with quantization and parallelization, boosts the end-to-end inference speed by over 10x while preserving high performance.
Performance Highlights
The model's capabilities were rigorously evaluated against other state-of-the-art video generation models using the comprehensive SeedVideoBench 1.5 framework. Seedance 1.5 PRO demonstrates significant improvements across both video and audio dimensions.
In Text-to-Video (T2V) and Image-to-Video (I2V) tasks, it achieves a leading position in motion quality and instruction following (alignment). The model also shows strong competitiveness in visual aesthetics and motion dynamics. For audio generation, particularly in Chinese-language contexts, Seedance 1.5 PRO consistently outperforms competitors like Veo 3.1, delivering superior audio quality and audio-visual synchronization.
Use Cases
Seedance 1.5 PRO is well-suited for a wide range of professional applications, including:
- Film and Short Drama Production: Creating high-quality, emotionally resonant scenes with precise character performances.
- Advertising and Social Media: Generating engaging and dynamic video content for marketing campaigns.
- Cultural and Artistic Expression: Faithfully rendering traditional performing arts, such as Chinese opera, by capturing distinctive cadences and stylized gestures.
- Multi-Lingual Content: Producing content in various languages and dialects with accurate lip-sync and intonation.






