
Wan 2.6 Image-to-Video API by Alibaba
A speed-optimized image-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.
Inmatning
Utmatning
VilandeVarje körning kostar $0.07. För $10 kan du köra cirka 142 gånger.
Du kan fortsätta med:
Kodexempel
import requests
import time
# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "alibaba/wan-2.6/image-to-video",
"prompt": "A beautiful sunset over the ocean with gentle waves",
"width": 512,
"height": 512,
"duration": 3,
"fps": 24,
}
generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]
# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
def check_status():
while True:
response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
result = response.json()
if result["data"]["status"] in ["completed", "succeeded"]:
print("Generated video:", result["data"]["outputs"][0])
return result["data"]["outputs"][0]
elif result["data"]["status"] == "failed":
raise Exception(result["data"]["error"] or "Generation failed")
else:
# Still processing, wait 2 seconds
time.sleep(2)
video_url = check_status()Installera
Installera det nödvändiga paketet för ditt programmeringsspråk.
pip install requestsAutentisering
Alla API-förfrågningar kräver autentisering via en API key. Du kan hämta din API key från Atlas Cloud-instrumentpanelen.
export ATLASCLOUD_API_KEY="your-api-key-here"HTTP Headers
import os
API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {API_KEY}"
}Exponera aldrig din API key i klientkod eller publika arkiv. Använd miljövariabler eller en backend-proxy istället.
Skicka en förfrågan
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "your-model",
"prompt": "A beautiful landscape"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())Skicka en förfrågan
Skicka en asynkron genereringsförfrågan. API:et returnerar ett prediction ID som du kan använda för att kontrollera statusen och hämta resultatet.
/api/v1/model/generateVideoFörfrågningsinnehåll
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "alibaba/wan-2.6/image-to-video",
"input": {
"prompt": "A beautiful sunset over the ocean with gentle waves"
}
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")Svar
{
"id": "pred_abc123",
"status": "processing",
"model": "model-name",
"created_at": "2025-01-01T00:00:00Z"
}Kontrollera status
Polla prediction-endpointen för att kontrollera den aktuella statusen för din förfrågan.
/api/v1/model/prediction/{prediction_id}Polling-exempel
import requests
import time
prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
while True:
response = requests.get(url, headers=headers)
result = response.json()
status = result["data"]["status"]
print(f"Status: {status}")
if status in ["completed", "succeeded"]:
output_url = result["data"]["outputs"][0]
print(f"Output URL: {output_url}")
break
elif status == "failed":
print(f"Error: {result['data'].get('error', 'Unknown')}")
break
time.sleep(3)Statusvärden
processingFörfrågan bearbetas fortfarande.completedGenereringen är klar. Utdata är tillgängliga.succeededGenereringen lyckades. Utdata är tillgängliga.failedGenereringen misslyckades. Kontrollera error-fältet.Slutfört svar
{
"data": {
"id": "pred_abc123",
"status": "completed",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}
}Ladda upp filer
Ladda upp filer till Atlas Cloud-lagring och få en URL som du kan använda i dina API-förfrågningar. Använd multipart/form-data för uppladdning.
/api/v1/model/uploadMediaUppladdningsexempel
import requests
url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
with open("image.png", "rb") as f:
files = {"file": ("image.png", f, "image/png")}
response = requests.post(url, headers=headers, files=files)
result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")Svar
{
"data": {
"download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
"file_name": "image.png",
"content_type": "image/png",
"size": 1024000
}
}Input Schema
Följande parametrar accepteras i förfrågningsinnehållet.
Inga parametrar tillgängliga.
Exempel på förfrågningsinnehåll
{
"model": "alibaba/wan-2.6/image-to-video"
}Output Schema
API:et returnerar ett prediction-svar med de genererade utdata-URL:erna.
Exempelsvar
{
"id": "pred_abc123",
"status": "completed",
"model": "model-name",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}Atlas Cloud Skills
Atlas Cloud Skills integrerar 300+ AI-modeller direkt i din AI-kodassistent. Ett kommando för att installera, sedan använd naturligt språk för att generera bilder, videor och chatta med LLM.
Stödda klienter
Installera
npx skills add AtlasCloudAI/atlas-cloud-skillsKonfigurera API Key
Hämta din API key från Atlas Cloud-instrumentpanelen och ställ in den som en miljövariabel.
export ATLASCLOUD_API_KEY="your-api-key-here"Funktioner
När det är installerat kan du använda naturligt språk i din AI-assistent för att komma åt alla Atlas Cloud-modeller.
MCP Server
Atlas Cloud MCP Server ansluter din IDE med 300+ AI-modeller via Model Context Protocol. Fungerar med alla MCP-kompatibla klienter.
Stödda klienter
Installera
npx -y atlascloud-mcpKonfiguration
Lägg till följande konfiguration i din IDE:s MCP-inställningsfil.
{
"mcpServers": {
"atlascloud": {
"command": "npx",
"args": [
"-y",
"atlascloud-mcp"
],
"env": {
"ATLASCLOUD_API_KEY": "your-api-key-here"
}
}
}
}Tillgängliga verktyg
API Schema
Schema ej tillgängligtLogga in för att visa förfrågningshistorik
Du måste vara inloggad för att få tillgång till din modellförfrågningshistorik.
Logga InWan 2.6Professionell Multi-Shot AI-Videoskapande
Alibabas senaste genombrott inom AI-videogenerering. Skapa upp till 15 sekunders 1080p-videor med multi-shot berättande, referensdriven karaktärskonsistens och nativ audiovisuell synkronisering. Den första modellen som verkligen förstår storyboard-logik för filmiska narrativ.
Revolutionerande Genombrott
Vad som gör Wan 2.6 till spelväxlaren inom AI-videogenerering
Multi-Shot Berättande
Första modellen som förstår storyboard-logik. Genererar automatiskt sekventiella tagningar med sammanhängande övergångar, bibehåller karaktärsutseende och miljökonsistens genom scenbyten—möjliggör kompletta handlingsbågar i en enda 15-sekunders generering.
Referens-till-Video (R2V)
Ladda upp en 2-30 sekunders referensvideo för att extrahera och bevara karaktärsutseende, rörelsemönster och röstegenskaper. Skapa konsistenta karaktärsprestationer över flera videor med oöverträffad noggrannhet.
Exakt Textrendering
Branschledande textrenderingsförmåga för produktförpackningar, skyltar och varumärkesinnehåll. Generera tydlig, läsbar text inom videorutor—väsentligt för marknadsförings- och kommersiella tillämpningar.
Kärnfunktioner
Utökad 15-Sekunders Längd
Generera upp till 15 sekunder per video med komplett "Tre Akter"-struktur (Uppställning → Handling → Upplösning)
Professionell 1080p-Kvalitet
Nativ 1080p-utdata vid 24fps med filmisk kvalitet och förbättrad visuell stabilitet
Nativ Ljudsynkronisering
Dialog matchar läpprörelser, bakgrundsmusik anpassas till tempo, ljudeffekter triggas perfekt
Karaktärskonsistens
Bibehåll karaktärsutseende, kostymer och identitet genom tagningar och flera videor
Filmisk Kamerakontroll
Professionella kamerarörelser inklusive panorering, zoom, spårningstagningar och dolly-rörelser
Flexibla Bildförhållanden
16:9 (YouTube), 9:16 (Reels), 1:1 (Kvadrat) - plattformsoptimerad utan efterproduktionsbeskärning
Wan 2.6 vs Wan 2.5: Större Förbättringar
Se vad som är nytt i senaste versionen
Tre Specialiserade Genereringslägen
Välj rätt läge för ditt kreativa arbetsflöde
Text-till-Video (T2V)
Mest PopulärGenerera kompletta videor från textprompter med förbättrad multi-shot segmentering och förbättrad prompthantering. Perfekt för berättande och kreativ utforskning.
- Automatisk tagningssegmentering från enskild prompt
- Multi-karaktär interaktionsförståelse
- Kamerarörelse och emotionella ledtrådar
- Bevarande av miljödetaljer
Bild-till-Video (I2V)
FörbättradOmvandla stillbilder till rörliga videor med förbättrad rörelsekoherens. Idealisk för produktvisningar, fotoanimering och visuellt berättande.
- Exakt textrendering för produkter
- Stilkonsistens över ramar
- Naturlig rörelse från stillbilder
- Narrativdriven visuell optimering
Referens-till-Video (R2V)
NYTLadda upp en referensvideo (2-30s) för att bevara karaktärsutseende, rörelsemönster och röst. Starkaste konsistensgaranti för karaktärsdriven innehåll.
- Fullständig bevarande av karaktärsidentitet
- Extraktion av röstegenskaper
- Replikering av rörelsemönster
- Multi-karaktär samspelsscener
Perfekt För
Marknadsföring & Reklam
Produktdemos med textrendering, varumärkeskampanjer med karaktärskonsistens och reklamvideor
Innehållsskapande
YouTube-videor, sociala medier-reels, multi-shot berättande och videoredigeringsarbetsflöden
E-handel
Produktvisningar med exakt text, handledningsvideor och återskapande av kundrecensioner
Utbildning & Träning
Instruktionsinnehåll, kursmaterial och multi-scen utbildningsnarrativ
Underhållning
Kortfilmer, karaktärsdrivna berättelser, filmiska sekvenser och kreativa experiment
Förvisualisering
Filmkonceptutveckling, storyboard-skapande och scenplanering för produktioner
Wan 2.6 T2V, I2V och R2V API-Integration
Komplett API-svit för Text-till-Video, Bild-till-Video och Referens-till-Video generering
Text-till-Video API (T2V API)
Vår Wan 2.6 T2V API omvandlar textprompter till multi-shot filmiska videor med automatisk scensegmentering. Generera professionella 1080p-videor upp till 15 sekunder med nativ ljudsynkronisering.
Bild-till-Video API (I2V API)
Vår Wan 2.6 I2V API ger liv åt stillbilder med exakt rörelsekontroll och textrendering. Perfekt för produktvideor, fotoanimering och varumärkesinnehållsskapande.
Referens-till-Video API (R2V API)
Vår Wan 2.6 R2V API bevarar karaktärsidentitet från referensvideor. Ladda upp 2-30 sekunders klipp för att extrahera utseende, röst och rörelsemönster för konsekvent karaktärsgenerering.
Komplett API-Svit
Alla tre Wan 2.6 API-lägena (T2V API, I2V API, R2V API) stöder RESTful-arkitektur med omfattande dokumentation. Kom igång med SDK:er för Python, Node.js och mer. Varje endpoint inkluderar nativ audiovisuell synkronisering och fullständiga kommersiella användningsrättigheter.
Hur Man Kommer Igång med Wan 2.6
Börja skapa professionella videor på minuter med två enkla vägar
API-Integration
För utvecklare som bygger applikationer
Registrera & Logga In
Skapa ditt Atlas Cloud-konto eller logga in för att få åtkomst till konsolen
Lägg Till Betalningsmetod
Bind ditt kreditkort i Faktureringssektionen för att finansiera ditt konto
Generera API-Nyckel
Navigera till Konsol → API-Nycklar och skapa din autentiseringsnyckel
Börja Bygga
Använd T2V, I2V eller R2V API-endpoints för att integrera Wan 2.6 i din applikation
Playground-Upplevelse
För snabb testning och experiment
Registrera & Logga In
Skapa ditt Atlas Cloud-konto eller logga in för att få åtkomst till plattformen
Lägg Till Betalningsmetod
Bind ditt kreditkort i Faktureringssektionen för att komma igång
Använd Playground
Gå till Wan 2.6 playground, välj T2V/I2V/R2V-läge och generera videor direkt
Vanliga Frågor
Vad gör Wan 2.6:s multi-shot förmåga unik?
Wan 2.6 är den första modellen som verkligen förstår storyboard-logik. Till skillnad från Wan 2.5 som skapade röriga "morphing"-effekter, kan Wan 2.6 automatiskt segmentera en enskild prompt i flera distinkta tagningar med sammanhängande övergångar, bibehålla karaktärskonsistens genom scenbyten.
Hur fungerar Referens-till-Video (R2V)?
Ladda upp en 2-30 sekunders referensvideo, och Wan 2.6 extraherar karaktärens utseende, rörelsemönster och röstegenskaper. Du kan sedan generera nya videor med samma karaktär med konsekvent identitet—idealiskt för att skapa karaktärsdrivna innehållsserier.
Vilka videoformat och längder stöds?
Wan 2.6 genererar 1080p-videor vid 24fps med längder från 5 till 15 sekunder. Stödda bildförhållanden inkluderar 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) och 1:1 (kvadratiskt format), optimerade för varje plattform utan att kräva efterproduktionsbeskärning.
Kan Wan 2.6 rendera text i videor?
Ja! Wan 2.6 har branschledande textrendering för produktförpackningar, skyltar och varumärkesinnehåll. Modellen kan generera tydlig, läsbar text inom videoramar—en kritisk funktion som Seedance och de flesta konkurrenter saknar.
Vad är skillnaden mellan T2V, I2V och R2V-lägena?
T2V (Text-till-Video) genererar från textprompter med multi-shot förmåga. I2V (Bild-till-Video) animerar stillbilder med exakt textrendering. R2V (Referens-till-Video) använder videoreferenser för att bevara karaktärsidentitet över genereringar. Välj baserat på din inputtyp och konsistensbehov.
Har jag kommersiella rättigheter till genererade videor?
Ja! Varje Wan 2.6-skapelse kommer med fullständiga kommersiella användningsrättigheter. Videor är produktionsklara för marknadsföringskampanjer, kundleveranser, varumärkesinnehåll och kommersiella tillämpningar utan ytterligare licensieringskrav.
Varför Använda Wan 2.6 på Atlas Cloud?
Utnyttja företagsinfrastruktur för dina professionella videogenereringsarbetsflöden
Ändamålsbyggd Infrastruktur
Distribuera Wan 2.6:s multi-shot generering och R2V-förmågor på infrastruktur specifikt optimerad för krävande AI-videoarbetsbelastningar. Maximal prestanda för 1080p 15-sekunders generering.
Enhetlig API för Alla Modeller
Få åtkomst till Wan 2.6 (T2V, I2V, R2V) tillsammans med 300+ AI-modeller (LLM:er, bild, video, ljud) genom ett enhetligt API. Enskild integration för alla dina generativa AI-behov med konsekvent autentisering.
Konkurrenskraftiga Priser
Spara upp till 70% jämfört med AWS med transparent pay-as-you-go-prissättning. Inga dolda avgifter, inga åtaganden—skala från prototyp till produktion utan att spräcka budgeten.
SOC I & II Certifierad Säkerhet
Dina referensvideor och genererat innehåll skyddas med SOC I & II-certifieringar och HIPAA-efterlevnad. Företagssäkerhet med krypterad överföring och lagring.
99,9% Drifttid SLA
Företagstillförlitlighet med garanterad 99,9% drifttid. Din Wan 2.6 multi-shot videogenerering är alltid tillgänglig för produktionskampanjer och kritiska innehållsarbetsflöden.
Enkel Integration
Komplett integration på minuter med REST API och flerspråkiga SDK:er (Python, Node.js, Go). Växla sömlöst mellan T2V, I2V och R2V-lägen med enhetlig endpoint-struktur.
Tekniska Specifikationer
Upplev Professionell Multi-Shot Videogenerering
Anslut till innehållsskapare, marknadsförare och filmskapare över hela världen som revolutionerar videoproduktion med Wan 2.6:s banbrytande multi-shot berättande och karaktärskonsistensförmågor.
Alibaba WAN 2.6 Image-to-Video Model
Alibaba WAN 2.6 is an advanced image-to-video model on Alibaba Cloud’s DashScope. It generates high-quality videos from images and supports output resolutions of 720p and 1080p.
What makes it stand out?
-
More affordable: Wan 2.6 is more streamlined and cost-effective - reducing creator expenses and offering more options.
-
One-pass A/V sync: Wan 2.6 creates a fully synchronized video (audio/voiceover + lip-sync) from a single, well-structured prompt - no separate recording or manual alignment required.
-
Multilingual friendly: Wan 2.6 reliably processes like Chinese prompts for A/V-synced videos.
-
Longer duration & more video size options: Wan 2.6 delivers up to 10 seconds and 6 aspect/size options, enabling more storytelling room and publishing flexibility.
-
Multi-shot storytelling: Generates cohesive multi-shot narratives, keeping key details consistent across shots and offering auto shot-split for simple prompts.
-
Video reference generation: Uses a reference video's appearance and voice to guide new videos; supports human or arbitrary subjects, single or dual performers.
-
15s long videos: Produces videos up to 15 seconds, expanding temporal capacity for richer storytelling.
Designed For
-
Marketing teams: Fast, polished demos/tutorials—low cost, consistent style.
-
Global enterprises: Multilingual, lip-synced videos with subtitles for efficient localization.
-
Storytellers & YouTubers: Immersive narratives while maintaining cadence and quality—driving growth.
-
Corporate training teams: HD videos over docs—clearer key points, better communication.
Pricing
The table below lists prices for easy comparsion.
| Output Resolution | Duration (5s) | Duration (10s) |
|---|---|---|
| 720p | $0.5 | $1 |
| 1080p | $0.75 | $1.5 |
Billing Rules
-
Minimum charge: 5 seconds
-
Per-second rate = (price per 5 seconds) ÷ 5
-
Billed duration = video length in seconds (rounded up), with a 5-second minimum
-
Total cost = billed duration × per-second rate (by output resolution)
How to Use
-
Write your prompt.
-
Upload an audio file (optional) for voice/music.
-
Choose the video size (resolution/aspect).
-
Select the video duration (e.g., 5s / 10s).
-
Submit and wait for processing.
-
Preview and download the result.






