alibaba/wan-2.6/image-to-video

bild-till-video

Wan 2.6 Image-to-Video API by Alibaba

alibaba/wan-2.6/image-to-video

Image-to-video

A speed-optimized image-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.

Inmatning

Laddar parameterkonfiguration...

Utmatning

Vilande

Dina genererade videor visas här

Konfigurera parametrar och klicka på Kör för att börja generera

Varje körning kostar $0.07. För $10 kan du köra cirka 142 gånger.

Du kan fortsätta med:

Seedance 2.0 Kling v3 Vidu Wan2.7

Parametrar

Kodexempel
import requests
import time

# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "alibaba/wan-2.6/image-to-video",
    "prompt": "A beautiful sunset over the ocean with gentle waves",
    "width": 512,
    "height": 512,
    "duration": 3,
    "fps": 24,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] in ["completed", "succeeded"]:
            print("Generated video:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

video_url = check_status()

Installera

Installera det nödvändiga paketet för ditt programmeringsspråk.

bash

pip install requests

Autentisering

Alla API-förfrågningar kräver autentisering via en API key. Du kan hämta din API key från Atlas Cloud-instrumentpanelen.

bash

export ATLASCLOUD_API_KEY="your-api-key-here"

HTTP Headers

python

import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}

Håll din API key säker

Exponera aldrig din API key i klientkod eller publika arkiv. Använd miljövariabler eller en backend-proxy istället.

Skicka en förfrågan

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Skicka en förfrågan

Skicka en asynkron genereringsförfrågan. API:et returnerar ett prediction ID som du kan använda för att kontrollera statusen och hämta resultatet.

POST/api/v1/model/generateVideo

Förfrågningsinnehåll

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "alibaba/wan-2.6/image-to-video",
    "input": {
        "prompt": "A beautiful sunset over the ocean with gentle waves"
    }
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")

Svar

{
  "id": "pred_abc123",
  "status": "processing",
  "model": "model-name",
  "created_at": "2025-01-01T00:00:00Z"
}

Kontrollera status

Polla prediction-endpointen för att kontrollera den aktuella statusen för din förfrågan.

GET/api/v1/model/prediction/{prediction_id}

Polling-exempel

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

Statusvärden

processingFörfrågan bearbetas fortfarande.

completedGenereringen är klar. Utdata är tillgängliga.

succeededGenereringen lyckades. Utdata är tillgängliga.

failedGenereringen misslyckades. Kontrollera error-fältet.

Slutfört svar

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.mp4"
    ],
    "metrics": {
      "predict_time": 45.2
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

Ladda upp filer

Ladda upp filer till Atlas Cloud-lagring och få en URL som du kan använda i dina API-förfrågningar. Använd multipart/form-data för uppladdning.

POST/api/v1/model/uploadMedia

Uppladdningsexempel

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

Svar

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

Input Schema

Följande parametrar accepteras i förfrågningsinnehållet.

Totalt: 0Obligatorisk: 0Valfri: 0

Inga parametrar tillgängliga.

Exempel på förfrågningsinnehåll

json

{
  "model": "alibaba/wan-2.6/image-to-video"
}

Output Schema

API:et returnerar ett prediction-svar med de genererade utdata-URL:erna.

idstringrequired

Unique identifier for the prediction.

statusstringrequired

Current status of the prediction.

processingcompletedsucceededfailed

modelstringrequired

The model used for generation.

outputsarray[string]

Array of output URLs. Available when status is "completed".

errorstring

Error message if status is "failed".

metricsobject

Performance metrics.

predict_timenumber

Time taken for video generation in seconds.

created_atstringrequired

ISO 8601 timestamp when the prediction was created.

Format: date-time

completed_atstring

ISO 8601 timestamp when the prediction was completed.

Format: date-time

Exempelsvar

json

{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.mp4"
  ],
  "metrics": {
    "predict_time": 45.2
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills integrerar 300+ AI-modeller direkt i din AI-kodassistent. Ett kommando för att installera, sedan använd naturligt språk för att generera bilder, videor och chatta med LLM.

Stödda klienter

Claude Code

OpenAI Codex

Gemini CLI

Cursor

Windsurf

VS Code

Trae

GitHub Copilot

Cline

Roo Code

Amp

Goose

Replit

40+ stödda klienter

Installera

bash

npx skills add AtlasCloudAI/atlas-cloud-skills

Konfigurera API Key

Hämta din API key från Atlas Cloud-instrumentpanelen och ställ in den som en miljövariabel.

bash

export ATLASCLOUD_API_KEY="your-api-key-here"

Funktioner

När det är installerat kan du använda naturligt språk i din AI-assistent för att komma åt alla Atlas Cloud-modeller.

BildgenereringGenerera bilder med modeller som Nano Banana 2, Z-Image och fler.

VideoskapandeSkapa videor från text eller bilder med Kling, Vidu, Veo m.fl.

LLM-chattChatta med Qwen, DeepSeek och andra stora språkmodeller.

MediauppladdningLadda upp lokala filer för bildredigering och bild-till-video-arbetsflöden.

Läs mer

github.com/AtlasCloudAI/atlas-cloud-skills

MCP Server

Atlas Cloud MCP Server ansluter din IDE med 300+ AI-modeller via Model Context Protocol. Fungerar med alla MCP-kompatibla klienter.

Stödda klienter

Cursor

VS Code

Windsurf

Claude Code

OpenAI Codex

Gemini CLI

Cline

Roo Code

100+ stödda klienter

Installera

bash

npx -y atlascloud-mcp

Konfiguration

Lägg till följande konfiguration i din IDE:s MCP-inställningsfil.

json

{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

Tillgängliga verktyg

atlas_generate_imageGenerera bilder från textpromptar.

atlas_generate_videoSkapa videor från text eller bilder.

atlas_chatChatta med stora språkmodeller.

atlas_list_modelsBläddra bland 300+ tillgängliga AI-modeller.

atlas_quick_generateInnehållsskapande i ett steg med automatiskt modellval.

atlas_upload_mediaLadda upp lokala filer för API-arbetsflöden.

Läs mer

github.com/AtlasCloudAI/mcp-server

API Schema

Schema ej tillgängligt

Logga in för att visa förfrågningshistorik

Du måste vara inloggad för att få tillgång till din modellförfrågningshistorik.

Logga In

🎬MULTI-SHOT VIDEOGENERERING

Wan 2.6Professionell Multi-Shot AI-Videoskapande

Alibabas senaste genombrott inom AI-videogenerering. Skapa upp till 15 sekunders 1080p-videor med multi-shot berättande, referensdriven karaktärskonsistens och nativ audiovisuell synkronisering. Den första modellen som verkligen förstår storyboard-logik för filmiska narrativ.

Revolutionerande Genombrott

Vad som gör Wan 2.6 till spelväxlaren inom AI-videogenerering

Multi-Shot Berättande

Första modellen som förstår storyboard-logik. Genererar automatiskt sekventiella tagningar med sammanhängande övergångar, bibehåller karaktärsutseende och miljökonsistens genom scenbyten—möjliggör kompletta handlingsbågar i en enda 15-sekunders generering.

Referens-till-Video (R2V)

Ladda upp en 2-30 sekunders referensvideo för att extrahera och bevara karaktärsutseende, rörelsemönster och röstegenskaper. Skapa konsistenta karaktärsprestationer över flera videor med oöverträffad noggrannhet.

Exakt Textrendering

Branschledande textrenderingsförmåga för produktförpackningar, skyltar och varumärkesinnehåll. Generera tydlig, läsbar text inom videorutor—väsentligt för marknadsförings- och kommersiella tillämpningar.

Kärnfunktioner

Utökad 15-Sekunders Längd

Generera upp till 15 sekunder per video med komplett "Tre Akter"-struktur (Uppställning → Handling → Upplösning)

Professionell 1080p-Kvalitet

Nativ 1080p-utdata vid 24fps med filmisk kvalitet och förbättrad visuell stabilitet

Nativ Ljudsynkronisering

Dialog matchar läpprörelser, bakgrundsmusik anpassas till tempo, ljudeffekter triggas perfekt

Karaktärskonsistens

Bibehåll karaktärsutseende, kostymer och identitet genom tagningar och flera videor

Filmisk Kamerakontroll

Professionella kamerarörelser inklusive panorering, zoom, spårningstagningar och dolly-rörelser

Flexibla Bildförhållanden

16:9 (YouTube), 9:16 (Reels), 1:1 (Kvadrat) - plattformsoptimerad utan efterproduktionsbeskärning

Wan 2.6 vs Wan 2.5: Större Förbättringar

Se vad som är nytt i senaste versionen

Videolängd

Upp till 15 sekunder

Wan 2.5: Max 10 sekunder

Multi-Shot Förmåga

Förstår storyboard-logik

Wan 2.5: Enskild tagning eller rörig morphing

Referensvideostöd

R2V-läge med full bevarande

Wan 2.5: Endast bildreferens

Karaktärskonsistens

Utmärkt mellan tagningar

Wan 2.5: Problem med karaktärsdrift

Rörelsestabilitet

Minskad darr och artefakter

Wan 2.5: Tillfällig ramdrift

Promptförståelse

Komplexa multi-karaktärsscener

Wan 2.5: Grundläggande scengenerering

Tre Specialiserade Genereringslägen

Välj rätt läge för ditt kreativa arbetsflöde

Text-till-Video (T2V)

Mest Populär

Generera kompletta videor från textprompter med förbättrad multi-shot segmentering och förbättrad prompthantering. Perfekt för berättande och kreativ utforskning.

Automatisk tagningssegmentering från enskild prompt
Multi-karaktär interaktionsförståelse
Kamerarörelse och emotionella ledtrådar
Bevarande av miljödetaljer

Bild-till-Video (I2V)

Förbättrad

Omvandla stillbilder till rörliga videor med förbättrad rörelsekoherens. Idealisk för produktvisningar, fotoanimering och visuellt berättande.

Exakt textrendering för produkter
Stilkonsistens över ramar
Naturlig rörelse från stillbilder
Narrativdriven visuell optimering

Referens-till-Video (R2V)

NYT

Ladda upp en referensvideo (2-30s) för att bevara karaktärsutseende, rörelsemönster och röst. Starkaste konsistensgaranti för karaktärsdriven innehåll.

Fullständig bevarande av karaktärsidentitet
Extraktion av röstegenskaper
Replikering av rörelsemönster
Multi-karaktär samspelsscener

Perfekt För

Marknadsföring & Reklam

Produktdemos med textrendering, varumärkeskampanjer med karaktärskonsistens och reklamvideor

Innehållsskapande

YouTube-videor, sociala medier-reels, multi-shot berättande och videoredigeringsarbetsflöden

E-handel

Produktvisningar med exakt text, handledningsvideor och återskapande av kundrecensioner

Utbildning & Träning

Instruktionsinnehåll, kursmaterial och multi-scen utbildningsnarrativ

Underhållning

Kortfilmer, karaktärsdrivna berättelser, filmiska sekvenser och kreativa experiment

Förvisualisering

Filmkonceptutveckling, storyboard-skapande och scenplanering för produktioner

Wan 2.6 T2V, I2V och R2V API-Integration

Komplett API-svit för Text-till-Video, Bild-till-Video och Referens-till-Video generering

Text-till-Video API (T2V API)

Vår Wan 2.6 T2V API omvandlar textprompter till multi-shot filmiska videor med automatisk scensegmentering. Generera professionella 1080p-videor upp till 15 sekunder med nativ ljudsynkronisering.

Multi-shot berättande från enskild prompt

15-sekunders längd med Tre Akter-struktur

Förbättrad promptförståelse för komplexa scener

Flexibla bildförhållanden: 16:9, 9:16, 1:1

Bild-till-Video API (I2V API)

Vår Wan 2.6 I2V API ger liv åt stillbilder med exakt rörelsekontroll och textrendering. Perfekt för produktvideor, fotoanimering och varumärkesinnehållsskapande.

Exakt textrendering för produkter och skyltar

Stilkonsistens i animationsramar

Naturlig rörelse med förbättrad koherens

Narrativoptimerad visuell utdata

Referens-till-Video API (R2V API)

Vår Wan 2.6 R2V API bevarar karaktärsidentitet från referensvideor. Ladda upp 2-30 sekunders klipp för att extrahera utseende, röst och rörelsemönster för konsekvent karaktärsgenerering.

Bevarande av karaktärsutseende och identitet

Extraktion och replikering av röstegenskaper

Analys och reproduktion av rörelsemönster

Stöd för multi-karaktärsscener

💡

Komplett API-Svit

Alla tre Wan 2.6 API-lägena (T2V API, I2V API, R2V API) stöder RESTful-arkitektur med omfattande dokumentation. Kom igång med SDK:er för Python, Node.js och mer. Varje endpoint inkluderar nativ audiovisuell synkronisering och fullständiga kommersiella användningsrättigheter.

Hur Man Kommer Igång med Wan 2.6

Börja skapa professionella videor på minuter med två enkla vägar

API-Integration

För utvecklare som bygger applikationer

Registrera & Logga In

Skapa ditt Atlas Cloud-konto eller logga in för att få åtkomst till konsolen

Lägg Till Betalningsmetod

Bind ditt kreditkort i Faktureringssektionen för att finansiera ditt konto

Generera API-Nyckel

Navigera till Konsol → API-Nycklar och skapa din autentiseringsnyckel

Börja Bygga

Använd T2V, I2V eller R2V API-endpoints för att integrera Wan 2.6 i din applikation

Playground-Upplevelse

För snabb testning och experiment

Registrera & Logga In

Skapa ditt Atlas Cloud-konto eller logga in för att få åtkomst till plattformen

Lägg Till Betalningsmetod

Bind ditt kreditkort i Faktureringssektionen för att komma igång

Använd Playground

Gå till Wan 2.6 playground, välj T2V/I2V/R2V-läge och generera videor direkt

💡

Professionellt Tips: Testa olika genereringslägen i Playground först för att förstå vilket som fungerar bäst för ditt användningsfall, integrera sedan motsvarande API för produktionsskala.

Vanliga Frågor

Vad gör Wan 2.6:s multi-shot förmåga unik?

Wan 2.6 är den första modellen som verkligen förstår storyboard-logik. Till skillnad från Wan 2.5 som skapade röriga "morphing"-effekter, kan Wan 2.6 automatiskt segmentera en enskild prompt i flera distinkta tagningar med sammanhängande övergångar, bibehålla karaktärskonsistens genom scenbyten.

Hur fungerar Referens-till-Video (R2V)?

Ladda upp en 2-30 sekunders referensvideo, och Wan 2.6 extraherar karaktärens utseende, rörelsemönster och röstegenskaper. Du kan sedan generera nya videor med samma karaktär med konsekvent identitet—idealiskt för att skapa karaktärsdrivna innehållsserier.

Vilka videoformat och längder stöds?

Wan 2.6 genererar 1080p-videor vid 24fps med längder från 5 till 15 sekunder. Stödda bildförhållanden inkluderar 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) och 1:1 (kvadratiskt format), optimerade för varje plattform utan att kräva efterproduktionsbeskärning.

Kan Wan 2.6 rendera text i videor?

Ja! Wan 2.6 har branschledande textrendering för produktförpackningar, skyltar och varumärkesinnehåll. Modellen kan generera tydlig, läsbar text inom videoramar—en kritisk funktion som Seedance och de flesta konkurrenter saknar.

Vad är skillnaden mellan T2V, I2V och R2V-lägena?

T2V (Text-till-Video) genererar från textprompter med multi-shot förmåga. I2V (Bild-till-Video) animerar stillbilder med exakt textrendering. R2V (Referens-till-Video) använder videoreferenser för att bevara karaktärsidentitet över genereringar. Välj baserat på din inputtyp och konsistensbehov.

Har jag kommersiella rättigheter till genererade videor?

Ja! Varje Wan 2.6-skapelse kommer med fullständiga kommersiella användningsrättigheter. Videor är produktionsklara för marknadsföringskampanjer, kundleveranser, varumärkesinnehåll och kommersiella tillämpningar utan ytterligare licensieringskrav.

Varför Använda Wan 2.6 på Atlas Cloud?

Utnyttja företagsinfrastruktur för dina professionella videogenereringsarbetsflöden

Ändamålsbyggd Infrastruktur

Distribuera Wan 2.6:s multi-shot generering och R2V-förmågor på infrastruktur specifikt optimerad för krävande AI-videoarbetsbelastningar. Maximal prestanda för 1080p 15-sekunders generering.

Enhetlig API för Alla Modeller

Få åtkomst till Wan 2.6 (T2V, I2V, R2V) tillsammans med 300+ AI-modeller (LLM:er, bild, video, ljud) genom ett enhetligt API. Enskild integration för alla dina generativa AI-behov med konsekvent autentisering.

Konkurrenskraftiga Priser

Spara upp till 70% jämfört med AWS med transparent pay-as-you-go-prissättning. Inga dolda avgifter, inga åtaganden—skala från prototyp till produktion utan att spräcka budgeten.

SOC I & II Certifierad Säkerhet

Dina referensvideor och genererat innehåll skyddas med SOC I & II-certifieringar och HIPAA-efterlevnad. Företagssäkerhet med krypterad överföring och lagring.

99,9% Drifttid SLA

Företagstillförlitlighet med garanterad 99,9% drifttid. Din Wan 2.6 multi-shot videogenerering är alltid tillgänglig för produktionskampanjer och kritiska innehållsarbetsflöden.

Enkel Integration

Komplett integration på minuter med REST API och flerspråkiga SDK:er (Python, Node.js, Go). Växla sömlöst mellan T2V, I2V och R2V-lägen med enhetlig endpoint-struktur.

99.9%

Drifttid

70%

Lägre Kostnad vs AWS

300+

Gen AI Modeller

24/7

Pro Support

Tekniska Specifikationer

Architecture

Avancerad Transformer med Multi-Modal Förståelse

Resolution

1080p (Full HD)

Frame Rate

24 FPS

Duration

5-15 sekunder (lägesberoende)

Aspect Ratios

16:9, 9:16, 1:1

Generation Modes

T2V, I2V, R2V

Audio

Nativ synkronisering med lip-sync

Commercial Rights

Full kommersiell användning inkluderad

Upplev Professionell Multi-Shot Videogenerering

Anslut till innehållsskapare, marknadsförare och filmskapare över hela världen som revolutionerar videoproduktion med Wan 2.6:s banbrytande multi-shot berättande och karaktärskonsistensförmågor.

Alibaba WAN 2.6 Image-to-Video Model

Alibaba WAN 2.6 is an advanced image-to-video model on Alibaba Cloud’s DashScope. It generates high-quality videos from images and supports output resolutions of 720p and 1080p.

What makes it stand out?

More affordable: Wan 2.6 is more streamlined and cost-effective - reducing creator expenses and offering more options.
One-pass A/V sync: Wan 2.6 creates a fully synchronized video (audio/voiceover + lip-sync) from a single, well-structured prompt - no separate recording or manual alignment required.
Multilingual friendly: Wan 2.6 reliably processes like Chinese prompts for A/V-synced videos.
Longer duration & more video size options: Wan 2.6 delivers up to 10 seconds and 6 aspect/size options, enabling more storytelling room and publishing flexibility.
Multi-shot storytelling: Generates cohesive multi-shot narratives, keeping key details consistent across shots and offering auto shot-split for simple prompts.
Video reference generation: Uses a reference video's appearance and voice to guide new videos; supports human or arbitrary subjects, single or dual performers.
15s long videos: Produces videos up to 15 seconds, expanding temporal capacity for richer storytelling.

Designed For

Marketing teams: Fast, polished demos/tutorials—low cost, consistent style.
Global enterprises: Multilingual, lip-synced videos with subtitles for efficient localization.
Storytellers & YouTubers: Immersive narratives while maintaining cadence and quality—driving growth.
Corporate training teams: HD videos over docs—clearer key points, better communication.

Pricing

The table below lists prices for easy comparsion.

Output Resolution	Duration (5s)	Duration (10s)
720p	$0.5	$1
1080p	$0.75	$1.5

Billing Rules

Minimum charge: 5 seconds
Per-second rate = (price per 5 seconds) ÷ 5
Billed duration = video length in seconds (rounded up), with a 5-second minimum
Total cost = billed duration × per-second rate (by output resolution)

How to Use

Write your prompt.
Upload an audio file (optional) for voice/music.
Choose the video size (resolution/aspect).
Select the video duration (e.g., 5s / 10s).
Submit and wait for processing.
Preview and download the result.

Utforska Liknande Modeller

NEW

HOT

text-till-video

Van-2.6 Text-to-video

A speed-optimized text-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.

Van-2.6 Image-to-video

A speed-optimized image-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.

From

$0.068/SEK