atlascloud/wan-2.6-spicy/image-to-video

obraz-do-wideo

Wan 2.6 Spicy Image-to-Video API by Atlas Cloud

atlascloud/wan-2.6-spicy/image-to-video

Image-to-video

AtlasCloud Wan 2.6 Spicy Image-to-Video turns a reference image into a short motion clip with expressive character movement and stable temporal detail.

WEJŚCIE

Ładowanie konfiguracji parametrów...

WYJŚCIE

Bezczynny

Twoje wygenerowane wideo pojawi się tutaj

Skonfiguruj ustawienia i kliknij Uruchom, aby rozpocząć

Każde uruchomienie będzie kosztować $0.07. Za $10 możesz uruchomić ten model około 142 razy.

Co możesz zrobić dalej:

Seedance 2.0 Kling v3 Vidu Wan2.7

Parametry

Przykład kodu
import requests
import time

# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "atlascloud/wan-2.6-spicy/image-to-video",
    "prompt": "A beautiful sunset over the ocean with gentle waves",
    "width": 512,
    "height": 512,
    "duration": 3,
    "fps": 24,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] in ["completed", "succeeded"]:
            print("Generated video:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

video_url = check_status()

Instalacja

Zainstaluj wymagany pakiet dla swojego języka programowania.

pip install requests

Uwierzytelnianie

Wszystkie żądania API wymagają uwierzytelnienia za pomocą klucza API. Klucz API możesz uzyskać z panelu Atlas Cloud.

export ATLASCLOUD_API_KEY="your-api-key-here"

Nagłówki HTTP

import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}

Chroń swój klucz API

Nigdy nie ujawniaj swojego klucza API w kodzie po stronie klienta ani w publicznych repozytoriach. Zamiast tego użyj zmiennych środowiskowych lub proxy backendowego.

Wyślij żądanie

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Wyślij żądanie

Wyślij asynchroniczne żądanie generowania. API zwróci identyfikator predykcji, którego możesz użyć do sprawdzania statusu i pobierania wyniku.

POST/api/v1/model/generateVideo

Treść żądania

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "atlascloud/wan-2.6-spicy/image-to-video",
    "prompt": "A beautiful sunset over the ocean with gentle waves"
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['data']['id']}")
print(f"Status: {result['data']['status']}")

Odpowiedź

{
  "code": 200,
  "data": {
    "id": "pred_abc123",
    "status": "processing",
    "model": "model-name",
    "created_at": "2025-01-01T00:00:00Z"
  }
}

Sprawdź status

Odpytuj endpoint predykcji, aby sprawdzić bieżący status żądania.

GET/api/v1/model/prediction/{prediction_id}

Przykład odpytywania

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

Wartości statusu

processingŻądanie jest wciąż przetwarzane.

completedGenerowanie zakończone. Wyniki są dostępne.

succeededGenerowanie powiodło się. Wyniki są dostępne.

failedGenerowanie nie powiodło się. Sprawdź pole błędu.

Odpowiedź ukończona

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.mp4"
    ],
    "metrics": {
      "predict_time": 45.2
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

Prześlij pliki

Prześlij pliki do magazynu Atlas Cloud i uzyskaj URL, którego możesz użyć w swoich żądaniach API. Użyj multipart/form-data do przesyłania.

POST/api/v1/model/uploadMedia

Przykład przesyłania

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

Odpowiedź

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

Schema wejściowy

Następujące parametry są akceptowane w treści żądania.

Łącznie: 0Wymagane: 0Opcjonalne: 0

Brak dostępnych parametrów.

Przykładowa treść żądania

{
  "model": "atlascloud/wan-2.6-spicy/image-to-video"
}

Schema wyjściowy

API zwraca odpowiedź predykcji z URL-ami wygenerowanych wyników.

idstringrequired

Unique identifier for the prediction.

statusstringrequired

Current status of the prediction.

processingcompletedsucceededfailed

modelstringrequired

The model used for generation.

outputsarray[string]

Array of output URLs. Available when status is "completed".

errorstring

Error message if status is "failed".

metricsobject

Performance metrics.

predict_timenumber

Time taken for video generation in seconds.

created_atstringrequired

ISO 8601 timestamp when the prediction was created.

Format: date-time

completed_atstring

ISO 8601 timestamp when the prediction was completed.

Format: date-time

Przykładowa odpowiedź

{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.mp4"
  ],
  "metrics": {
    "predict_time": 45.2
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills integruje ponad 300 modeli AI bezpośrednio z Twoim asystentem kodowania AI. Jedno polecenie do instalacji, a następnie używaj języka naturalnego do generowania obrazów, filmów i rozmów z LLM.

Obsługiwani klienci

Claude Code

OpenAI Codex

Gemini CLI

Cursor

Windsurf

VS Code

Trae

GitHub Copilot

Cline

Roo Code

Amp

Goose

Replit

40+ obsługiwani klienci

Instalacja

npx skills add AtlasCloudAI/atlas-cloud-skills

Skonfiguruj klucz API

Uzyskaj klucz API z panelu Atlas Cloud i ustaw go jako zmienną środowiskową.

export ATLASCLOUD_API_KEY="your-api-key-here"

Możliwości

Po zainstalowaniu możesz używać języka naturalnego w swoim asystencie AI, aby uzyskać dostęp do wszystkich modeli Atlas Cloud.

Generowanie obrazówGeneruj obrazy za pomocą modeli takich jak Nano Banana 2, Z-Image i inne.

Tworzenie wideoTwórz filmy z tekstu lub obrazów za pomocą Kling, Vidu, Veo itp.

Chat LLMRozmawiaj z Qwen, DeepSeek i innymi dużymi modelami językowymi.

Przesyłanie mediówPrześlij lokalne pliki do edycji obrazów i przepływów pracy obraz-do-wideo.

Dowiedz się więcej

github.com/AtlasCloudAI/atlas-cloud-skills

Serwer MCP

Serwer MCP Atlas Cloud łączy Twoje IDE z ponad 300 modelami AI za pośrednictwem Model Context Protocol. Działa z każdym klientem kompatybilnym z MCP.

Obsługiwani klienci

Cursor

VS Code

Windsurf

Claude Code

OpenAI Codex

Gemini CLI

Cline

Roo Code

100+ obsługiwani klienci

Instalacja

npx -y atlascloud-mcp

Konfiguracja

Dodaj następującą konfigurację do pliku ustawień MCP w swoim IDE.

{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

Dostępne narzędzia

atlas_generate_imageGeneruj obrazy z promptów tekstowych.

atlas_generate_videoTwórz filmy z tekstu lub obrazów.

atlas_chatRozmawiaj z dużymi modelami językowymi.

atlas_list_modelsPrzeglądaj ponad 300 dostępnych modeli AI.

atlas_quick_generateTworzenie treści w jednym kroku z automatycznym wyborem modelu.

atlas_upload_mediaPrześlij lokalne pliki do przepływów pracy API.

Dowiedz się więcej

github.com/AtlasCloudAI/mcp-server

API Schema

Schema niedostępna

Brak dostępnych przykładów

Ładowanie...

🎬GENEROWANIE WIDEO WIELOUJĘCIOWEGO

Wan 2.6Profesjonalne Tworzenie Wideo AI z Wieloma Ujęciami

Najnowszy przełom Alibaba w generowaniu wideo AI. Twórz wideo 1080p do 15 sekund z narracją wieloujęciową, spójnością postaci opartą na referencjach i natywną synchronizacją audiowizualną. Pierwszy model, który prawdziwie rozumie logikę storyboardu dla kinematograficznych narracji.

Rewolucyjne Przełomy

Co czyni Wan 2.6 przełomem w generowaniu wideo AI

Narracja Wieloujęciowa

Pierwszy model rozumiejący logikę storyboardu. Automatycznie generuje sekwencyjne ujęcia ze spójnymi przejściami, zachowując wygląd postaci i spójność środowiska przez zmiany scen—umożliwiając kompletne łuki fabularne w pojedynczej 15-sekundowej generacji.

Referencja do Wideo (R2V)

Prześlij 2-30 sekundowe wideo referencyjne, aby wyodrębnić i zachować wygląd postaci, wzorce ruchu i cechy głosu. Twórz spójne występy postaci w wielu filmach z bezprecedensową dokładnością.

Precyzyjne Renderowanie Tekstu

Wiodące w branży możliwości renderowania tekstu dla opakowań produktów, oznakowania i treści brandowych. Generuj czysty, czytelny tekst w klatkach wideo—niezbędny dla aplikacji marketingowych i komercyjnych.

Główne Możliwości

Wydłużony Czas Trwania 15 Sekund

Generuj do 15 sekund na wideo z kompletną strukturą "Trzech Aktów" (Ekspozycja → Akcja → Rozwiązanie)

Profesjonalna Jakość 1080p

Natywne wyjście 1080p przy 24fps z kinematograficzną jakością i ulepszoną stabilnością wizualną

Natywna Synchronizacja Dźwięku

Dialog pasuje do ruchów warg, muzyka w tle dopasowana do tempa, efekty dźwiękowe wyzwalane perfekcyjnie

Spójność Postaci

Zachowaj wygląd, kostiumy i tożsamość postaci przez ujęcia i wiele filmów

Kinematograficzne Sterowanie Kamerą

Profesjonalne ruchy kamery w tym panoramy, zbliżenia, ujęcia śledzące i ruchy na wózku

Elastyczne Proporcje Obrazu

16:9 (YouTube), 9:16 (Reels), 1:1 (Kwadrat) - zoptymalizowane pod platformy bez kadrowania w postprodukcji

Wan 2.6 vs Wan 2.5: Główne Ulepszenia

Zobacz, co nowego w najnowszej wersji

Czas Trwania Wideo

Do 15 sekund

Wan 2.5: Maksymalnie 10 sekund

Możliwość Wieloujęciowa

Rozumie logikę storyboardu

Wan 2.5: Pojedyncze ujęcie lub chaotyczny morphing

Wsparcie Wideo Referencyjnego

Tryb R2V z pełnym zachowaniem

Wan 2.5: Tylko referencja obrazu

Spójność Postaci

Doskonała między ujęciami

Wan 2.5: Problemy z dryfem postaci

Stabilność Ruchu

Zmniejszone drżenia i artefakty

Wan 2.5: Okazjonalny dryf klatek

Rozumienie Promptów

Złożone sceny z wieloma postaciami

Wan 2.5: Podstawowe generowanie scen

Trzy Wyspecjalizowane Tryby Generowania

Wybierz odpowiedni tryb dla swojego kreatywnego przepływu pracy

Tekst do Wideo (T2V)

Najpopularniejszy

Generuj kompletne wideo z promptów tekstowych z ulepszoną segmentacją wieloujęciową i udoskonaloną obsługą promptów. Idealny dla storytellingu i eksploracji kreatywnej.

Automatyczna segmentacja ujęć z jednego promptu
Rozumienie interakcji wielopostaciowych
Ruch kamery i wskazówki emocjonalne
Zachowanie szczegółów środowiska

Obraz do Wideo (I2V)

Ulepszony

Przekształcaj nieruchome obrazy w wideo z ruchem z ulepszoną spójnością ruchu. Idealny dla pokazów produktów, animacji zdjęć i wizualnego storytellingu.

Precyzyjne renderowanie tekstu dla produktów
Spójność stylu między klatkami
Naturalny ruch z nieruchomych obrazów
Optymalizacja wizualna kierowana narracją

Referencja do Wideo (R2V)

NOWOŚĆ

Prześlij wideo referencyjne (2-30s), aby zachować wygląd postaci, wzorce ruchu i głos. Najsilniejsza gwarancja spójności dla treści opartych na postaciach.

Pełne zachowanie tożsamości postaci
Ekstrakcja cech głosowych
Replikacja wzorców ruchu
Sceny interakcji wielu postaci

Idealne Do

Marketing i Reklama

Dema produktów z renderowaniem tekstu, kampanie brandowe ze spójnością postaci i wideo promocyjne

Tworzenie Treści

Filmy YouTube, rolki w mediach społecznościowych, storytelling wieloujęciowy i przepływy pracy montażu wideo

E-commerce

Pokazy produktów z precyzyjnym tekstem, filmy instruktażowe i odtwarzanie opinii klientów

Edukacja i Szkolenia

Treści instruktażowe, materiały kursowe i narracje edukacyjne z wieloma scenami

Rozrywka

Filmy krótkometrażowe, historie oparte na postaciach, sekwencje kinematograficzne i eksperymenty kreatywne

Przewizualizacja

Rozwój koncepcji filmowych, tworzenie storyboardów i planowanie scen dla produkcji

Integracja API Wan 2.6 T2V, I2V i R2V

Kompletny pakiet API do generowania Tekst do Wideo, Obraz do Wideo i Referencja do Wideo

API Tekst do Wideo (T2V API)

Nasze API Wan 2.6 T2V przekształca prompty tekstowe w wieloujęciowe wideo kinematograficzne z automatyczną segmentacją scen. Generuj profesjonalne wideo 1080p do 15 sekund z natywną synchronizacją dźwięku.

Storytelling wieloujęciowy z jednego promptu

Czas trwania 15 sekund ze strukturą Trzech Aktów

Ulepszone rozumienie promptów dla złożonych scen

Elastyczne proporcje obrazu: 16:9, 9:16, 1:1

API Obraz do Wideo (I2V API)

Nasze API Wan 2.6 I2V ożywia nieruchome obrazy z precyzyjną kontrolą ruchu i renderowaniem tekstu. Idealny dla filmów produktowych, animacji zdjęć i tworzenia treści brandowych.

Precyzyjne renderowanie tekstu dla produktów i oznakowania

Spójność stylu w klatkach animacji

Naturalny ruch z ulepszoną spójnością

Wyjście wizualne zoptymalizowane narracją

API Referencja do Wideo (R2V API)

Nasze API Wan 2.6 R2V zachowuje tożsamość postaci z wideo referencyjnych. Prześlij klipy 2-30 sekund, aby wyodrębnić wygląd, głos i wzorce ruchu dla spójnego generowania postaci.

Zachowanie wyglądu i tożsamości postaci

Ekstrakcja i replikacja cech głosowych

Analiza i reprodukcja wzorców ruchu

Wsparcie scen wielopostaciowych

💡

Kompletny Pakiet API

Wszystkie trzy tryby API Wan 2.6 (T2V API, I2V API, R2V API) wspierają architekturę RESTful z kompleksową dokumentacją. Zacznij z SDK dla Python, Node.js i więcej. Każdy endpoint zawiera natywną synchronizację audiowizualną i pełne prawa do użytku komercyjnego.

Jak Zacząć z Wan 2.6

Zacznij tworzyć profesjonalne wideo w kilka minut dzięki dwóm prostym ścieżkom

Integracja API

Dla deweloperów budujących aplikacje

Zarejestruj się i Zaloguj

Utwórz konto Atlas Cloud lub zaloguj się, aby uzyskać dostęp do konsoli

Dodaj Metodę Płatności

Połącz kartę kredytową w sekcji Rozliczenia, aby zasilić konto

Wygeneruj Klucz API

Przejdź do Konsola → Klucze API i utwórz swój klucz uwierzytelniania

Zacznij Budować

Użyj endpointów API T2V, I2V lub R2V, aby zintegrować Wan 2.6 w swojej aplikacji

Doświadczenie Playground

Do szybkich testów i eksperymentów

Zarejestruj się i Zaloguj

Utwórz konto Atlas Cloud lub zaloguj się, aby uzyskać dostęp do platformy

Dodaj Metodę Płatności

Połącz kartę kredytową w sekcji Rozliczenia, aby rozpocząć

Użyj Playground

Przejdź do playground Wan 2.6, wybierz tryb T2V/I2V/R2V i generuj wideo natychmiast

💡

Wskazówka Pro: Najpierw przetestuj różne tryby generowania w Playground, aby zrozumieć, który najlepiej działa dla Twojego przypadku użycia, a następnie zintegruj odpowiednie API dla skali produkcyjnej.

Najczęściej Zadawane Pytania

Co czyni możliwość wieloujęciową Wan 2.6 wyjątkową?

Wan 2.6 to pierwszy model, który prawdziwie rozumie logikę storyboardu. W przeciwieństwie do Wan 2.5, który tworzył chaotyczne efekty "morphingu", Wan 2.6 może automatycznie segmentować pojedynczy prompt na wiele odrębnych ujęć ze spójnymi przejściami, zachowując spójność postaci przez zmiany scen.

Jak działa Referencja do Wideo (R2V)?

Prześlij 2-30 sekundowe wideo referencyjne, a Wan 2.6 wyodrębni wygląd postaci, wzorce ruchu i cechy głosu. Możesz następnie generować nowe wideo z tą samą postacią ze spójną tożsamością—idealne do tworzenia serii treści opartych na postaciach.

Jakie formaty i czasy trwania wideo są obsługiwane?

Wan 2.6 generuje wideo 1080p przy 24fps z czasem trwania od 5 do 15 sekund. Obsługiwane proporcje obrazu obejmują 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) i 1:1 (format kwadratowy), zoptymalizowane dla każdej platformy bez wymagania kadrowania w postprodukcji.

Czy Wan 2.6 może renderować tekst w wideo?

Tak! Wan 2.6 ma wiodące w branży renderowanie tekstu dla opakowań produktów, oznakowania i treści brandowych. Model może generować czysty, czytelny tekst w klatkach wideo—kluczowa funkcja, której brakuje Seedance i większości konkurentów.

Jaka jest różnica między trybami T2V, I2V i R2V?

T2V (Tekst do Wideo) generuje z promptów tekstowych z możliwością wieloujęciową. I2V (Obraz do Wideo) animuje nieruchome obrazy z precyzyjnym renderowaniem tekstu. R2V (Referencja do Wideo) używa referencji wideo, aby zachować tożsamość postaci między generacjami. Wybierz na podstawie typu wejścia i potrzeb spójności.

Czy mam prawa komercyjne do generowanych wideo?

Tak! Każda kreacja Wan 2.6 posiada pełne prawa do użytku komercyjnego. Wideo są gotowe do produkcji w kampaniach marketingowych, materiałach dla klientów, treściach brandowych i zastosowaniach komercyjnych bez dodatkowych wymagań licencyjnych.

Dlaczego Używać Wan 2.6 na Atlas Cloud?

Wykorzystaj infrastrukturę klasy korporacyjnej dla swoich profesjonalnych przepływów pracy generowania wideo

Dedykowana Infrastruktura

Wdróż generowanie wieloujęciowe i możliwości R2V Wan 2.6 na infrastrukturze specjalnie zoptymalizowanej dla wymagających obciążeń wideo AI. Maksymalna wydajność dla generowania 1080p przez 15 sekund.

Zunifikowane API dla Wszystkich Modeli

Dostęp do Wan 2.6 (T2V, I2V, R2V) wraz z ponad 300 modelami AI (LLM, obraz, wideo, audio) przez jedno zunifikowane API. Pojedyncza integracja dla wszystkich potrzeb AI generatywnej ze spójnym uwierzytelnianiem.

Konkurencyjne Ceny

Oszczędzaj do 70% w porównaniu z AWS dzięki przejrzystym cenom pay-as-you-go. Bez ukrytych opłat, bez zobowiązań—skaluj od prototypu do produkcji bez rujnowania budżetu.

Certyfikowane Bezpieczeństwo SOC I & II

Twoje wideo referencyjne i wygenerowane treści chronione certyfikatami SOC I & II i zgodnością HIPAA. Bezpieczeństwo klasy korporacyjnej z zaszyfrowaną transmisją i przechowywaniem.

99,9% SLA Uptime

Niezawodność klasy korporacyjnej z gwarantowanym 99,9% uptime. Twoje generowanie wideo wieloujęciowego Wan 2.6 jest zawsze dostępne dla kampanii produkcyjnych i krytycznych przepływów pracy treści.

Łatwa Integracja

Kompletna integracja w minuty z REST API i wielojęzycznymi SDK (Python, Node.js, Go). Płynnie przełączaj się między trybami T2V, I2V i R2V ze zunifikowaną strukturą endpointów.

99.9%

Czas sprawności

70%

Niższe Koszty vs AWS

300+

Modele Gen AI

24/7

Wsparcie Pro

Specyfikacje Techniczne

Architecture

Zaawansowany Transformer z Rozumieniem Multi-Modalnym

Resolution

1080p (Full HD)

Frame Rate

24 FPS

Duration

5-15 sekund (zależne od trybu)

Aspect Ratios

16:9, 9:16, 1:1

Generation Modes

T2V, I2V, R2V

Audio

Natywna synchronizacja z lip-sync

Commercial Rights

Pełny użytek komercyjny włączony

Doświadcz Profesjonalnego Generowania Wideo Wieloujęciowego

Dołącz do twórców treści, marketerów i filmowców na całym świecie, którzy rewolucjonizują produkcję wideo dzięki przełomowym możliwościom storytellingu wieloujęciowego i spójności postaci Wan 2.6.

Wan 2.6 Spicy Image-to-Video

Wan 2.6 Spicy Image-to-Video turns a first-frame image into a short motion clip with expressive character movement and stable temporal detail. This AtlasCloud variant uses a dedicated Wan 2.6 image-to-video LoRA deployment for a more stylized motion profile.

Highlights

First-frame image-to-video: Use one starting image plus a text prompt to control movement and camera direction.
720p, 1080p, and SR output: Use native 720p/1080p, or choose 1080p-SR / 1440p-SR for FlashVSR super-resolution from a 720p source.
Short-form generation: Supports 5s, 10s, and 15s clips.
Optional audio control: Provide an audio URL to guide motion, or disable generated audio for silent output.
Negative prompt support: Add optional constraints to reduce blur, distortion, or unwanted artifacts.

Parameters

Parameter	Required	Description
`model`	Yes	`atlascloud/wan-2.6-spicy/image-to-video`
`prompt`	Yes	Text prompt describing the desired motion.
`image`	Yes	First-frame image URL or Base64 image.
`audio`	No	Audio URL to guide the generated motion.
`negative_prompt`	No	Text describing what to avoid.
`resolution`	Yes	`720p`, `1080p`, `1080p-sr`, or `1440p-sr`. SR modes render a 720p source and apply FlashVSR.
`duration`	No	`5`, `10`, or `15` seconds. Defaults to `5`.
`enable_prompt_expansion`	No	Enable upstream prompt expansion. Defaults to `false`.
`shot_type`	No	`single` or `multi`. Multi-shot mode requires prompt expansion. Defaults to `single`.
`generate_audio`	No	Whether to include generated audio. Defaults to `true`; set `false` for silent output.
`seed`	No	Random seed. `-1` means random.

How To Use

curl -X POST "https://api.atlascloud.ai/api/v1/model/generateVideo" \
  -H "Authorization: Bearer $AIP_API_KEY" \
  -H "Content-Type: application/json" \
  --data-raw '{
    "model": "atlascloud/wan-2.6-spicy/image-to-video",
    "prompt": "The woman turns toward the camera with a confident smile, hair moving naturally as the camera slowly pushes in.",
    "image": "https://static.atlascloud.ai/media/images/db548fe3bd5cafa4ef7e0141d69c8566.jpeg",
    "negative_prompt": "blurry, low quality, distorted hands, extra limbs",
    "duration": 5,
    "resolution": "720p",
    "generate_audio": true,
    "seed": -1
  }'

Pricing

Pricing uses Wan 2.6 Image-to-Video native-resolution multipliers before account or environment discounts. SR tiers are priced at 80% of the equivalent native-resolution price.

Resolution	Multiplier	5s Base Price	10s Base Price	15s Base Price
720p	1.0x	`$0.50`	`$1.00`	`$1.50`
1080p	1.5x	`$0.75`	`$1.50`	`$2.25`
1080p-sr	1.2x	`$0.60`	`$1.20`	`$1.80`
1440p-sr	2.1333x	`$1.0667`	`$2.1333`	`$3.20`

Formula:

sku_base * max(5, duration) * (
  resolution == "1440p-sr" ? 2.1333 :
  (resolution == "1080p-sr" ? 1.2 :
    (resolution == "1080p" || resolution == "1080P" ? 1.5 : 1))
)

sku_base = $0.1000/s for 720p. The runtime then applies the model/account discount configured in that environment.

Notes

This model is allowlist-enabled. Contact AtlasCloud if it is not visible or callable from your account.
480p is not exposed for this model.
This endpoint uses the input image as the first frame of the generated video.
shot_type: "multi" requires enable_prompt_expansion: true.
Native 720p and 1080p call the underlying deployment directly. SR modes first generate a 720p source, then upscale with FlashVSR.
Generation is asynchronous. Poll /api/v1/model/prediction/{request_id} for the final video URL.

Eksploruj Podobne Modele

NEW

obraz-do-wideo

TURBO

Wan-2.2-turbo-spicy Image-to-video Lora

Fast image-to-video generation with custom LoRA support. Powered by Wan 2.2 rCM turbo with high/low noise LoRA injection. Supports 480p, 720p, and 1080p output.

Wan-2.2-turbo-spicy Image-to-video

Fast image-to-video generation powered by Wan 2.2 with rCM turbo acceleration. Supports 480p, 720p, and 1080p (via VSR upscaling) output with 5s or 8s duration.

Wan 2.2 Turbo Image-to-Video

Image-to-video model for fast single-clip generation with stable motion and 30fps workflow post-processing.

Wan 2.2 Turbo Infinite Image-to-Video

Image-to-video model for segmented prompt video generation with stable motion and 30fps workflow post-processing.

Wan 2.2 Turbo Infinite Image-to-Video LoRA

Image-to-video LoRA variant for segmented prompt video generation with stable motion and 30fps workflow post-processing.

Wan 2.2 Turbo Spicy Infinite Image-to-Video

Image-to-video model for segmented prompt video generation with stable motion and 30fps workflow post-processing.

Wan 2.2 Turbo Spicy Infinite Image-to-Video LoRA

Image-to-video LoRA variant for segmented prompt video generation with stable motion and 30fps workflow post-processing.

Video Upscaler

Upscale an existing video to 1080p or 2K while preserving motion, timing, and source composition. 4K support is planned for a later release.

Van-2.6 Text-to-video

A speed-optimized text-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.

Van-2.6 Image-to-video

A speed-optimized image-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.

Wan 2.7 Spicy Image-to-Video

AtlasCloud Wan 2.7 Spicy Image-to-Video turns a first-frame image into short cinematic motion with stable temporal detail and expressive character movement.

Van-2.5 Image-to-video

Get animated visuals from your images faster without major quality sacrifice. Perfect for preview workflows, previews at scale, or mass production of animated assets.

Van-2.5 Text-to-video

Convert prompts into cinematic video clips with synchronized sound. Van 2.5 generates 720p/1080p outputs with stable motion, native audio sync, and prompt-faithful visual storytelling.

HappyHorse-1.1 Reference-to-video

Generates videos from one to nine reference images and a text prompt, supporting 720P or 1080P output, flexible aspect ratios, and durations from 3 to 15 seconds.

From$0.14/SEK

$0.112/SEK

-20%