
Wan 2.6 Spicy Image-to-Video API by Atlas Cloud
AtlasCloud Wan 2.6 Spicy Image-to-Video turns a reference image into a short motion clip with expressive character movement and stable temporal detail.
Wan 2.6Profesjonalne Tworzenie Wideo AI z Wieloma Ujęciami
Najnowszy przełom Alibaba w generowaniu wideo AI. Twórz wideo 1080p do 15 sekund z narracją wieloujęciową, spójnością postaci opartą na referencjach i natywną synchronizacją audiowizualną. Pierwszy model, który prawdziwie rozumie logikę storyboardu dla kinematograficznych narracji.
Rewolucyjne Przełomy
Co czyni Wan 2.6 przełomem w generowaniu wideo AI
Narracja Wieloujęciowa
Pierwszy model rozumiejący logikę storyboardu. Automatycznie generuje sekwencyjne ujęcia ze spójnymi przejściami, zachowując wygląd postaci i spójność środowiska przez zmiany scen—umożliwiając kompletne łuki fabularne w pojedynczej 15-sekundowej generacji.
Referencja do Wideo (R2V)
Prześlij 2-30 sekundowe wideo referencyjne, aby wyodrębnić i zachować wygląd postaci, wzorce ruchu i cechy głosu. Twórz spójne występy postaci w wielu filmach z bezprecedensową dokładnością.
Precyzyjne Renderowanie Tekstu
Wiodące w branży możliwości renderowania tekstu dla opakowań produktów, oznakowania i treści brandowych. Generuj czysty, czytelny tekst w klatkach wideo—niezbędny dla aplikacji marketingowych i komercyjnych.
Główne Możliwości
Wydłużony Czas Trwania 15 Sekund
Generuj do 15 sekund na wideo z kompletną strukturą "Trzech Aktów" (Ekspozycja → Akcja → Rozwiązanie)
Profesjonalna Jakość 1080p
Natywne wyjście 1080p przy 24fps z kinematograficzną jakością i ulepszoną stabilnością wizualną
Natywna Synchronizacja Dźwięku
Dialog pasuje do ruchów warg, muzyka w tle dopasowana do tempa, efekty dźwiękowe wyzwalane perfekcyjnie
Spójność Postaci
Zachowaj wygląd, kostiumy i tożsamość postaci przez ujęcia i wiele filmów
Kinematograficzne Sterowanie Kamerą
Profesjonalne ruchy kamery w tym panoramy, zbliżenia, ujęcia śledzące i ruchy na wózku
Elastyczne Proporcje Obrazu
16:9 (YouTube), 9:16 (Reels), 1:1 (Kwadrat) - zoptymalizowane pod platformy bez kadrowania w postprodukcji
Wan 2.6 vs Wan 2.5: Główne Ulepszenia
Zobacz, co nowego w najnowszej wersji
Trzy Wyspecjalizowane Tryby Generowania
Wybierz odpowiedni tryb dla swojego kreatywnego przepływu pracy
Tekst do Wideo (T2V)
NajpopularniejszyGeneruj kompletne wideo z promptów tekstowych z ulepszoną segmentacją wieloujęciową i udoskonaloną obsługą promptów. Idealny dla storytellingu i eksploracji kreatywnej.
- Automatyczna segmentacja ujęć z jednego promptu
- Rozumienie interakcji wielopostaciowych
- Ruch kamery i wskazówki emocjonalne
- Zachowanie szczegółów środowiska
Obraz do Wideo (I2V)
UlepszonyPrzekształcaj nieruchome obrazy w wideo z ruchem z ulepszoną spójnością ruchu. Idealny dla pokazów produktów, animacji zdjęć i wizualnego storytellingu.
- Precyzyjne renderowanie tekstu dla produktów
- Spójność stylu między klatkami
- Naturalny ruch z nieruchomych obrazów
- Optymalizacja wizualna kierowana narracją
Referencja do Wideo (R2V)
NOWOŚĆPrześlij wideo referencyjne (2-30s), aby zachować wygląd postaci, wzorce ruchu i głos. Najsilniejsza gwarancja spójności dla treści opartych na postaciach.
- Pełne zachowanie tożsamości postaci
- Ekstrakcja cech głosowych
- Replikacja wzorców ruchu
- Sceny interakcji wielu postaci
Idealne Do
Marketing i Reklama
Dema produktów z renderowaniem tekstu, kampanie brandowe ze spójnością postaci i wideo promocyjne
Tworzenie Treści
Filmy YouTube, rolki w mediach społecznościowych, storytelling wieloujęciowy i przepływy pracy montażu wideo
E-commerce
Pokazy produktów z precyzyjnym tekstem, filmy instruktażowe i odtwarzanie opinii klientów
Edukacja i Szkolenia
Treści instruktażowe, materiały kursowe i narracje edukacyjne z wieloma scenami
Rozrywka
Filmy krótkometrażowe, historie oparte na postaciach, sekwencje kinematograficzne i eksperymenty kreatywne
Przewizualizacja
Rozwój koncepcji filmowych, tworzenie storyboardów i planowanie scen dla produkcji
Integracja API Wan 2.6 T2V, I2V i R2V
Kompletny pakiet API do generowania Tekst do Wideo, Obraz do Wideo i Referencja do Wideo
API Tekst do Wideo (T2V API)
Nasze API Wan 2.6 T2V przekształca prompty tekstowe w wieloujęciowe wideo kinematograficzne z automatyczną segmentacją scen. Generuj profesjonalne wideo 1080p do 15 sekund z natywną synchronizacją dźwięku.
API Obraz do Wideo (I2V API)
Nasze API Wan 2.6 I2V ożywia nieruchome obrazy z precyzyjną kontrolą ruchu i renderowaniem tekstu. Idealny dla filmów produktowych, animacji zdjęć i tworzenia treści brandowych.
API Referencja do Wideo (R2V API)
Nasze API Wan 2.6 R2V zachowuje tożsamość postaci z wideo referencyjnych. Prześlij klipy 2-30 sekund, aby wyodrębnić wygląd, głos i wzorce ruchu dla spójnego generowania postaci.
Kompletny Pakiet API
Wszystkie trzy tryby API Wan 2.6 (T2V API, I2V API, R2V API) wspierają architekturę RESTful z kompleksową dokumentacją. Zacznij z SDK dla Python, Node.js i więcej. Każdy endpoint zawiera natywną synchronizację audiowizualną i pełne prawa do użytku komercyjnego.
Jak Zacząć z Wan 2.6
Zacznij tworzyć profesjonalne wideo w kilka minut dzięki dwóm prostym ścieżkom
Integracja API
Dla deweloperów budujących aplikacje
Zarejestruj się i Zaloguj
Utwórz konto Atlas Cloud lub zaloguj się, aby uzyskać dostęp do konsoli
Dodaj Metodę Płatności
Połącz kartę kredytową w sekcji Rozliczenia, aby zasilić konto
Wygeneruj Klucz API
Przejdź do Konsola → Klucze API i utwórz swój klucz uwierzytelniania
Zacznij Budować
Użyj endpointów API T2V, I2V lub R2V, aby zintegrować Wan 2.6 w swojej aplikacji
Doświadczenie Playground
Do szybkich testów i eksperymentów
Zarejestruj się i Zaloguj
Utwórz konto Atlas Cloud lub zaloguj się, aby uzyskać dostęp do platformy
Dodaj Metodę Płatności
Połącz kartę kredytową w sekcji Rozliczenia, aby rozpocząć
Użyj Playground
Przejdź do playground Wan 2.6, wybierz tryb T2V/I2V/R2V i generuj wideo natychmiast
Najczęściej Zadawane Pytania
Co czyni możliwość wieloujęciową Wan 2.6 wyjątkową?
Wan 2.6 to pierwszy model, który prawdziwie rozumie logikę storyboardu. W przeciwieństwie do Wan 2.5, który tworzył chaotyczne efekty "morphingu", Wan 2.6 może automatycznie segmentować pojedynczy prompt na wiele odrębnych ujęć ze spójnymi przejściami, zachowując spójność postaci przez zmiany scen.
Jak działa Referencja do Wideo (R2V)?
Prześlij 2-30 sekundowe wideo referencyjne, a Wan 2.6 wyodrębni wygląd postaci, wzorce ruchu i cechy głosu. Możesz następnie generować nowe wideo z tą samą postacią ze spójną tożsamością—idealne do tworzenia serii treści opartych na postaciach.
Jakie formaty i czasy trwania wideo są obsługiwane?
Wan 2.6 generuje wideo 1080p przy 24fps z czasem trwania od 5 do 15 sekund. Obsługiwane proporcje obrazu obejmują 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) i 1:1 (format kwadratowy), zoptymalizowane dla każdej platformy bez wymagania kadrowania w postprodukcji.
Czy Wan 2.6 może renderować tekst w wideo?
Tak! Wan 2.6 ma wiodące w branży renderowanie tekstu dla opakowań produktów, oznakowania i treści brandowych. Model może generować czysty, czytelny tekst w klatkach wideo—kluczowa funkcja, której brakuje Seedance i większości konkurentów.
Jaka jest różnica między trybami T2V, I2V i R2V?
T2V (Tekst do Wideo) generuje z promptów tekstowych z możliwością wieloujęciową. I2V (Obraz do Wideo) animuje nieruchome obrazy z precyzyjnym renderowaniem tekstu. R2V (Referencja do Wideo) używa referencji wideo, aby zachować tożsamość postaci między generacjami. Wybierz na podstawie typu wejścia i potrzeb spójności.
Czy mam prawa komercyjne do generowanych wideo?
Tak! Każda kreacja Wan 2.6 posiada pełne prawa do użytku komercyjnego. Wideo są gotowe do produkcji w kampaniach marketingowych, materiałach dla klientów, treściach brandowych i zastosowaniach komercyjnych bez dodatkowych wymagań licencyjnych.
Dlaczego Używać Wan 2.6 na Atlas Cloud?
Wykorzystaj infrastrukturę klasy korporacyjnej dla swoich profesjonalnych przepływów pracy generowania wideo
Dedykowana Infrastruktura
Wdróż generowanie wieloujęciowe i możliwości R2V Wan 2.6 na infrastrukturze specjalnie zoptymalizowanej dla wymagających obciążeń wideo AI. Maksymalna wydajność dla generowania 1080p przez 15 sekund.
Zunifikowane API dla Wszystkich Modeli
Dostęp do Wan 2.6 (T2V, I2V, R2V) wraz z ponad 300 modelami AI (LLM, obraz, wideo, audio) przez jedno zunifikowane API. Pojedyncza integracja dla wszystkich potrzeb AI generatywnej ze spójnym uwierzytelnianiem.
Konkurencyjne Ceny
Oszczędzaj do 70% w porównaniu z AWS dzięki przejrzystym cenom pay-as-you-go. Bez ukrytych opłat, bez zobowiązań—skaluj od prototypu do produkcji bez rujnowania budżetu.
Certyfikowane Bezpieczeństwo SOC I & II
Twoje wideo referencyjne i wygenerowane treści chronione certyfikatami SOC I & II i zgodnością HIPAA. Bezpieczeństwo klasy korporacyjnej z zaszyfrowaną transmisją i przechowywaniem.
99,9% SLA Uptime
Niezawodność klasy korporacyjnej z gwarantowanym 99,9% uptime. Twoje generowanie wideo wieloujęciowego Wan 2.6 jest zawsze dostępne dla kampanii produkcyjnych i krytycznych przepływów pracy treści.
Łatwa Integracja
Kompletna integracja w minuty z REST API i wielojęzycznymi SDK (Python, Node.js, Go). Płynnie przełączaj się między trybami T2V, I2V i R2V ze zunifikowaną strukturą endpointów.
Specyfikacje Techniczne
Doświadcz Profesjonalnego Generowania Wideo Wieloujęciowego
Dołącz do twórców treści, marketerów i filmowców na całym świecie, którzy rewolucjonizują produkcję wideo dzięki przełomowym możliwościom storytellingu wieloujęciowego i spójności postaci Wan 2.6.
Wan 2.6 Spicy Image-to-Video
Wan 2.6 Spicy Image-to-Video turns a first-frame image into a short motion clip with expressive character movement and stable temporal detail. This AtlasCloud variant uses a dedicated Wan 2.6 image-to-video LoRA deployment for a more stylized motion profile.
Highlights
- First-frame image-to-video: Use one starting image plus a text prompt to control movement and camera direction.
- 720p, 1080p, and SR output: Use native 720p/1080p, or choose 1080p-SR / 1440p-SR for FlashVSR super-resolution from a 720p source.
- Short-form generation: Supports 5s, 10s, and 15s clips.
- Optional audio control: Provide an audio URL to guide motion, or disable generated audio for silent output.
- Negative prompt support: Add optional constraints to reduce blur, distortion, or unwanted artifacts.
Parameters
| Parameter | Required | Description |
|---|---|---|
model | Yes | atlascloud/wan-2.6-spicy/image-to-video |
prompt | Yes | Text prompt describing the desired motion. |
image | Yes | First-frame image URL or Base64 image. |
audio | No | Audio URL to guide the generated motion. |
negative_prompt | No | Text describing what to avoid. |
resolution | Yes | 720p, 1080p, 1080p-sr, or 1440p-sr. SR modes render a 720p source and apply FlashVSR. |
duration | No | 5, 10, or 15 seconds. Defaults to 5. |
enable_prompt_expansion | No | Enable upstream prompt expansion. Defaults to false. |
shot_type | No | single or multi. Multi-shot mode requires prompt expansion. Defaults to single. |
generate_audio | No | Whether to include generated audio. Defaults to true; set false for silent output. |
seed | No | Random seed. -1 means random. |
How To Use
curl -X POST "https://api.atlascloud.ai/api/v1/model/generateVideo" \ -H "Authorization: Bearer $AIP_API_KEY" \ -H "Content-Type: application/json" \ --data-raw '{ "model": "atlascloud/wan-2.6-spicy/image-to-video", "prompt": "The woman turns toward the camera with a confident smile, hair moving naturally as the camera slowly pushes in.", "image": "https://static.atlascloud.ai/media/images/db548fe3bd5cafa4ef7e0141d69c8566.jpeg", "negative_prompt": "blurry, low quality, distorted hands, extra limbs", "duration": 5, "resolution": "720p", "generate_audio": true, "seed": -1 }'
Pricing
Pricing uses Wan 2.6 Image-to-Video native-resolution multipliers before account or environment discounts. SR tiers are priced at 80% of the equivalent native-resolution price.
| Resolution | Multiplier | 5s Base Price | 10s Base Price | 15s Base Price |
|---|---|---|---|---|
| 720p | 1.0x | $0.50 | $1.00 | $1.50 |
| 1080p | 1.5x | $0.75 | $1.50 | $2.25 |
| 1080p-sr | 1.2x | $0.60 | $1.20 | $1.80 |
| 1440p-sr | 2.1333x | $1.0667 | $2.1333 | $3.20 |
Formula:
sku_base * max(5, duration) * ( resolution == "1440p-sr" ? 2.1333 : (resolution == "1080p-sr" ? 1.2 : (resolution == "1080p" || resolution == "1080P" ? 1.5 : 1)) )
sku_base = $0.1000/s for 720p. The runtime then applies the model/account discount configured in that environment.
Notes
- This model is allowlist-enabled. Contact AtlasCloud if it is not visible or callable from your account.
- 480p is not exposed for this model.
- This endpoint uses the input image as the first frame of the generated video.
shot_type: "multi"requiresenable_prompt_expansion: true.- Native
720pand1080pcall the underlying deployment directly. SR modes first generate a 720p source, then upscale with FlashVSR. - Generation is asynchronous. Poll
/api/v1/model/prediction/{request_id}for the final video URL.


















