alibaba/wan-2.6/image-edit

Supports image editing and mixed text and image output to meet diverse generation and integration needs.

IMAGE-TO-IMAGEHOTNEW
bild-till-bild

Supports image editing and mixed text and image output to meet diverse generation and integration needs.

Alibaba WAN 2.6 Image Edit

Alibaba WAN 2.6 Image Edit enables you to upload an existing visual and specify the desired adjustments. The model preserves layout and subject structure while implementing high-quality updates based on natural language.

Why creators love it

  • Structure-preserving edits: Make lighting, color, or object changes without breaking composition.
  • Text-guided styling: Reimagine materials, moods, or art styles with concise prompts.
  • Prompt expansion on demand: Enable automatic prompt enrichment when you need extra detail.
  • Flexible output sizes: Pick the resolution that best matches your downstream workflow.

Perfect for

  • Marketing and design teams refining campaign visuals.
  • E-commerce sellers upgrading product imagery.
  • Content creators polishing thumbnails, covers, and posts.
  • Artists experimenting with variations of their original work.

Billing rules

  • Minimum charge: 1 image.
  • Total cost = number of images × price per resolution.

How to use

  1. Provide the image you want to refine. (Image dimensions must be in (384, 5000))
  2. Describe the desired adjustments in the prompt.
  3. Choose the target resolution and submit.
  4. Review the enhanced output and download the version you like best.

Pro tips

  • Start with clear instructions about colors, lighting, or objects to adjust.
  • Pair positive and negative prompts to control what should or should not appear.
  • Keep source images at or above your target resolution for optimal fidelity.

Note

If you did not upload the image locally, please ensure that the image URL is accessible! A successfully accessible image will display a preview in the interface.


Aspect RatioExact (W×H)Exact PixelsRounded (W×H, ÷64)Rounded Pixels
1:11448 × 14482,096,7041408 × 14081,982,464
3:21773 × 11822,095,6861728 × 11521,990,656
4:31672 × 12542,096,6881664 × 12162,023,424
16:91936 × 10892,108,3041920 × 10882,088,960
21:92212 × 9482,096,9762176 × 9602,088,960
1:11024 × 10241,048,5761024 × 10241,048,576
3:21254 × 8361,048,3441216 × 8321,011,712
4:31182 × 8871,048,4341152 × 8961,032,192
16:91365 × 7681,048,3201344 × 7681,032,192
21:91564 × 6701,047,8801536 × 640983,040
1:1323 × 323104,329320 × 320102,400
3:2397 × 264104,808384 × 25698,304
4:3374 × 280104,720448 × 320143,360
16:9432 × 243104,976448 × 256114,688
21:9495 × 212104,940576 × 256147,456

Detaljerade Specifikationer

Översikt:

Modellleverantör:QWEN
Modelltyp:image-to-image
Driftsättning:Inferens-API; Playground
Prissättning:$0.021/pic

Nyckelspecifikationer:

Storleksgräns:Max bredd × höjd (användardefinierad)
LoRA-stöd:Nej
Seed-alternativ:N/A

Skapa Ditt Nästa Mästerverk

🎬MULTI-SHOT VIDEOGENERERING

Wan 2.6Professionell Multi-Shot AI-Videoskapande

Alibabas senaste genombrott inom AI-videogenerering. Skapa upp till 15 sekunders 1080p-videor med multi-shot berättande, referensdriven karaktärskonsistens och nativ audiovisuell synkronisering. Den första modellen som verkligen förstår storyboard-logik för filmiska narrativ.

Revolutionerande Genombrott

Vad som gör Wan 2.6 till spelväxlaren inom AI-videogenerering

Multi-Shot Berättande

Första modellen som förstår storyboard-logik. Genererar automatiskt sekventiella tagningar med sammanhängande övergångar, bibehåller karaktärsutseende och miljökonsistens genom scenbyten—möjliggör kompletta handlingsbågar i en enda 15-sekunders generering.

Referens-till-Video (R2V)

Ladda upp en 2-30 sekunders referensvideo för att extrahera och bevara karaktärsutseende, rörelsemönster och röstegenskaper. Skapa konsistenta karaktärsprestationer över flera videor med oöverträffad noggrannhet.

Exakt Textrendering

Branschledande textrenderingsförmåga för produktförpackningar, skyltar och varumärkesinnehåll. Generera tydlig, läsbar text inom videorutor—väsentligt för marknadsförings- och kommersiella tillämpningar.

Kärnfunktioner

Utökad 15-Sekunders Längd

Generera upp till 15 sekunder per video med komplett "Tre Akter"-struktur (Uppställning → Handling → Upplösning)

Professionell 1080p-Kvalitet

Nativ 1080p-utdata vid 24fps med filmisk kvalitet och förbättrad visuell stabilitet

Nativ Ljudsynkronisering

Dialog matchar läpprörelser, bakgrundsmusik anpassas till tempo, ljudeffekter triggas perfekt

Karaktärskonsistens

Bibehåll karaktärsutseende, kostymer och identitet genom tagningar och flera videor

Filmisk Kamerakontroll

Professionella kamerarörelser inklusive panorering, zoom, spårningstagningar och dolly-rörelser

Flexibla Bildförhållanden

16:9 (YouTube), 9:16 (Reels), 1:1 (Kvadrat) - plattformsoptimerad utan efterproduktionsbeskärning

Wan 2.6 vs Wan 2.5: Större Förbättringar

Se vad som är nytt i senaste versionen

Videolängd
Upp till 15 sekunder
Wan 2.5: Max 10 sekunder
Multi-Shot Förmåga
Förstår storyboard-logik
Wan 2.5: Enskild tagning eller rörig morphing
Referensvideostöd
R2V-läge med full bevarande
Wan 2.5: Endast bildreferens
Karaktärskonsistens
Utmärkt mellan tagningar
Wan 2.5: Problem med karaktärsdrift
Rörelsestabilitet
Minskad darr och artefakter
Wan 2.5: Tillfällig ramdrift
Promptförståelse
Komplexa multi-karaktärsscener
Wan 2.5: Grundläggande scengenerering

Tre Specialiserade Genereringslägen

Välj rätt läge för ditt kreativa arbetsflöde

Text-till-Video (T2V)

Mest Populär

Generera kompletta videor från textprompter med förbättrad multi-shot segmentering och förbättrad prompthantering. Perfekt för berättande och kreativ utforskning.

  • Automatisk tagningssegmentering från enskild prompt
  • Multi-karaktär interaktionsförståelse
  • Kamerarörelse och emotionella ledtrådar
  • Bevarande av miljödetaljer

Bild-till-Video (I2V)

Förbättrad

Omvandla stillbilder till rörliga videor med förbättrad rörelsekoherens. Idealisk för produktvisningar, fotoanimering och visuellt berättande.

  • Exakt textrendering för produkter
  • Stilkonsistens över ramar
  • Naturlig rörelse från stillbilder
  • Narrativdriven visuell optimering

Referens-till-Video (R2V)

NYT

Ladda upp en referensvideo (2-30s) för att bevara karaktärsutseende, rörelsemönster och röst. Starkaste konsistensgaranti för karaktärsdriven innehåll.

  • Fullständig bevarande av karaktärsidentitet
  • Extraktion av röstegenskaper
  • Replikering av rörelsemönster
  • Multi-karaktär samspelsscener

Perfekt För

Marknadsföring & Reklam

Produktdemos med textrendering, varumärkeskampanjer med karaktärskonsistens och reklamvideor

Innehållsskapande

YouTube-videor, sociala medier-reels, multi-shot berättande och videoredigeringsarbetsflöden

E-handel

Produktvisningar med exakt text, handledningsvideor och återskapande av kundrecensioner

Utbildning & Träning

Instruktionsinnehåll, kursmaterial och multi-scen utbildningsnarrativ

Underhållning

Kortfilmer, karaktärsdrivna berättelser, filmiska sekvenser och kreativa experiment

Förvisualisering

Filmkonceptutveckling, storyboard-skapande och scenplanering för produktioner

Wan 2.6 T2V, I2V och R2V API-Integration

Komplett API-svit för Text-till-Video, Bild-till-Video och Referens-till-Video generering

Text-till-Video API (T2V API)

Vår Wan 2.6 T2V API omvandlar textprompter till multi-shot filmiska videor med automatisk scensegmentering. Generera professionella 1080p-videor upp till 15 sekunder med nativ ljudsynkronisering.

Multi-shot berättande från enskild prompt
15-sekunders längd med Tre Akter-struktur
Förbättrad promptförståelse för komplexa scener
Flexibla bildförhållanden: 16:9, 9:16, 1:1

Bild-till-Video API (I2V API)

Vår Wan 2.6 I2V API ger liv åt stillbilder med exakt rörelsekontroll och textrendering. Perfekt för produktvideor, fotoanimering och varumärkesinnehållsskapande.

Exakt textrendering för produkter och skyltar
Stilkonsistens i animationsramar
Naturlig rörelse med förbättrad koherens
Narrativoptimerad visuell utdata

Referens-till-Video API (R2V API)

Vår Wan 2.6 R2V API bevarar karaktärsidentitet från referensvideor. Ladda upp 2-30 sekunders klipp för att extrahera utseende, röst och rörelsemönster för konsekvent karaktärsgenerering.

Bevarande av karaktärsutseende och identitet
Extraktion och replikering av röstegenskaper
Analys och reproduktion av rörelsemönster
Stöd för multi-karaktärsscener
💡

Komplett API-Svit

Alla tre Wan 2.6 API-lägena (T2V API, I2V API, R2V API) stöder RESTful-arkitektur med omfattande dokumentation. Kom igång med SDK:er för Python, Node.js och mer. Varje endpoint inkluderar nativ audiovisuell synkronisering och fullständiga kommersiella användningsrättigheter.

Hur Man Kommer Igång med Wan 2.6

Börja skapa professionella videor på minuter med två enkla vägar

API-Integration

För utvecklare som bygger applikationer

1

Registrera & Logga In

Skapa ditt Atlas Cloud-konto eller logga in för att få åtkomst till konsolen

2

Lägg Till Betalningsmetod

Bind ditt kreditkort i Faktureringssektionen för att finansiera ditt konto

3

Generera API-Nyckel

Navigera till Konsol → API-Nycklar och skapa din autentiseringsnyckel

4

Börja Bygga

Använd T2V, I2V eller R2V API-endpoints för att integrera Wan 2.6 i din applikation

Playground-Upplevelse

För snabb testning och experiment

1

Registrera & Logga In

Skapa ditt Atlas Cloud-konto eller logga in för att få åtkomst till plattformen

2

Lägg Till Betalningsmetod

Bind ditt kreditkort i Faktureringssektionen för att komma igång

3

Använd Playground

Gå till Wan 2.6 playground, välj T2V/I2V/R2V-läge och generera videor direkt

💡
Professionellt Tips: Testa olika genereringslägen i Playground först för att förstå vilket som fungerar bäst för ditt användningsfall, integrera sedan motsvarande API för produktionsskala.

Vanliga Frågor

Vad gör Wan 2.6:s multi-shot förmåga unik?

Wan 2.6 är den första modellen som verkligen förstår storyboard-logik. Till skillnad från Wan 2.5 som skapade röriga "morphing"-effekter, kan Wan 2.6 automatiskt segmentera en enskild prompt i flera distinkta tagningar med sammanhängande övergångar, bibehålla karaktärskonsistens genom scenbyten.

Hur fungerar Referens-till-Video (R2V)?

Ladda upp en 2-30 sekunders referensvideo, och Wan 2.6 extraherar karaktärens utseende, rörelsemönster och röstegenskaper. Du kan sedan generera nya videor med samma karaktär med konsekvent identitet—idealiskt för att skapa karaktärsdrivna innehållsserier.

Vilka videoformat och längder stöds?

Wan 2.6 genererar 1080p-videor vid 24fps med längder från 5 till 15 sekunder. Stödda bildförhållanden inkluderar 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) och 1:1 (kvadratiskt format), optimerade för varje plattform utan att kräva efterproduktionsbeskärning.

Kan Wan 2.6 rendera text i videor?

Ja! Wan 2.6 har branschledande textrendering för produktförpackningar, skyltar och varumärkesinnehåll. Modellen kan generera tydlig, läsbar text inom videoramar—en kritisk funktion som Seedance och de flesta konkurrenter saknar.

Vad är skillnaden mellan T2V, I2V och R2V-lägena?

T2V (Text-till-Video) genererar från textprompter med multi-shot förmåga. I2V (Bild-till-Video) animerar stillbilder med exakt textrendering. R2V (Referens-till-Video) använder videoreferenser för att bevara karaktärsidentitet över genereringar. Välj baserat på din inputtyp och konsistensbehov.

Har jag kommersiella rättigheter till genererade videor?

Ja! Varje Wan 2.6-skapelse kommer med fullständiga kommersiella användningsrättigheter. Videor är produktionsklara för marknadsföringskampanjer, kundleveranser, varumärkesinnehåll och kommersiella tillämpningar utan ytterligare licensieringskrav.

Varför Använda Wan 2.6 på Atlas Cloud?

Utnyttja företagsinfrastruktur för dina professionella videogenereringsarbetsflöden

Ändamålsbyggd Infrastruktur

Distribuera Wan 2.6:s multi-shot generering och R2V-förmågor på infrastruktur specifikt optimerad för krävande AI-videoarbetsbelastningar. Maximal prestanda för 1080p 15-sekunders generering.

Enhetlig API för Alla Modeller

Få åtkomst till Wan 2.6 (T2V, I2V, R2V) tillsammans med 300+ AI-modeller (LLM:er, bild, video, ljud) genom ett enhetligt API. Enskild integration för alla dina generativa AI-behov med konsekvent autentisering.

Konkurrenskraftiga Priser

Spara upp till 70% jämfört med AWS med transparent pay-as-you-go-prissättning. Inga dolda avgifter, inga åtaganden—skala från prototyp till produktion utan att spräcka budgeten.

SOC I & II Certifierad Säkerhet

Dina referensvideor och genererat innehåll skyddas med SOC I & II-certifieringar och HIPAA-efterlevnad. Företagssäkerhet med krypterad överföring och lagring.

99,9% Drifttid SLA

Företagstillförlitlighet med garanterad 99,9% drifttid. Din Wan 2.6 multi-shot videogenerering är alltid tillgänglig för produktionskampanjer och kritiska innehållsarbetsflöden.

Enkel Integration

Komplett integration på minuter med REST API och flerspråkiga SDK:er (Python, Node.js, Go). Växla sömlöst mellan T2V, I2V och R2V-lägen med enhetlig endpoint-struktur.

99.9%
Drifttid
70%
Lägre Kostnad vs AWS
300+
Gen AI Modeller
24/7
Pro Support

Tekniska Specifikationer

Architecture
Avancerad Transformer med Multi-Modal Förståelse
Resolution
1080p (Full HD)
Frame Rate
24 FPS
Duration
5-15 sekunder (lägesberoende)
Aspect Ratios
16:9, 9:16, 1:1
Generation Modes
T2V, I2V, R2V
Audio
Nativ synkronisering med lip-sync
Commercial Rights
Full kommersiell användning inkluderad

Upplev Professionell Multi-Shot Videogenerering

Anslut till innehållsskapare, marknadsförare och filmskapare över hela världen som revolutionerar videoproduktion med Wan 2.6:s banbrytande multi-shot berättande och karaktärskonsistensförmågor.

Börja från 300+ Modeller,

Endast på Atlas Cloud.