alibaba/wan-2.6/image-edit

Supports image editing and mixed text and image output to meet diverse generation and integration needs.

IMAGE-TO-IMAGEHOTNEW
Bild-zu-Bild

Supports image editing and mixed text and image output to meet diverse generation and integration needs.

Alibaba WAN 2.6 Image Edit

Alibaba WAN 2.6 Image Edit enables you to upload an existing visual and specify the desired adjustments. The model preserves layout and subject structure while implementing high-quality updates based on natural language.

Why creators love it

  • Structure-preserving edits: Make lighting, color, or object changes without breaking composition.
  • Text-guided styling: Reimagine materials, moods, or art styles with concise prompts.
  • Prompt expansion on demand: Enable automatic prompt enrichment when you need extra detail.
  • Flexible output sizes: Pick the resolution that best matches your downstream workflow.

Perfect for

  • Marketing and design teams refining campaign visuals.
  • E-commerce sellers upgrading product imagery.
  • Content creators polishing thumbnails, covers, and posts.
  • Artists experimenting with variations of their original work.

Billing rules

  • Minimum charge: 1 image.
  • Total cost = number of images × price per resolution.

How to use

  1. Provide the image you want to refine. (Image dimensions must be in (384, 5000))
  2. Describe the desired adjustments in the prompt.
  3. Choose the target resolution and submit.
  4. Review the enhanced output and download the version you like best.

Pro tips

  • Start with clear instructions about colors, lighting, or objects to adjust.
  • Pair positive and negative prompts to control what should or should not appear.
  • Keep source images at or above your target resolution for optimal fidelity.

Note

If you did not upload the image locally, please ensure that the image URL is accessible! A successfully accessible image will display a preview in the interface.


Aspect RatioExact (W×H)Exact PixelsRounded (W×H, ÷64)Rounded Pixels
1:11448 × 14482,096,7041408 × 14081,982,464
3:21773 × 11822,095,6861728 × 11521,990,656
4:31672 × 12542,096,6881664 × 12162,023,424
16:91936 × 10892,108,3041920 × 10882,088,960
21:92212 × 9482,096,9762176 × 9602,088,960
1:11024 × 10241,048,5761024 × 10241,048,576
3:21254 × 8361,048,3441216 × 8321,011,712
4:31182 × 8871,048,4341152 × 8961,032,192
16:91365 × 7681,048,3201344 × 7681,032,192
21:91564 × 6701,047,8801536 × 640983,040
1:1323 × 323104,329320 × 320102,400
3:2397 × 264104,808384 × 25698,304
4:3374 × 280104,720448 × 320143,360
16:9432 × 243104,976448 × 256114,688
21:9495 × 212104,940576 × 256147,456

Detaillierte Spezifikationen

Übersicht:

Modellanbieter:QWEN
Modelltyp:image-to-image
Bereitstellung:Inferenz-API; Playground
Preisgestaltung:$0.021/pic

Hauptspezifikationen:

Größenlimit:Max. Breite × Höhe (benutzerdefiniert)
LoRA-Unterstützung:Nein
Seed-Optionen:N/A

Erstellen Sie Ihr Nächstes Meisterwerk

🎬MULTI-SHOT-VIDEOGENERIERUNG

Wan 2.6Professionelle Multi-Shot AI-Videoerstellung

Alibabas neuester Durchbruch in der KI-Videogenerierung. Erstellen Sie bis zu 15-sekündige 1080p-Videos mit Multi-Shot-Storytelling, referenzgesteuerter Charakterkonsistenz und nativer audiovisueller Synchronisation. Das erste Modell, das die Storyboard-Logik für filmische Narrative wirklich versteht.

Revolutionäre Durchbrüche

Was Wan 2.6 zum Game-Changer in der KI-Videogenerierung macht

Multi-Shot-Storytelling

Erstes Modell, das Storyboard-Logik versteht. Generiert automatisch sequenzielle Einstellungen mit kohärenten Übergängen und bewahrt dabei Charakteraussehen und Umgebungskonsistenz über Szenenwechsel hinweg—ermöglicht vollständige Handlungsbögen in einer einzigen 15-Sekunden-Generierung.

Referenz-zu-Video (R2V)

Laden Sie ein 2-30 Sekunden langes Referenzvideo hoch, um Charakteraussehen, Bewegungsmuster und Stimmcharakteristiken zu extrahieren und zu bewahren. Erstellen Sie konsistente Charakterdarstellungen über mehrere Videos hinweg mit beispielloser Genauigkeit.

Präzises Text-Rendering

Branchenführende Text-Rendering-Fähigkeiten für Produktverpackungen, Beschilderung und Markeninhalte. Generiert klaren, lesbaren Text innerhalb von Videoframes—unverzichtbar für Marketing- und kommerzielle Anwendungen.

Kernfähigkeiten

Erweiterte 15-Sekunden-Dauer

Generieren Sie bis zu 15 Sekunden pro Video mit vollständiger "Drei-Akt"-Struktur (Aufbau → Aktion → Auflösung)

Professionelle 1080p-Qualität

Native 1080p-Ausgabe bei 24fps mit filmischer Qualität und verbesserter visueller Stabilität

Native Audio-Synchronisation

Dialog passt zu Lippenbewegungen, Hintergrundmusik passt zum Tempo, Soundeffekte werden perfekt ausgelöst

Charakterkonsistenz

Behalten Sie Charakteraussehen, Kostüme und Identität über Einstellungen und mehrere Videos hinweg bei

Filmische Kamerakontrolle

Professionelle Kamerabewegungen einschließlich Schwenks, Zooms, Tracking-Shots und Dolly-Bewegungen

Flexible Seitenverhältnisse

16:9 (YouTube), 9:16 (Reels), 1:1 (Quadrat) - plattformoptimiert ohne Postproduktions-Cropping

Wan 2.6 vs Wan 2.5: Wesentliche Verbesserungen

Sehen Sie, was im neuesten Release neu ist

Videodauer
Bis zu 15 Sekunden
Wan 2.5: Maximum 10 Sekunden
Multi-Shot-Fähigkeit
Versteht Storyboard-Logik
Wan 2.5: Einzeleinstellung oder chaotisches Morphing
Referenzvideo-Unterstützung
R2V-Modus mit vollständiger Bewahrung
Wan 2.5: Nur Bildreferenz
Charakterkonsistenz
Hervorragend über Einstellungen hinweg
Wan 2.5: Charakterdrift-Probleme
Bewegungsstabilität
Reduziertes Jittern und Artefakte
Wan 2.5: Gelegentliche Frame-Drift
Prompt-Verständnis
Komplexe Multi-Charakter-Szenen
Wan 2.5: Grundlegende Szenengenerierung

Drei Spezialisierte Generierungsmodi

Wählen Sie den richtigen Modus für Ihren kreativen Workflow

Text-zu-Video (T2V)

Am Beliebtesten

Generieren Sie vollständige Videos aus Text-Prompts mit verbesserter Multi-Shot-Segmentierung und verbessertem Prompt-Handling. Perfekt für Storytelling und kreative Erkundung.

  • Automatische Shot-Segmentierung aus einem einzigen Prompt
  • Multi-Charakter-Interaktionsverständnis
  • Kamerabewegung und emotionale Hinweise
  • Umgebungsdetail-Bewahrung

Bild-zu-Video (I2V)

Verbessert

Verwandeln Sie Standbilder in Bewegungsvideos mit verbesserter Bewegungskohärenz. Ideal für Produktpräsentationen, Fotoanimation und visuelles Storytelling.

  • Präzises Text-Rendering für Produkte
  • Stilkonsistenz über Frames hinweg
  • Natürliche Bewegung aus Standbildern
  • Narrativ-gesteuerte visuelle Optimierung

Referenz-zu-Video (R2V)

NEU

Laden Sie ein Referenzvideo (2-30s) hoch, um Charakteraussehen, Bewegungsmuster und Stimme zu bewahren. Stärkste Konsistenzgarantie für charaktergetriebene Inhalte.

  • Vollständige Charakteridentitäts-Bewahrung
  • Stimmcharakteristik-Extraktion
  • Bewegungsmuster-Replikation
  • Multi-Charakter-Co-Acting-Szenen

Perfekt Für

Marketing & Werbung

Produktdemos mit Text-Rendering, Markenkampagnen mit Charakterkonsistenz und Werbevideos

Content-Erstellung

YouTube-Videos, Social-Media-Reels, Multi-Shot-Storytelling und Video-Editing-Workflows

E-Commerce

Produktpräsentationen mit präzisem Text, Tutorial-Videos und Kundenreferenz-Nachstellung

Bildung & Training

Lehrinhalte, Kursmaterialien und Multi-Szenen-Bildungsnarrative

Unterhaltung

Kurzfilme, charaktergetriebene Geschichten, filmische Sequenzen und kreative Experimente

Previsualisierung

Filmkonzeptentwicklung, Storyboard-Erstellung und Szenenplanung für Produktionen

Wan 2.6 T2V, I2V und R2V API-Integration

Vollständige API-Suite für Text-zu-Video-, Bild-zu-Video- und Referenz-zu-Video-Generierung

Text-zu-Video API (T2V API)

Unsere Wan 2.6 T2V API verwandelt Text-Prompts in Multi-Shot-Filmvideos mit automatischer Szenensegmentierung. Generieren Sie professionelle 1080p-Videos bis zu 15 Sekunden mit nativer Audio-Synchronisation.

Multi-Shot-Storytelling aus einem einzigen Prompt
15-Sekunden-Dauer mit Drei-Akt-Struktur
Verbessertes Prompt-Verständnis für komplexe Szenen
Flexible Seitenverhältnisse: 16:9, 9:16, 1:1

Bild-zu-Video API (I2V API)

Unsere Wan 2.6 I2V API erweckt Standbilder mit präziser Bewegungskontrolle und Text-Rendering zum Leben. Perfekt für Produktvideos, Fotoanimation und Markeninhalts-Erstellung.

Präzises Text-Rendering für Produkte und Beschilderung
Stilkonsistenz über Animationsframes hinweg
Natürliche Bewegung mit verbesserter Kohärenz
Narrativ-optimierte visuelle Ausgabe

Referenz-zu-Video API (R2V API)

Unsere Wan 2.6 R2V API bewahrt Charakteridentität aus Referenzvideos. Laden Sie 2-30 Sekunden lange Clips hoch, um Aussehen, Stimme und Bewegungsmuster für konsistente Charaktergenerierung zu extrahieren.

Charakteraussehen und Identitäts-Bewahrung
Stimmcharakteristik-Extraktion und Replikation
Bewegungsmuster-Analyse und Reproduktion
Multi-Charakter-Szenen-Unterstützung
💡

Vollständige API-Suite

Alle drei Wan 2.6 API-Modi (T2V API, I2V API, R2V API) unterstützen RESTful-Architektur mit umfassender Dokumentation. Starten Sie mit SDKs für Python, Node.js und mehr. Jeder Endpoint umfasst native audiovisuelle Synchronisation und vollständige kommerzielle Nutzungsrechte.

Wie Sie mit Wan 2.6 Beginnen

Beginnen Sie in Minuten mit der Erstellung professioneller Videos über zwei einfache Wege

API-Integration

Für Entwickler, die Anwendungen erstellen

1

Registrieren & Anmelden

Erstellen Sie Ihr Atlas Cloud-Konto oder melden Sie sich an, um auf die Konsole zuzugreifen

2

Zahlungsmethode Hinzufügen

Verknüpfen Sie Ihre Kreditkarte im Abrechnungsbereich, um Ihr Konto aufzuladen

3

API-Schlüssel Generieren

Navigieren Sie zu Konsole → API-Schlüssel und erstellen Sie Ihren Authentifizierungsschlüssel

4

Mit dem Aufbau Beginnen

Verwenden Sie T2V-, I2V- oder R2V-API-Endpoints, um Wan 2.6 in Ihre Anwendung zu integrieren

Playground-Erfahrung

Für schnelle Tests und Experimente

1

Registrieren & Anmelden

Erstellen Sie Ihr Atlas Cloud-Konto oder melden Sie sich an, um auf die Plattform zuzugreifen

2

Zahlungsmethode Hinzufügen

Verknüpfen Sie Ihre Kreditkarte im Abrechnungsbereich, um zu starten

3

Playground Verwenden

Gehen Sie zum Wan 2.6 Playground, wählen Sie T2V/I2V/R2V-Modus und generieren Sie sofort Videos

💡
Profi-Tipp: Testen Sie zuerst verschiedene Generierungsmodi im Playground, um zu verstehen, welcher für Ihren Anwendungsfall am besten funktioniert, und integrieren Sie dann die entsprechende API für Produktionsskalierung.

Häufig Gestellte Fragen

Was macht die Multi-Shot-Fähigkeit von Wan 2.6 einzigartig?

Wan 2.6 ist das erste Modell, das Storyboard-Logik wirklich versteht. Im Gegensatz zu Wan 2.5, das chaotische "Morphing"-Effekte erzeugte, kann Wan 2.6 automatisch einen einzigen Prompt in mehrere distinkte Einstellungen mit kohärenten Übergängen segmentieren und dabei die Charakterkonsistenz über Szenenwechsel hinweg bewahren.

Wie funktioniert Referenz-zu-Video (R2V)?

Laden Sie ein 2-30 Sekunden langes Referenzvideo hoch, und Wan 2.6 extrahiert Charakteraussehen, Bewegungsmuster und Stimmcharakteristiken. Sie können dann neue Videos mit demselben Charakter mit konsistenter Identität generieren—ideal für die Erstellung charaktergetriebener Inhaltsserien.

Welche Videoformate und -dauern werden unterstützt?

Wan 2.6 generiert 1080p-Videos bei 24fps mit Dauern von 5 bis 15 Sekunden. Unterstützte Seitenverhältnisse umfassen 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) und 1:1 (quadratisches Format), optimiert für jede Plattform ohne Postproduktions-Cropping.

Kann Wan 2.6 Text in Videos rendern?

Ja! Wan 2.6 verfügt über branchenführendes Text-Rendering für Produktverpackungen, Beschilderung und Markeninhalte. Das Modell kann klaren, lesbaren Text innerhalb von Videoframes generieren—ein kritisches Feature, das Seedance und den meisten Wettbewerbern fehlt.

Was ist der Unterschied zwischen T2V-, I2V- und R2V-Modi?

T2V (Text-zu-Video) generiert aus Text-Prompts mit Multi-Shot-Fähigkeit. I2V (Bild-zu-Video) animiert Standbilder mit präzisem Text-Rendering. R2V (Referenz-zu-Video) verwendet Videoreferenzen, um Charakteridentität über Generierungen hinweg zu bewahren. Wählen Sie basierend auf Ihrem Eingabetyp und Konsistenzbedarf.

Habe ich kommerzielle Rechte an generierten Videos?

Ja! Jede Wan 2.6-Kreation kommt mit vollständigen kommerziellen Nutzungsrechten. Videos sind produktionsbereit für Marketingkampagnen, Kundenlieferungen, Markeninhalte und kommerzielle Anwendungen ohne zusätzliche Lizenzanforderungen.

Warum Wan 2.6 auf Atlas Cloud Verwenden?

Nutzen Sie Enterprise-Grade-Infrastruktur für Ihre professionellen Videogenerierungs-Workflows

Zweckgebaute Infrastruktur

Deployen Sie Wan 2.6s Multi-Shot-Generierung und R2V-Fähigkeiten auf speziell für anspruchsvolle KI-Video-Workloads optimierter Infrastruktur. Maximale Performance für 1080p 15-Sekunden-Generierung.

Einheitliche API für Alle Modelle

Greifen Sie auf Wan 2.6 (T2V, I2V, R2V) neben 300+ KI-Modellen (LLMs, Bild, Video, Audio) über eine einheitliche API zu. Einzelintegration für alle Ihre generativen KI-Bedürfnisse mit konsistenter Authentifizierung.

Wettbewerbsfähige Preise

Sparen Sie bis zu 70% im Vergleich zu AWS mit transparenter Pay-as-you-go-Preisgestaltung. Keine versteckten Gebühren, keine Verpflichtungen—skalieren Sie vom Prototyp zur Produktion, ohne die Bank zu sprengen.

SOC I & II Zertifizierte Sicherheit

Ihre Referenzvideos und generierte Inhalte geschützt mit SOC I & II-Zertifizierungen und HIPAA-Compliance. Enterprise-Grade-Sicherheit mit verschlüsselter Übertragung und Speicherung.

99,9% Uptime SLA

Enterprise-Grade-Zuverlässigkeit mit garantierter 99,9% Uptime. Ihre Wan 2.6 Multi-Shot-Videogenerierung ist immer verfügbar für Produktionskampagnen und kritische Content-Workflows.

Einfache Integration

Vollständige Integration in Minuten mit REST API und mehrsprachigen SDKs (Python, Node.js, Go). Wechseln Sie nahtlos zwischen T2V-, I2V- und R2V-Modi mit einheitlicher Endpoint-Struktur.

99.9%
Uptime
70%
Geringere Kosten vs AWS
300+
Gen AI Modelle
24/7
Pro-Support

Technische Spezifikationen

Architecture
Fortgeschrittener Transformer mit Multi-Modal-Verständnis
Resolution
1080p (Full HD)
Frame Rate
24 FPS
Duration
5-15 Sekunden (modusabhängig)
Aspect Ratios
16:9, 9:16, 1:1
Generation Modes
T2V, I2V, R2V
Audio
Native Synchronisation mit Lip-Sync
Commercial Rights
Vollständige kommerzielle Nutzung enthalten

Erleben Sie Professionelle Multi-Shot-Videogenerierung

Schließen Sie sich Content-Erstellern, Marketern und Filmemachern weltweit an, die mit Wan 2.6s bahnbrechenden Multi-Shot-Storytelling- und Charakterkonsistenz-Fähigkeiten die Videoproduktion revolutionieren.

Beginnen Sie mit 300+ Modellen,

Nur auf Atlas Cloud.