alibaba/wan-2.6/image-edit

Bild-zu-Bild

Wan 2.6 Image-to-Image API by Alibaba

alibaba/wan-2.6/image-edit

Image-edit

Supports image editing and mixed text and image output to meet diverse generation and integration needs.

Eingabe

Parameterkonfiguration wird geladen...

Ausgabe

Inaktiv

Ihre generierten Bilder erscheinen hier

Konfigurieren Sie Parameter und klicken Sie auf Ausführen, um mit der Generierung zu beginnen

Jede Ausführung kostet $0.021. Für $10 können Sie ca. 476 Mal ausführen.

Sie können fortfahren mit:

Bild zu Video Bild zu Bild

Parameter

Codebeispiel
import requests
import time

# Step 1: Start image generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "alibaba/wan-2.6/image-edit",
    "prompt": "A beautiful landscape with mountains and lake",
    "width": 512,
    "height": 512,
    "steps": 20,
    "guidance_scale": 7.5,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] == "completed":
            print("Generated image:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

image_url = check_status()

Installieren

Installieren Sie das erforderliche Paket für Ihre Programmiersprache.

pip install requests

Authentifizierung

Alle API-Anfragen erfordern eine Authentifizierung über einen API-Schlüssel. Sie können Ihren API-Schlüssel über das Atlas Cloud Dashboard erhalten.

export ATLASCLOUD_API_KEY="your-api-key-here"

HTTP-Header

import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}

Schützen Sie Ihren API-Schlüssel

Geben Sie Ihren API-Schlüssel niemals in clientseitigem Code oder öffentlichen Repositories preis. Verwenden Sie stattdessen Umgebungsvariablen oder einen Backend-Proxy.

Anfrage senden

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Anfrage senden

Senden Sie eine asynchrone Generierungsanfrage. Die API gibt eine Vorhersage-ID zurück, mit der Sie den Status prüfen und das Ergebnis abrufen können.

POST/api/v1/model/generateImage

Anfragekörper

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "alibaba/wan-2.6/image-edit",
    "prompt": "A beautiful landscape with mountains and lake"
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['data']['id']}")
print(f"Status: {result['data']['status']}")

Antwort

{
  "code": 200,
  "data": {
    "id": "pred_abc123",
    "status": "processing",
    "model": "model-name",
    "created_at": "2025-01-01T00:00:00Z"
  }
}

Status prüfen

Fragen Sie den Vorhersage-Endpunkt ab, um den aktuellen Status Ihrer Anfrage zu überprüfen.

GET/api/v1/model/prediction/{prediction_id}

Abfrage-Beispiel

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

Statuswerte

processingDie Anfrage wird noch verarbeitet.

completedDie Generierung ist abgeschlossen. Ergebnisse sind verfügbar.

succeededDie Generierung war erfolgreich. Ergebnisse sind verfügbar.

failedDie Generierung ist fehlgeschlagen. Überprüfen Sie das Fehlerfeld.

Abgeschlossene Antwort

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.png"
    ],
    "metrics": {
      "predict_time": 8.3
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

Dateien hochladen

Laden Sie Dateien in den Atlas Cloud Speicher hoch und erhalten Sie eine URL, die Sie in Ihren API-Anfragen verwenden können. Verwenden Sie multipart/form-data zum Hochladen.

POST/api/v1/model/uploadMedia

Upload-Beispiel

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

Antwort

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

Eingabe-Schema

Die folgenden Parameter werden im Anfragekörper akzeptiert.

Gesamt: 0Erforderlich: 0Optional: 0

Keine Parameter verfügbar.

Beispiel-Anfragekörper

{
  "model": "alibaba/wan-2.6/image-edit"
}

Ausgabe-Schema

Die API gibt eine Vorhersage-Antwort mit den generierten Ausgabe-URLs zurück.

idstringrequired

Unique identifier for the prediction.

statusstringrequired

Current status of the prediction.

processingcompletedsucceededfailed

modelstringrequired

The model used for generation.

outputsarray[string]

Array of output URLs. Available when status is "completed".

errorstring

Error message if status is "failed".

metricsobject

Performance metrics.

predict_timenumber

Time taken for image generation in seconds.

created_atstringrequired

ISO 8601 timestamp when the prediction was created.

Format: date-time

completed_atstring

ISO 8601 timestamp when the prediction was completed.

Format: date-time

Beispielantwort

{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.png"
  ],
  "metrics": {
    "predict_time": 8.3
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills integriert über 300 KI-Modelle direkt in Ihren KI-Programmierassistenten. Ein Befehl zur Installation, dann generieren Sie per natürlicher Sprache Bilder und Videos und chatten mit LLMs.

Unterstützte Clients

Claude Code

OpenAI Codex

Gemini CLI

Cursor

Windsurf

VS Code

Trae

GitHub Copilot

Cline

Roo Code

Amp

Goose

Replit

40+ unterstützte clients

Installieren

npx skills add AtlasCloudAI/atlas-cloud-skills

API-Schlüssel einrichten

Erhalten Sie Ihren API-Schlüssel über das Atlas Cloud Dashboard und setzen Sie ihn als Umgebungsvariable.

export ATLASCLOUD_API_KEY="your-api-key-here"

Funktionen

Nach der Installation können Sie natürliche Sprache in Ihrem KI-Assistenten verwenden, um auf alle Atlas Cloud Modelle zuzugreifen.

BildgenerierungGenerieren Sie Bilder mit Modellen wie Nano Banana 2, Z-Image und mehr.

VideoerstellungErstellen Sie Videos aus Text oder Bildern mit Kling, Vidu, Veo usw.

LLM-ChatChatten Sie mit Qwen, DeepSeek und anderen großen Sprachmodellen.

Medien-UploadLaden Sie lokale Dateien für Bildbearbeitung und Bild-zu-Video-Workflows hoch.

Mehr erfahren

github.com/AtlasCloudAI/atlas-cloud-skills

MCP-Server

Der Atlas Cloud MCP-Server verbindet Ihre IDE mit über 300 KI-Modellen über das Model Context Protocol. Funktioniert mit jedem MCP-kompatiblen Client.

Unterstützte Clients

Cursor

VS Code

Windsurf

Claude Code

OpenAI Codex

Gemini CLI

Cline

Roo Code

100+ unterstützte clients

Installieren

npx -y atlascloud-mcp

Konfiguration

Fügen Sie die folgende Konfiguration zur MCP-Einstellungsdatei Ihrer IDE hinzu.

{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

Verfügbare Werkzeuge

atlas_generate_imageGenerieren Sie Bilder aus Textbeschreibungen.

atlas_generate_videoErstellen Sie Videos aus Text oder Bildern.

atlas_chatChatten Sie mit großen Sprachmodellen.

atlas_list_modelsDurchsuchen Sie über 300 verfügbare KI-Modelle.

atlas_quick_generateInhaltserstellung in einem Schritt mit automatischer Modellauswahl.

atlas_upload_mediaLaden Sie lokale Dateien für API-Workflows hoch.

Mehr erfahren

github.com/AtlasCloudAI/mcp-server

API-Schema

Schema nicht verfügbar

Keine Beispiele verfügbar

Wird geladen...

🎬MULTI-SHOT-VIDEOGENERIERUNG

Wan 2.6Professionelle Multi-Shot KI-Videoerstellung

Alibabas neuester Durchbruch in der KI-Videogenerierung. Erstellen Sie bis zu 15-sekündige 1080p-Videos mit Multi-Shot-Storytelling, referenzgesteuerter Charakterkonsistenz und nativer audiovisueller Synchronisation. Das erste Modell, das die Storyboard-Logik für filmische Narrative wirklich versteht.

Revolutionäre Durchbrüche

Was Wan 2.6 zum Game-Changer in der KI-Videogenerierung macht

Multi-Shot-Storytelling

Erstes Modell, das Storyboard-Logik versteht. Generiert automatisch sequenzielle Einstellungen mit kohärenten Übergängen und bewahrt dabei Charakteraussehen und Umgebungskonsistenz über Szenenwechsel hinweg—ermöglicht vollständige Handlungsbögen in einer einzigen 15-Sekunden-Generierung.

Referenz-zu-Video (R2V)

Laden Sie ein 2-30 Sekunden langes Referenzvideo hoch, um Charakteraussehen, Bewegungsmuster und Stimmcharakteristiken zu extrahieren und zu bewahren. Erstellen Sie konsistente Charakterdarstellungen über mehrere Videos hinweg mit beispielloser Genauigkeit.

Präzises Text-Rendering

Branchenführende Text-Rendering-Fähigkeiten für Produktverpackungen, Beschilderung und Markeninhalte. Generiert klaren, lesbaren Text innerhalb von Videoframes—unverzichtbar für Marketing- und kommerzielle Anwendungen.

Kernfähigkeiten

Erweiterte 15-Sekunden-Dauer

Generieren Sie bis zu 15 Sekunden pro Video mit vollständiger "Drei-Akt"-Struktur (Aufbau → Aktion → Auflösung)

Professionelle 1080p-Qualität

Native 1080p-Ausgabe bei 24fps mit filmischer Qualität und verbesserter visueller Stabilität

Native Audio-Synchronisation

Dialog passt zu Lippenbewegungen, Hintergrundmusik passt zum Tempo, Soundeffekte werden perfekt ausgelöst

Charakterkonsistenz

Behalten Sie Charakteraussehen, Kostüme und Identität über Einstellungen und mehrere Videos hinweg bei

Filmische Kamerakontrolle

Professionelle Kamerabewegungen einschließlich Schwenks, Zooms, Tracking-Shots und Dolly-Bewegungen

Flexible Seitenverhältnisse

16:9 (YouTube), 9:16 (Reels), 1:1 (Quadrat) - plattformoptimiert ohne Postproduktions-Cropping

Wan 2.6 vs Wan 2.5: Wesentliche Verbesserungen

Sehen Sie, was im neuesten Release neu ist

Videodauer

Bis zu 15 Sekunden

Wan 2.5: Maximum 10 Sekunden

Multi-Shot-Fähigkeit

Versteht Storyboard-Logik

Wan 2.5: Einzeleinstellung oder chaotisches Morphing

Referenzvideo-Unterstützung

R2V-Modus mit vollständiger Bewahrung

Wan 2.5: Nur Bildreferenz

Charakterkonsistenz

Hervorragend über Einstellungen hinweg

Wan 2.5: Charakterdrift-Probleme

Bewegungsstabilität

Reduziertes Jittern und Artefakte

Wan 2.5: Gelegentliche Frame-Drift

Prompt-Verständnis

Komplexe Multi-Charakter-Szenen

Wan 2.5: Grundlegende Szenengenerierung

Drei Spezialisierte Generierungsmodi

Wählen Sie den richtigen Modus für Ihren kreativen Workflow

Text-zu-Video (T2V)

Am Beliebtesten

Generieren Sie vollständige Videos aus Text-Prompts mit verbesserter Multi-Shot-Segmentierung und verbessertem Prompt-Handling. Perfekt für Storytelling und kreative Erkundung.

Automatische Shot-Segmentierung aus einem einzigen Prompt
Multi-Charakter-Interaktionsverständnis
Kamerabewegung und emotionale Hinweise
Umgebungsdetail-Bewahrung

Bild-zu-Video (I2V)

Verbessert

Verwandeln Sie Standbilder in Bewegungsvideos mit verbesserter Bewegungskohärenz. Ideal für Produktpräsentationen, Fotoanimation und visuelles Storytelling.

Präzises Text-Rendering für Produkte
Stilkonsistenz über Frames hinweg
Natürliche Bewegung aus Standbildern
Narrativ-gesteuerte visuelle Optimierung

Referenz-zu-Video (R2V)

NEU

Laden Sie ein Referenzvideo (2-30s) hoch, um Charakteraussehen, Bewegungsmuster und Stimme zu bewahren. Stärkste Konsistenzgarantie für charaktergetriebene Inhalte.

Vollständige Charakteridentitäts-Bewahrung
Stimmcharakteristik-Extraktion
Bewegungsmuster-Replikation
Multi-Charakter-Co-Acting-Szenen

Perfekt Für

Marketing & Werbung

Produktdemos mit Text-Rendering, Markenkampagnen mit Charakterkonsistenz und Werbevideos

Content-Erstellung

YouTube-Videos, Social-Media-Reels, Multi-Shot-Storytelling und Video-Editing-Workflows

E-Commerce

Produktpräsentationen mit präzisem Text, Tutorial-Videos und Nachbildung von Kundenstimmen

Bildung & Training

Lehrinhalte, Kursmaterialien und Multi-Szenen-Bildungsnarrative

Unterhaltung

Kurzfilme, charaktergetriebene Geschichten, filmische Sequenzen und kreative Experimente

Vorvisualisierung

Filmkonzeptentwicklung, Storyboard-Erstellung und Szenenplanung für Produktionen

Wan 2.6 T2V, I2V und R2V API-Integration

Vollständige API-Suite für Text-zu-Video-, Bild-zu-Video- und Referenz-zu-Video-Generierung

Text-zu-Video API (T2V API)

Unsere Wan 2.6 T2V API verwandelt Text-Prompts in Multi-Shot-Filmvideos mit automatischer Szenensegmentierung. Generieren Sie professionelle 1080p-Videos bis zu 15 Sekunden mit nativer Audio-Synchronisation.

Multi-Shot-Storytelling aus einem einzigen Prompt

15-Sekunden-Dauer mit Drei-Akt-Struktur

Verbessertes Prompt-Verständnis für komplexe Szenen

Flexible Seitenverhältnisse: 16:9, 9:16, 1:1

Bild-zu-Video API (I2V API)

Unsere Wan 2.6 I2V API erweckt Standbilder mit präziser Bewegungskontrolle und Text-Rendering zum Leben. Perfekt für Produktvideos, Fotoanimation und Markeninhalts-Erstellung.

Präzises Text-Rendering für Produkte und Beschilderung

Stilkonsistenz über Animationsframes hinweg

Natürliche Bewegung mit verbesserter Kohärenz

Narrativ-optimierte visuelle Ausgabe

Referenz-zu-Video API (R2V API)

Unsere Wan 2.6 R2V API bewahrt Charakteridentität aus Referenzvideos. Laden Sie 2-30 Sekunden lange Clips hoch, um Aussehen, Stimme und Bewegungsmuster für konsistente Charaktergenerierung zu extrahieren.

Charakteraussehen und Identitäts-Bewahrung

Stimmcharakteristik-Extraktion und Replikation

Bewegungsmuster-Analyse und Reproduktion

Multi-Charakter-Szenen-Unterstützung

💡

Vollständige API-Suite

Alle drei Wan 2.6 API-Modi (T2V API, I2V API, R2V API) unterstützen RESTful-Architektur mit umfassender Dokumentation. Starten Sie mit SDKs für Python, Node.js und mehr. Jeder Endpoint umfasst native audiovisuelle Synchronisation und vollständige kommerzielle Nutzungsrechte.

Wie Sie mit Wan 2.6 Beginnen

Beginnen Sie in Minuten mit der Erstellung professioneller Videos über zwei einfache Wege

API-Integration

Für Entwickler, die Anwendungen erstellen

Registrieren & Anmelden

Erstellen Sie Ihr Atlas Cloud-Konto oder melden Sie sich an, um auf die Konsole zuzugreifen

Zahlungsmethode Hinzufügen

Verknüpfen Sie Ihre Kreditkarte im Abrechnungsbereich, um Ihr Konto aufzuladen

API-Schlüssel Generieren

Navigieren Sie zu Konsole → API-Schlüssel und erstellen Sie Ihren Authentifizierungsschlüssel

Mit dem Aufbau Beginnen

Verwenden Sie T2V-, I2V- oder R2V-API-Endpoints, um Wan 2.6 in Ihre Anwendung zu integrieren

Playground-Erfahrung

Für schnelle Tests und Experimente

Registrieren & Anmelden

Erstellen Sie Ihr Atlas Cloud-Konto oder melden Sie sich an, um auf die Plattform zuzugreifen

Zahlungsmethode Hinzufügen

Verknüpfen Sie Ihre Kreditkarte im Abrechnungsbereich, um zu starten

Playground Verwenden

Gehen Sie zum Wan 2.6 Playground, wählen Sie T2V/I2V/R2V-Modus und generieren Sie sofort Videos

💡

Profi-Tipp: Testen Sie zuerst verschiedene Generierungsmodi im Playground, um zu verstehen, welcher für Ihren Anwendungsfall am besten funktioniert, und integrieren Sie dann die entsprechende API für Produktionsskalierung.

Häufig Gestellte Fragen

Was macht die Multi-Shot-Fähigkeit von Wan 2.6 einzigartig?

Wan 2.6 ist das erste Modell, das Storyboard-Logik wirklich versteht. Im Gegensatz zu Wan 2.5, das chaotische "Morphing"-Effekte erzeugte, kann Wan 2.6 automatisch einen einzigen Prompt in mehrere distinkte Einstellungen mit kohärenten Übergängen segmentieren und dabei die Charakterkonsistenz über Szenenwechsel hinweg bewahren.

Wie funktioniert Referenz-zu-Video (R2V)?

Laden Sie ein 2-30 Sekunden langes Referenzvideo hoch, und Wan 2.6 extrahiert Charakteraussehen, Bewegungsmuster und Stimmcharakteristiken. Sie können dann neue Videos mit demselben Charakter mit konsistenter Identität generieren—ideal für die Erstellung charaktergetriebener Inhaltsserien.

Welche Videoformate und -dauern werden unterstützt?

Wan 2.6 generiert 1080p-Videos bei 24fps mit Dauern von 5 bis 15 Sekunden. Unterstützte Seitenverhältnisse umfassen 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) und 1:1 (quadratisches Format), optimiert für jede Plattform ohne Postproduktions-Cropping.

Kann Wan 2.6 Text in Videos rendern?

Ja! Wan 2.6 verfügt über branchenführendes Text-Rendering für Produktverpackungen, Beschilderung und Markeninhalte. Das Modell kann klaren, lesbaren Text innerhalb von Videoframes generieren—ein kritisches Feature, das Seedance und den meisten Wettbewerbern fehlt.

Was ist der Unterschied zwischen T2V-, I2V- und R2V-Modi?

T2V (Text-zu-Video) generiert aus Text-Prompts mit Multi-Shot-Fähigkeit. I2V (Bild-zu-Video) animiert Standbilder mit präzisem Text-Rendering. R2V (Referenz-zu-Video) verwendet Videoreferenzen, um Charakteridentität über Generierungen hinweg zu bewahren. Wählen Sie basierend auf Ihrem Eingabetyp und Konsistenzbedarf.

Habe ich kommerzielle Rechte an generierten Videos?

Ja! Jede Wan 2.6-Kreation kommt mit vollständigen kommerziellen Nutzungsrechten. Videos sind produktionsbereit für Marketingkampagnen, Kundenlieferungen, Markeninhalte und kommerzielle Anwendungen ohne zusätzliche Lizenzanforderungen.

Warum Wan 2.6 auf Atlas Cloud Verwenden?

Nutzen Sie Enterprise-Grade-Infrastruktur für Ihre professionellen Videogenerierungs-Workflows

Zweckgebaute Infrastruktur

Deployen Sie Wan 2.6s Multi-Shot-Generierung und R2V-Fähigkeiten auf speziell für anspruchsvolle KI-Video-Workloads optimierter Infrastruktur. Maximale Performance für 1080p 15-Sekunden-Generierung.

Einheitliche API für Alle Modelle

Greifen Sie auf Wan 2.6 (T2V, I2V, R2V) neben 300+ KI-Modellen (LLMs, Bild, Video, Audio) über eine einheitliche API zu. Einzelintegration für alle Ihre generativen KI-Bedürfnisse mit konsistenter Authentifizierung.

Wettbewerbsfähige Preise

Sparen Sie bis zu 70% im Vergleich zu AWS mit transparenter Pay-as-you-go-Preisgestaltung. Keine versteckten Gebühren, keine Verpflichtungen—skalieren Sie vom Prototyp zur Produktion, ohne die Bank zu sprengen.

SOC I & II Zertifizierte Sicherheit

Ihre Referenzvideos und generierte Inhalte geschützt mit SOC I & II-Zertifizierungen und HIPAA-Compliance. Enterprise-Grade-Sicherheit mit verschlüsselter Übertragung und Speicherung.

99,9% Uptime SLA

Enterprise-Grade-Zuverlässigkeit mit garantierter 99,9% Uptime. Ihre Wan 2.6 Multi-Shot-Videogenerierung ist immer verfügbar für Produktionskampagnen und kritische Content-Workflows.

Einfache Integration

Vollständige Integration in Minuten mit REST API und mehrsprachigen SDKs (Python, Node.js, Go). Wechseln Sie nahtlos zwischen T2V-, I2V- und R2V-Modi mit einheitlicher Endpoint-Struktur.

99.9%

Verfügbarkeit

70%

Geringere Kosten vs AWS

300+

Gen AI Modelle

24/7

Pro-Support

Technische Spezifikationen

Architecture

Fortgeschrittener Transformer mit Multi-Modal-Verständnis

Resolution

1080p (Full HD)

Frame Rate

24 FPS

Duration

5-15 Sekunden (modusabhängig)

Aspect Ratios

16:9, 9:16, 1:1

Generation Modes

T2V, I2V, R2V

Audio

Native Synchronisation mit Lip-Sync

Commercial Rights

Vollständige kommerzielle Nutzung enthalten

Erleben Sie Professionelle Multi-Shot-Videogenerierung

Schließen Sie sich Content-Erstellern, Marketern und Filmemachern weltweit an, die mit Wan 2.6s bahnbrechenden Multi-Shot-Storytelling- und Charakterkonsistenz-Fähigkeiten die Videoproduktion revolutionieren.

Alibaba WAN 2.6 Image Edit

Alibaba WAN 2.6 Image Edit enables you to upload an existing visual and specify the desired adjustments. The model preserves layout and subject structure while implementing high-quality updates based on natural language.

Why creators love it

Structure-preserving edits: Make lighting, color, or object changes without breaking composition.
Text-guided styling: Reimagine materials, moods, or art styles with concise prompts.
Prompt expansion on demand: Enable automatic prompt enrichment when you need extra detail.
Flexible output sizes: Pick the resolution that best matches your downstream workflow.

Perfect for

Marketing and design teams refining campaign visuals.
E-commerce sellers upgrading product imagery.
Content creators polishing thumbnails, covers, and posts.
Artists experimenting with variations of their original work.

Billing rules

Minimum charge: 1 image.
Total cost = number of images × price per resolution.

How to use

Provide the image you want to refine. (Image dimensions must be in (384, 5000))
Describe the desired adjustments in the prompt.
Choose the target resolution and submit.
Review the enhanced output and download the version you like best.

Pro tips

Start with clear instructions about colors, lighting, or objects to adjust.
Pair positive and negative prompts to control what should or should not appear.
Keep source images at or above your target resolution for optimal fidelity.

Note

If you did not upload the image locally, please ensure that the image URL is accessible! A successfully accessible image will display a preview in the interface.

Recommended Resolutions

Aspect Ratio	Exact (W×H)	Exact Pixels	Rounded (W×H, ÷64)	Rounded Pixels
1:1	1448 × 1448	2,096,704	1408 × 1408	1,982,464
3:2	1773 × 1182	2,095,686	1728 × 1152	1,990,656
4:3	1672 × 1254	2,096,688	1664 × 1216	2,023,424
16:9	1936 × 1089	2,108,304	1920 × 1088	2,088,960
21:9	2212 × 948	2,096,976	2176 × 960	2,088,960
1:1	1024 × 1024	1,048,576	1024 × 1024	1,048,576
3:2	1254 × 836	1,048,344	1216 × 832	1,011,712
4:3	1182 × 887	1,048,434	1152 × 896	1,032,192
16:9	1365 × 768	1,048,320	1344 × 768	1,032,192
21:9	1564 × 670	1,047,880	1536 × 640	983,040
1:1	323 × 323	104,329	320 × 320	102,400
3:2	397 × 264	104,808	384 × 256	98,304
4:3	374 × 280	104,720	448 × 320	143,360
16:9	432 × 243	104,976	448 × 256	114,688
21:9	495 × 212	104,940	576 × 256	147,456

Wan-2.7 Pro Image-to-image

Edits and recomposes images with Wan 2.7 image pro using text instructions and multi-image references for higher quality outputs.

Wan-2.7 Pro Text-to-image

Generates images from text prompts with Wan 2.7 image pro, supporting higher fidelity outputs and 4K-ready workflows.

Wan-2.7 Image-to-image

Edits and recomposes images with Wan 2.7 image using text instructions, multi-image references, and optional interaction boxes.

Wan-2.7 Text-to-image

Generates images from text prompts with Wan 2.7 image, supporting fast iteration and strong prompt fidelity for illustration and photorealistic outputs.

Qwen Image 2.0 Pro Text-to-image

Qwen Image 2.0 Pro is a professional-grade text-to-image model with superior quality and advanced prompt understanding. Up to 2k. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Qwen Image 2.0 Pro Edit

Qwen Image 2.0 Pro Edit is a professional-grade image editing model with superior quality and advanced instruction understanding. Up to 2k. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Qwen Image 2.0 Edit

Qwen Image 2.0 Edit is an advanced image-editing model with improved quality and better understanding of instructions. Up to 2k. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Qwen Image 2.0 Text-to-image

Qwen Image 2.0 is an advanced text-to-image model with enhanced image quality and improved prompt understanding. Up to 2k. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Qwen-Image Edit Plus 20251215

Supports multiple image inputs and outputs, allowing for precise modification of text within images, addition, deletion, or movement of objects, alteration of subject actions, transfer of image styles, and enhancement of image details.

From$0.03/BILD

$0.021/BILD

-30%