alibaba/wan-2.6/image-edit

obraz-do-obrazu

Wan 2.6 Image-to-Image API by Alibaba

alibaba/wan-2.6/image-edit

Image-edit

Supports image editing and mixed text and image output to meet diverse generation and integration needs.

WEJŚCIE

Ładowanie konfiguracji parametrów...

WYJŚCIE

Bezczynny

Twoje wygenerowane obrazy pojawią się tutaj

Skonfiguruj ustawienia i kliknij Uruchom, aby rozpocząć

Każde uruchomienie będzie kosztować $0.021. Za $10 możesz uruchomić ten model około 476 razy.

Co możesz zrobić dalej:

Obraz do Wideo Obraz do Obrazu

Parametry

Przykład kodu
import requests
import time

# Step 1: Start image generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "alibaba/wan-2.6/image-edit",
    "prompt": "A beautiful landscape with mountains and lake",
    "width": 512,
    "height": 512,
    "steps": 20,
    "guidance_scale": 7.5,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] == "completed":
            print("Generated image:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

image_url = check_status()

Instalacja

Zainstaluj wymagany pakiet dla swojego języka programowania.

bash

pip install requests

Uwierzytelnianie

Wszystkie żądania API wymagają uwierzytelnienia za pomocą klucza API. Klucz API możesz uzyskać z panelu Atlas Cloud.

bash

export ATLASCLOUD_API_KEY="your-api-key-here"

Nagłówki HTTP

python

import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}

Chroń swój klucz API

Nigdy nie ujawniaj swojego klucza API w kodzie po stronie klienta ani w publicznych repozytoriach. Zamiast tego użyj zmiennych środowiskowych lub proxy backendowego.

Wyślij żądanie

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Wyślij żądanie

Wyślij asynchroniczne żądanie generowania. API zwróci identyfikator predykcji, którego możesz użyć do sprawdzania statusu i pobierania wyniku.

POST/api/v1/model/generateImage

Treść żądania

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "alibaba/wan-2.6/image-edit",
    "input": {
        "prompt": "A beautiful landscape with mountains and lake"
    }
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")

Odpowiedź

{
  "id": "pred_abc123",
  "status": "processing",
  "model": "model-name",
  "created_at": "2025-01-01T00:00:00Z"
}

Sprawdź status

Odpytuj endpoint predykcji, aby sprawdzić bieżący status żądania.

GET/api/v1/model/prediction/{prediction_id}

Przykład odpytywania

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

Wartości statusu

processingŻądanie jest wciąż przetwarzane.

completedGenerowanie zakończone. Wyniki są dostępne.

succeededGenerowanie powiodło się. Wyniki są dostępne.

failedGenerowanie nie powiodło się. Sprawdź pole błędu.

Odpowiedź ukończona

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.png"
    ],
    "metrics": {
      "predict_time": 8.3
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

Prześlij pliki

Prześlij pliki do magazynu Atlas Cloud i uzyskaj URL, którego możesz użyć w swoich żądaniach API. Użyj multipart/form-data do przesyłania.

POST/api/v1/model/uploadMedia

Przykład przesyłania

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

Odpowiedź

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

Schema wejściowy

Następujące parametry są akceptowane w treści żądania.

Łącznie: 0Wymagane: 0Opcjonalne: 0

Brak dostępnych parametrów.

Przykładowa treść żądania

json

{
  "model": "alibaba/wan-2.6/image-edit"
}

Schema wyjściowy

API zwraca odpowiedź predykcji z URL-ami wygenerowanych wyników.

idstringrequired

Unique identifier for the prediction.

statusstringrequired

Current status of the prediction.

processingcompletedsucceededfailed

modelstringrequired

The model used for generation.

outputsarray[string]

Array of output URLs. Available when status is "completed".

errorstring

Error message if status is "failed".

metricsobject

Performance metrics.

predict_timenumber

Time taken for image generation in seconds.

created_atstringrequired

ISO 8601 timestamp when the prediction was created.

Format: date-time

completed_atstring

ISO 8601 timestamp when the prediction was completed.

Format: date-time

Przykładowa odpowiedź

json

{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.png"
  ],
  "metrics": {
    "predict_time": 8.3
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills integruje ponad 300 modeli AI bezpośrednio z Twoim asystentem kodowania AI. Jedno polecenie do instalacji, a następnie używaj języka naturalnego do generowania obrazów, filmów i rozmów z LLM.

Obsługiwani klienci

Claude Code

OpenAI Codex

Gemini CLI

Cursor

Windsurf

VS Code

Trae

GitHub Copilot

Cline

Roo Code

Amp

Goose

Replit

40+ obsługiwani klienci

Instalacja

bash

npx skills add AtlasCloudAI/atlas-cloud-skills

Skonfiguruj klucz API

Uzyskaj klucz API z panelu Atlas Cloud i ustaw go jako zmienną środowiskową.

bash

export ATLASCLOUD_API_KEY="your-api-key-here"

Możliwości

Po zainstalowaniu możesz używać języka naturalnego w swoim asystencie AI, aby uzyskać dostęp do wszystkich modeli Atlas Cloud.

Generowanie obrazówGeneruj obrazy za pomocą modeli takich jak Nano Banana 2, Z-Image i inne.

Tworzenie wideoTwórz filmy z tekstu lub obrazów za pomocą Kling, Vidu, Veo itp.

Chat LLMRozmawiaj z Qwen, DeepSeek i innymi dużymi modelami językowymi.

Przesyłanie mediówPrześlij lokalne pliki do edycji obrazów i przepływów pracy obraz-do-wideo.

Dowiedz się więcej

github.com/AtlasCloudAI/atlas-cloud-skills

Serwer MCP

Serwer MCP Atlas Cloud łączy Twoje IDE z ponad 300 modelami AI za pośrednictwem Model Context Protocol. Działa z każdym klientem kompatybilnym z MCP.

Obsługiwani klienci

Cursor

VS Code

Windsurf

Claude Code

OpenAI Codex

Gemini CLI

Cline

Roo Code

100+ obsługiwani klienci

Instalacja

bash

npx -y atlascloud-mcp

Konfiguracja

Dodaj następującą konfigurację do pliku ustawień MCP w swoim IDE.

json

{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

Dostępne narzędzia

atlas_generate_imageGeneruj obrazy z promptów tekstowych.

atlas_generate_videoTwórz filmy z tekstu lub obrazów.

atlas_chatRozmawiaj z dużymi modelami językowymi.

atlas_list_modelsPrzeglądaj ponad 300 dostępnych modeli AI.

atlas_quick_generateTworzenie treści w jednym kroku z automatycznym wyborem modelu.

atlas_upload_mediaPrześlij lokalne pliki do przepływów pracy API.

Dowiedz się więcej

github.com/AtlasCloudAI/mcp-server

API Schema

Schema niedostępna

Zaloguj się, aby wyświetlić historię zapytań

Musisz być zalogowany, aby uzyskać dostęp do historii zapytań modelu.

Zaloguj się

🎬GENEROWANIE WIDEO WIELOUJĘCIOWEGO

Wan 2.6Profesjonalne Tworzenie Wideo AI z Wieloma Ujęciami

Najnowszy przełom Alibaba w generowaniu wideo AI. Twórz wideo 1080p do 15 sekund z narracją wieloujęciową, spójnością postaci opartą na referencjach i natywną synchronizacją audiowizualną. Pierwszy model, który prawdziwie rozumie logikę storyboardu dla kinematograficznych narracji.

Rewolucyjne Przełomy

Co czyni Wan 2.6 przełomem w generowaniu wideo AI

Narracja Wieloujęciowa

Pierwszy model rozumiejący logikę storyboardu. Automatycznie generuje sekwencyjne ujęcia ze spójnymi przejściami, zachowując wygląd postaci i spójność środowiska przez zmiany scen—umożliwiając kompletne łuki fabularne w pojedynczej 15-sekundowej generacji.

Referencja do Wideo (R2V)

Prześlij 2-30 sekundowe wideo referencyjne, aby wyodrębnić i zachować wygląd postaci, wzorce ruchu i cechy głosu. Twórz spójne występy postaci w wielu filmach z bezprecedensową dokładnością.

Precyzyjne Renderowanie Tekstu

Wiodące w branży możliwości renderowania tekstu dla opakowań produktów, oznakowania i treści brandowych. Generuj czysty, czytelny tekst w klatkach wideo—niezbędny dla aplikacji marketingowych i komercyjnych.

Główne Możliwości

Wydłużony Czas Trwania 15 Sekund

Generuj do 15 sekund na wideo z kompletną strukturą "Trzech Aktów" (Ekspozycja → Akcja → Rozwiązanie)

Profesjonalna Jakość 1080p

Natywne wyjście 1080p przy 24fps z kinematograficzną jakością i ulepszoną stabilnością wizualną

Natywna Synchronizacja Dźwięku

Dialog pasuje do ruchów warg, muzyka w tle dopasowana do tempa, efekty dźwiękowe wyzwalane perfekcyjnie

Spójność Postaci

Zachowaj wygląd, kostiumy i tożsamość postaci przez ujęcia i wiele filmów

Kinematograficzne Sterowanie Kamerą

Profesjonalne ruchy kamery w tym panoramy, zbliżenia, ujęcia śledzące i ruchy na wózku

Elastyczne Proporcje Obrazu

16:9 (YouTube), 9:16 (Reels), 1:1 (Kwadrat) - zoptymalizowane pod platformy bez kadrowania w postprodukcji

Wan 2.6 vs Wan 2.5: Główne Ulepszenia

Zobacz, co nowego w najnowszej wersji

Czas Trwania Wideo

Do 15 sekund

Wan 2.5: Maksymalnie 10 sekund

Możliwość Wieloujęciowa

Rozumie logikę storyboardu

Wan 2.5: Pojedyncze ujęcie lub chaotyczny morphing

Wsparcie Wideo Referencyjnego

Tryb R2V z pełnym zachowaniem

Wan 2.5: Tylko referencja obrazu

Spójność Postaci

Doskonała między ujęciami

Wan 2.5: Problemy z dryfem postaci

Stabilność Ruchu

Zmniejszone drżenia i artefakty

Wan 2.5: Okazjonalny dryf klatek

Rozumienie Promptów

Złożone sceny z wieloma postaciami

Wan 2.5: Podstawowe generowanie scen

Trzy Wyspecjalizowane Tryby Generowania

Wybierz odpowiedni tryb dla swojego kreatywnego przepływu pracy

Tekst do Wideo (T2V)

Najpopularniejszy

Generuj kompletne wideo z promptów tekstowych z ulepszoną segmentacją wieloujęciową i udoskonaloną obsługą promptów. Idealny dla storytellingu i eksploracji kreatywnej.

Automatyczna segmentacja ujęć z jednego promptu
Rozumienie interakcji wielopostaciowych
Ruch kamery i wskazówki emocjonalne
Zachowanie szczegółów środowiska

Obraz do Wideo (I2V)

Ulepszony

Przekształcaj nieruchome obrazy w wideo z ruchem z ulepszoną spójnością ruchu. Idealny dla pokazów produktów, animacji zdjęć i wizualnego storytellingu.

Precyzyjne renderowanie tekstu dla produktów
Spójność stylu między klatkami
Naturalny ruch z nieruchomych obrazów
Optymalizacja wizualna kierowana narracją

Referencja do Wideo (R2V)

NOWOŚĆ

Prześlij wideo referencyjne (2-30s), aby zachować wygląd postaci, wzorce ruchu i głos. Najsilniejsza gwarancja spójności dla treści opartych na postaciach.

Pełne zachowanie tożsamości postaci
Ekstrakcja cech głosowych
Replikacja wzorców ruchu
Sceny współgrające wielopostaciowe

Idealne Do

Marketing i Reklama

Dema produktów z renderowaniem tekstu, kampanie brandowe ze spójnością postaci i wideo promocyjne

Tworzenie Treści

Filmy YouTube, reels mediów społecznościowych, storytelling wieloujęciowy i przepływy pracy montażu wideo

E-commerce

Pokazy produktów z precyzyjnym tekstem, filmy tutorialowe i odtwarzanie referencji klientów

Edukacja i Szkolenia

Treści instruktażowe, materiały kursowe i narracje edukacyjne z wieloma scenami

Rozrywka

Filmy krótkometrażowe, historie oparte na postaciach, sekwencje kinematograficzne i eksperymenty kreatywne

Przewizualizacja

Rozwój koncepcji filmowych, tworzenie storyboardów i planowanie scen dla produkcji

Integracja API Wan 2.6 T2V, I2V i R2V

Kompletny pakiet API do generowania Tekst do Wideo, Obraz do Wideo i Referencja do Wideo

API Tekst do Wideo (T2V API)

Nasze API Wan 2.6 T2V przekształca prompty tekstowe w wieloujęciowe wideo kinematograficzne z automatyczną segmentacją scen. Generuj profesjonalne wideo 1080p do 15 sekund z natywną synchronizacją dźwięku.

Storytelling wieloujęciowy z jednego promptu

Czas trwania 15 sekund ze strukturą Trzech Aktów

Ulepszone rozumienie promptów dla złożonych scen

Elastyczne proporcje obrazu: 16:9, 9:16, 1:1

API Obraz do Wideo (I2V API)

Nasze API Wan 2.6 I2V ożywia nieruchome obrazy z precyzyjną kontrolą ruchu i renderowaniem tekstu. Idealny dla filmów produktowych, animacji zdjęć i tworzenia treści brandowych.

Precyzyjne renderowanie tekstu dla produktów i oznakowania

Spójność stylu w klatkach animacji

Naturalny ruch z ulepszoną spójnością

Wyjście wizualne zoptymalizowane narracją

API Referencja do Wideo (R2V API)

Nasze API Wan 2.6 R2V zachowuje tożsamość postaci z wideo referencyjnych. Prześlij klipy 2-30 sekund, aby wyodrębnić wygląd, głos i wzorce ruchu dla spójnego generowania postaci.

Zachowanie wyglądu i tożsamości postaci

Ekstrakcja i replikacja cech głosowych

Analiza i reprodukcja wzorców ruchu

Wsparcie scen wielopostaciowych

💡

Kompletny Pakiet API

Wszystkie trzy tryby API Wan 2.6 (T2V API, I2V API, R2V API) wspierają architekturę RESTful z kompleksową dokumentacją. Zacznij z SDK dla Python, Node.js i więcej. Każdy endpoint zawiera natywną synchronizację audiowizualną i pełne prawa do użytku komercyjnego.

Jak Zacząć z Wan 2.6

Zacznij tworzyć profesjonalne wideo w kilka minut dzięki dwóm prostym ścieżkom

Integracja API

Dla deweloperów budujących aplikacje

Zarejestruj się i Zaloguj

Utwórz konto Atlas Cloud lub zaloguj się, aby uzyskać dostęp do konsoli

Dodaj Metodę Płatności

Połącz kartę kredytową w sekcji Rozliczenia, aby zasilić konto

Wygeneruj Klucz API

Przejdź do Konsola → Klucze API i utwórz swój klucz uwierzytelniania

Zacznij Budować

Użyj endpointów API T2V, I2V lub R2V, aby zintegrować Wan 2.6 w swojej aplikacji

Doświadczenie Playground

Do szybkich testów i eksperymentów

Zarejestruj się i Zaloguj

Utwórz konto Atlas Cloud lub zaloguj się, aby uzyskać dostęp do platformy

Dodaj Metodę Płatności

Połącz kartę kredytową w sekcji Rozliczenia, aby rozpocząć

Użyj Playground

Przejdź do playground Wan 2.6, wybierz tryb T2V/I2V/R2V i generuj wideo natychmiast

💡

Wskazówka Pro: Najpierw przetestuj różne tryby generowania w Playground, aby zrozumieć, który najlepiej działa dla Twojego przypadku użycia, a następnie zintegruj odpowiednie API dla skali produkcyjnej.

Najczęściej Zadawane Pytania

Co czyni możliwość wieloujęciową Wan 2.6 wyjątkową?

Wan 2.6 to pierwszy model, który prawdziwie rozumie logikę storyboardu. W przeciwieństwie do Wan 2.5, który tworzył chaotyczne efekty "morphingu", Wan 2.6 może automatycznie segmentować pojedynczy prompt na wiele odrębnych ujęć ze spójnymi przejściami, zachowując spójność postaci przez zmiany scen.

Jak działa Referencja do Wideo (R2V)?

Prześlij 2-30 sekundowe wideo referencyjne, a Wan 2.6 wyodrębni wygląd postaci, wzorce ruchu i cechy głosu. Możesz następnie generować nowe wideo z tą samą postacią ze spójną tożsamością—idealne do tworzenia serii treści opartych na postaciach.

Jakie formaty i czasy trwania wideo są obsługiwane?

Wan 2.6 generuje wideo 1080p przy 24fps z czasem trwania od 5 do 15 sekund. Obsługiwane proporcje obrazu obejmują 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) i 1:1 (format kwadratowy), zoptymalizowane dla każdej platformy bez wymagania kadrowania w postprodukcji.

Czy Wan 2.6 może renderować tekst w wideo?

Tak! Wan 2.6 ma wiodące w branży renderowanie tekstu dla opakowań produktów, oznakowania i treści brandowych. Model może generować czysty, czytelny tekst w klatkach wideo—kluczowa funkcja, której brakuje Seedance i większości konkurentów.

Jaka jest różnica między trybami T2V, I2V i R2V?

T2V (Tekst do Wideo) generuje z promptów tekstowych z możliwością wieloujęciową. I2V (Obraz do Wideo) animuje nieruchome obrazy z precyzyjnym renderowaniem tekstu. R2V (Referencja do Wideo) używa referencji wideo, aby zachować tożsamość postaci między generacjami. Wybierz na podstawie typu wejścia i potrzeb spójności.

Czy mam prawa komercyjne do generowanych wideo?

Tak! Każda kreacja Wan 2.6 posiada pełne prawa do użytku komercyjnego. Wideo są gotowe do produkcji dla kampanii marketingowych, deliverables klientów, treści brandowych i aplikacji komercyjnych bez dodatkowych wymagań licencyjnych.

Dlaczego Używać Wan 2.6 na Atlas Cloud?

Wykorzystaj infrastrukturę klasy korporacyjnej dla swoich profesjonalnych przepływów pracy generowania wideo

Dedykowana Infrastruktura

Wdróż generowanie wieloujęciowe i możliwości R2V Wan 2.6 na infrastrukturze specjalnie zoptymalizowanej dla wymagających obciążeń wideo AI. Maksymalna wydajność dla generowania 1080p przez 15 sekund.

Zunifikowane API dla Wszystkich Modeli

Dostęp do Wan 2.6 (T2V, I2V, R2V) wraz z ponad 300 modelami AI (LLM, obraz, wideo, audio) przez jedno zunifikowane API. Pojedyncza integracja dla wszystkich potrzeb AI generatywnej ze spójnym uwierzytelnianiem.

Konkurencyjne Ceny

Oszczędzaj do 70% w porównaniu z AWS dzięki przejrzystym cenom pay-as-you-go. Bez ukrytych opłat, bez zobowiązań—skaluj od prototypu do produkcji bez rujnowania budżetu.

Certyfikowane Bezpieczeństwo SOC I & II

Twoje wideo referencyjne i wygenerowane treści chronione certyfikatami SOC I & II i zgodnością HIPAA. Bezpieczeństwo klasy korporacyjnej z zaszyfrowaną transmisją i przechowywaniem.

99,9% SLA Uptime

Niezawodność klasy korporacyjnej z gwarantowanym 99,9% uptime. Twoje generowanie wideo wieloujęciowego Wan 2.6 jest zawsze dostępne dla kampanii produkcyjnych i krytycznych przepływów pracy treści.

Łatwa Integracja

Kompletna integracja w minuty z REST API i wielojęzycznymi SDK (Python, Node.js, Go). Płynnie przełączaj się między trybami T2V, I2V i R2V ze zunifikowaną strukturą endpointów.

99.9%

Uptime

70%

Niższe Koszty vs AWS

300+

Modele Gen AI

24/7

Wsparcie Pro

Specyfikacje Techniczne

Architecture

Zaawansowany Transformer z Rozumieniem Multi-Modalnym

Resolution

1080p (Full HD)

Frame Rate

24 FPS

Duration

5-15 sekund (zależne od trybu)

Aspect Ratios

16:9, 9:16, 1:1

Generation Modes

T2V, I2V, R2V

Audio

Natywna synchronizacja z lip-sync

Commercial Rights

Pełny użytek komercyjny włączony

Doświadcz Profesjonalnego Generowania Wideo Wieloujęciowego

Dołącz do twórców treści, marketerów i filmowców na całym świecie, którzy rewolucjonizują produkcję wideo dzięki przełomowym możliwościom storytellingu wieloujęciowego i spójności postaci Wan 2.6.

Alibaba WAN 2.6 Image Edit

Alibaba WAN 2.6 Image Edit enables you to upload an existing visual and specify the desired adjustments. The model preserves layout and subject structure while implementing high-quality updates based on natural language.

Why creators love it

Structure-preserving edits: Make lighting, color, or object changes without breaking composition.
Text-guided styling: Reimagine materials, moods, or art styles with concise prompts.
Prompt expansion on demand: Enable automatic prompt enrichment when you need extra detail.
Flexible output sizes: Pick the resolution that best matches your downstream workflow.

Perfect for

Marketing and design teams refining campaign visuals.
E-commerce sellers upgrading product imagery.
Content creators polishing thumbnails, covers, and posts.
Artists experimenting with variations of their original work.

Billing rules

Minimum charge: 1 image.
Total cost = number of images × price per resolution.

How to use

Provide the image you want to refine. (Image dimensions must be in (384, 5000))
Describe the desired adjustments in the prompt.
Choose the target resolution and submit.
Review the enhanced output and download the version you like best.

Pro tips

Start with clear instructions about colors, lighting, or objects to adjust.
Pair positive and negative prompts to control what should or should not appear.
Keep source images at or above your target resolution for optimal fidelity.

Note

If you did not upload the image locally, please ensure that the image URL is accessible! A successfully accessible image will display a preview in the interface.

Recommended Resolutions

Aspect Ratio	Exact (W×H)	Exact Pixels	Rounded (W×H, ÷64)	Rounded Pixels
1:1	1448 × 1448	2,096,704	1408 × 1408	1,982,464
3:2	1773 × 1182	2,095,686	1728 × 1152	1,990,656
4:3	1672 × 1254	2,096,688	1664 × 1216	2,023,424
16:9	1936 × 1089	2,108,304	1920 × 1088	2,088,960
21:9	2212 × 948	2,096,976	2176 × 960	2,088,960
1:1	1024 × 1024	1,048,576	1024 × 1024	1,048,576
3:2	1254 × 836	1,048,344	1216 × 832	1,011,712
4:3	1182 × 887	1,048,434	1152 × 896	1,032,192
16:9	1365 × 768	1,048,320	1344 × 768	1,032,192
21:9	1564 × 670	1,047,880	1536 × 640	983,040
1:1	323 × 323	104,329	320 × 320	102,400
3:2	397 × 264	104,808	384 × 256	98,304
4:3	374 × 280	104,720	448 × 320	143,360
16:9	432 × 243	104,976	448 × 256	114,688
21:9	495 × 212	104,940	576 × 256	147,456

Eksploruj Podobne Modele

Wan-2.7 Pro Image-to-image

Edits and recomposes images with Wan 2.7 image pro using text instructions and multi-image references for higher quality outputs.

Wan-2.7 Pro Text-to-image

Generates images from text prompts with Wan 2.7 image pro, supporting higher fidelity outputs and 4K-ready workflows.

Wan-2.7 Image-to-image

Edits and recomposes images with Wan 2.7 image using text instructions, multi-image references, and optional interaction boxes.

Wan-2.7 Text-to-image

Generates images from text prompts with Wan 2.7 image, supporting fast iteration and strong prompt fidelity for illustration and photorealistic outputs.

From

$0.03/OBRAZ

Zacznij Od 300+ Modeli,

Przeglądaj wszystkie modele