alibaba/wan-2.6/image-edit

gambar-ke-gambar

Wan 2.6 Image-to-Image API by Alibaba

alibaba/wan-2.6/image-edit

Image-edit

Supports image editing and mixed text and image output to meet diverse generation and integration needs.

INPUT

Memuat konfigurasi parameter...

OUTPUT

Menunggu

Gambar yang dihasilkan akan muncul di sini

Konfigurasikan pengaturan Anda dan klik Jalankan untuk memulai

Permintaan Anda akan dikenakan biaya $0.021 per eksekusi. Dengan $10 Anda dapat menjalankan model ini sekitar 476 kali.

Berikut yang dapat Anda lakukan selanjutnya:

Gambar ke Video Gambar ke Gambar

Parameter

Contoh kode
import requests
import time

# Step 1: Start image generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "alibaba/wan-2.6/image-edit",
    "prompt": "A beautiful landscape with mountains and lake",
    "width": 512,
    "height": 512,
    "steps": 20,
    "guidance_scale": 7.5,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] == "completed":
            print("Generated image:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

image_url = check_status()

Instalasi

Instal paket dependensi yang diperlukan.

pip install requests

Autentikasi

Semua permintaan API memerlukan autentikasi melalui API key. Anda bisa mendapatkan API key dari dasbor Atlas Cloud.

export ATLASCLOUD_API_KEY="your-api-key-here"

HTTP Headers

import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}

Jaga keamanan API key Anda

Jangan pernah mengekspos API key Anda di kode sisi klien atau repositori publik. Gunakan variabel lingkungan atau proxy backend sebagai gantinya.

Kirim permintaan

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Kirim Permintaan

Kirim permintaan pembuatan asinkron. API mengembalikan prediction ID yang dapat Anda gunakan untuk memeriksa status dan mengambil hasil.

POST/api/v1/model/generateImage

Isi Permintaan

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "alibaba/wan-2.6/image-edit",
    "prompt": "A beautiful landscape with mountains and lake"
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['data']['id']}")
print(f"Status: {result['data']['status']}")

Respons

{
  "code": 200,
  "data": {
    "id": "pred_abc123",
    "status": "processing",
    "model": "model-name",
    "created_at": "2025-01-01T00:00:00Z"
  }
}

Periksa Status

Polling prediction endpoint untuk memeriksa status permintaan Anda saat ini.

GET/api/v1/model/prediction/{prediction_id}

Contoh Polling

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

Nilai Status

processingPermintaan masih diproses.

completedPembuatan selesai. Output tersedia.

succeededPembuatan berhasil. Output tersedia.

failedPembuatan gagal. Periksa field error.

Respons Selesai

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.png"
    ],
    "metrics": {
      "predict_time": 8.3
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

Unggah File

Unggah file ke penyimpanan Atlas Cloud dan dapatkan URL yang dapat Anda gunakan dalam permintaan API Anda. Gunakan multipart/form-data untuk mengunggah.

POST/api/v1/model/uploadMedia

Contoh Unggah

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

Respons

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

Input Schema

Parameter berikut diterima di isi permintaan.

Total: 0Wajib: 0Opsional: 0

Tidak ada parameter yang tersedia.

Contoh Isi Permintaan

{
  "model": "alibaba/wan-2.6/image-edit"
}

Output Schema

API mengembalikan respons prediction dengan URL output yang dihasilkan.

idstringrequired

Unique identifier for the prediction.

statusstringrequired

Current status of the prediction.

processingcompletedsucceededfailed

modelstringrequired

The model used for generation.

outputsarray[string]

Array of output URLs. Available when status is "completed".

errorstring

Error message if status is "failed".

metricsobject

Performance metrics.

predict_timenumber

Time taken for image generation in seconds.

created_atstringrequired

ISO 8601 timestamp when the prediction was created.

Format: date-time

completed_atstring

ISO 8601 timestamp when the prediction was completed.

Format: date-time

Contoh Respons

{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.png"
  ],
  "metrics": {
    "predict_time": 8.3
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills mengintegrasikan 300+ model AI langsung ke asisten pengkodean AI Anda. Satu perintah untuk menginstal, lalu gunakan bahasa alami untuk menghasilkan gambar, video, dan mengobrol dengan LLM.

Klien yang Didukung

Claude Code

OpenAI Codex

Gemini CLI

Cursor

Windsurf

VS Code

Trae

GitHub Copilot

Cline

Roo Code

Amp

Goose

Replit

40+ klien yang didukung

Instalasi

npx skills add AtlasCloudAI/atlas-cloud-skills

Atur API Key

Dapatkan API key dari dasbor Atlas Cloud dan atur sebagai variabel lingkungan.

export ATLASCLOUD_API_KEY="your-api-key-here"

Kemampuan

Setelah diinstal, Anda dapat menggunakan bahasa alami di asisten AI Anda untuk mengakses semua model Atlas Cloud.

Pembuatan GambarBuat gambar dengan model seperti Nano Banana 2, Z-Image, dan lainnya.

Pembuatan VideoBuat video dari teks atau gambar dengan Kling, Vidu, Veo, dll.

Obrolan LLMMengobrol dengan Qwen, DeepSeek, dan model bahasa besar lainnya.

Unggah MediaUnggah file lokal untuk pengeditan gambar dan alur kerja gambar-ke-video.

Pelajari lebih lanjut

github.com/AtlasCloudAI/atlas-cloud-skills

MCP Server

Atlas Cloud MCP Server menghubungkan IDE Anda dengan 300+ model AI melalui Model Context Protocol. Berfungsi dengan klien apa pun yang kompatibel dengan MCP.

Klien yang Didukung

Cursor

VS Code

Windsurf

Claude Code

OpenAI Codex

Gemini CLI

Cline

Roo Code

100+ klien yang didukung

Instalasi

npx -y atlascloud-mcp

Konfigurasi

Tambahkan konfigurasi berikut ke file pengaturan MCP di IDE Anda.

{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

Alat yang Tersedia

atlas_generate_imageBuat gambar dari prompt teks.

atlas_generate_videoBuat video dari teks atau gambar.

atlas_chatMengobrol dengan model bahasa besar.

atlas_list_modelsJelajahi 300+ model AI yang tersedia.

atlas_quick_generatePembuatan konten satu langkah dengan pemilihan model terbaik otomatis.

atlas_upload_mediaUnggah file lokal untuk alur kerja API.

Pelajari lebih lanjut

github.com/AtlasCloudAI/mcp-server

Schema API

Schema tidak tersedia

Tidak ada contoh yang tersedia

Memuat...

🎬GENERASI VIDEO MULTI-SHOT

Wan 2.6Pembuatan Video AI Multi-Shot Profesional

Terobosan terbaru Alibaba dalam generasi video AI. Buat video 1080p hingga 15 detik dengan penceritaan multi-shot, konsistensi karakter berbasis referensi, dan sinkronisasi audiovisual native. Model pertama yang benar-benar memahami logika storyboard untuk narasi sinematik.

Terobosan Revolusioner

Apa yang menjadikan Wan 2.6 pengubah aturan main dalam generasi video AI

Penceritaan Multi-Shot

Model pertama yang memahami logika storyboard. Secara otomatis menghasilkan shot berurutan dengan transisi yang koheren, mempertahankan penampilan karakter dan konsistensi lingkungan melalui perubahan adegan—memungkinkan alur cerita lengkap dalam satu generasi 15 detik.

Referensi-ke-Video (R2V)

Unggah video referensi 2-30 detik untuk mengekstrak dan menjaga penampilan karakter, pola gerakan, dan karakteristik suara. Buat performa karakter yang konsisten di berbagai video dengan akurasi yang belum pernah terjadi sebelumnya.

Rendering Teks Akurat

Kemampuan rendering teks terdepan di industri untuk kemasan produk, signage, dan konten brand. Hasilkan teks yang jelas dan mudah dibaca di dalam frame video—esensial untuk aplikasi pemasaran dan komersial.

Kemampuan Inti

Durasi Diperpanjang 15 Detik

Hasilkan hingga 15 detik per video dengan struktur "Tiga Babak" lengkap (Setup → Aksi → Resolusi)

Kualitas 1080p Profesional

Output native 1080p pada 24fps dengan kualitas sinematik dan stabilitas visual yang ditingkatkan

Sinkronisasi Audio Native

Dialog cocok dengan gerakan bibir, musik latar diselaraskan dengan tempo, efek suara terpicu sempurna

Konsistensi Karakter

Pertahankan penampilan, kostum, dan identitas karakter di seluruh shot dan berbagai video

Kontrol Kamera Sinematik

Gerakan kamera profesional termasuk pan, zoom, tracking shot, dan gerakan dolly

Rasio Aspek Fleksibel

16:9 (YouTube), 9:16 (Reels), 1:1 (Persegi) - dioptimalkan untuk platform tanpa cropping pasca-produksi

Wan 2.6 vs Wan 2.5: Peningkatan Utama

Lihat apa yang baru di rilis terbaru

Durasi Video

Hingga 15 detik

Wan 2.5: Maksimal 10 detik

Kemampuan Multi-Shot

Memahami logika storyboard

Wan 2.5: Shot tunggal atau morfing yang berantakan

Dukungan Video Referensi

Mode R2V dengan pelestarian penuh

Wan 2.5: Referensi gambar saja

Konsistensi Karakter

Sangat baik di antara shot

Wan 2.5: Masalah drift karakter

Stabilitas Gerakan

Berkurangnya jitter dan artefak

Wan 2.5: Drift frame sesekali

Pemahaman Prompt

Adegan multi-karakter kompleks

Wan 2.5: Generasi adegan dasar

Tiga Mode Generasi Khusus

Pilih mode yang tepat untuk alur kerja kreatif Anda

Teks-ke-Video (T2V)

Paling Populer

Hasilkan video lengkap dari prompt teks dengan segmentasi multi-shot yang ditingkatkan dan penanganan prompt yang disempurnakan. Sempurna untuk penceritaan dan eksplorasi kreatif.

Segmentasi shot otomatis dari prompt tunggal
Pemahaman interaksi multi-karakter
Gerakan kamera dan isyarat emosional
Pelestarian detail lingkungan

Gambar-ke-Video (I2V)

Ditingkatkan

Ubah gambar diam menjadi video bergerak dengan koherensi gerakan yang ditingkatkan. Ideal untuk showcase produk, animasi foto, dan penceritaan visual.

Rendering teks akurat untuk produk
Konsistensi gaya di seluruh frame
Gerakan natural dari gambar diam
Optimisasi visual yang digerakkan oleh narasi

Referensi-ke-Video (R2V)

BARU

Unggah video referensi (2-30 detik) untuk menjaga penampilan karakter, pola gerakan, dan suara. Jaminan konsistensi terkuat untuk konten yang digerakkan oleh karakter.

Pelestarian identitas karakter lengkap
Ekstraksi karakteristik suara
Replikasi pola gerakan
Adegan interaksi multi-karakter

Sempurna Untuk

Pemasaran & Periklanan

Demo produk dengan rendering teks, kampanye brand dengan konsistensi karakter, dan video promosi

Pembuatan Konten

Video YouTube, reels media sosial, penceritaan multi-shot, dan alur kerja editing video

E-commerce

Showcase produk dengan teks akurat, video tutorial, dan pembuatan ulang testimoni pelanggan

Pendidikan & Pelatihan

Konten instruksional, materi kursus, dan narasi pendidikan multi-adegan

Hiburan

Film pendek, cerita yang digerakkan karakter, sekuens sinematik, dan eksperimen kreatif

Pra-visualisasi

Pengembangan konsep film, pembuatan storyboard, dan perencanaan adegan untuk produksi

Integrasi API Wan 2.6 T2V, I2V, dan R2V

Suite API lengkap untuk generasi Teks-ke-Video, Gambar-ke-Video, dan Referensi-ke-Video

API Teks-ke-Video (T2V API)

API Wan 2.6 T2V kami mengubah prompt teks menjadi video sinematik multi-shot dengan segmentasi adegan otomatis. Hasilkan video profesional 1080p hingga 15 detik dengan sinkronisasi audio native.

Penceritaan multi-shot dari prompt tunggal

Durasi 15 detik dengan struktur Tiga Babak

Pemahaman prompt yang ditingkatkan untuk adegan kompleks

Rasio aspek fleksibel: 16:9, 9:16, 1:1

API Gambar-ke-Video (I2V API)

API Wan 2.6 I2V kami menghidupkan gambar diam dengan kontrol gerakan yang presisi dan rendering teks. Sempurna untuk video produk, animasi foto, dan pembuatan konten brand.

Rendering teks akurat untuk produk dan signage

Konsistensi gaya di frame animasi

Gerakan natural dengan koherensi yang ditingkatkan

Output visual yang dioptimalkan narasi

API Referensi-ke-Video (R2V API)

API Wan 2.6 R2V kami menjaga identitas karakter dari video referensi. Unggah klip 2-30 detik untuk mengekstrak penampilan, suara, dan pola gerakan untuk generasi karakter yang konsisten.

Pelestarian penampilan dan identitas karakter

Ekstraksi dan replikasi karakteristik suara

Analisis dan reproduksi pola gerakan

Dukungan adegan multi-karakter

💡

Suite API Lengkap

Ketiga mode API Wan 2.6 (T2V API, I2V API, R2V API) mendukung arsitektur RESTful dengan dokumentasi komprehensif. Mulai dengan SDK untuk Python, Node.js, dan lainnya. Setiap endpoint mencakup sinkronisasi audiovisual native dan hak penggunaan komersial penuh.

Cara Memulai dengan Wan 2.6

Mulai buat video profesional dalam hitungan menit dengan dua jalur sederhana

Integrasi API

Untuk pengembang yang membangun aplikasi

Daftar & Login

Buat akun Atlas Cloud Anda atau login untuk mengakses konsol

Tambahkan Metode Pembayaran

Hubungkan kartu kredit Anda di bagian Billing untuk mendanai akun

Hasilkan Kunci API

Navigasi ke Console → API Keys dan buat kunci autentikasi Anda

Mulai Membangun

Gunakan endpoint API T2V, I2V, atau R2V untuk mengintegrasikan Wan 2.6 ke dalam aplikasi Anda

Pengalaman Playground

Untuk pengujian cepat dan eksperimen

Daftar & Login

Buat akun Atlas Cloud Anda atau login untuk mengakses platform

Tambahkan Metode Pembayaran

Hubungkan kartu kredit Anda di bagian Billing untuk memulai

Gunakan Playground

Pergi ke playground Wan 2.6, pilih mode T2V/I2V/R2V, dan hasilkan video secara instan

💡

Tips Pro: Uji mode generasi berbeda di Playground terlebih dahulu untuk memahami mana yang paling cocok untuk kasus penggunaan Anda, kemudian integrasikan API yang sesuai untuk skala produksi.

Pertanyaan yang Sering Diajukan

Apa yang membuat kemampuan multi-shot Wan 2.6 unik?

Wan 2.6 adalah model pertama yang benar-benar memahami logika storyboard. Tidak seperti Wan 2.5 yang menciptakan efek "morphing" yang berantakan, Wan 2.6 dapat secara otomatis mensegmentasi prompt tunggal menjadi beberapa shot yang berbeda dengan transisi koheren, mempertahankan konsistensi karakter melalui perubahan adegan.

Bagaimana Referensi-ke-Video (R2V) bekerja?

Unggah video referensi 2-30 detik, dan Wan 2.6 mengekstrak penampilan karakter, pola gerakan, dan karakteristik suara. Anda kemudian dapat menghasilkan video baru yang menampilkan karakter yang sama dengan identitas yang konsisten—ideal untuk membuat seri konten yang digerakkan oleh karakter.

Format dan durasi video apa yang didukung?

Wan 2.6 menghasilkan video 1080p pada 24fps dengan durasi dari 5 hingga 15 detik. Rasio aspek yang didukung meliputi 16:9 (YouTube), 9:16 (Instagram Reels/TikTok), dan 1:1 (format persegi), dioptimalkan untuk setiap platform tanpa memerlukan cropping pasca-produksi.

Bisakah Wan 2.6 merender teks dalam video?

Ya! Wan 2.6 memiliki rendering teks terdepan di industri untuk kemasan produk, signage, dan konten brand. Model ini dapat menghasilkan teks yang jelas dan mudah dibaca di dalam frame video—fitur kritis yang tidak dimiliki Seedance dan sebagian besar kompetitor.

Apa perbedaan antara mode T2V, I2V, dan R2V?

T2V (Teks-ke-Video) menghasilkan dari prompt teks dengan kemampuan multi-shot. I2V (Gambar-ke-Video) menganimasikan gambar diam dengan rendering teks yang presisi. R2V (Referensi-ke-Video) menggunakan referensi video untuk menjaga identitas karakter di seluruh generasi. Pilih berdasarkan jenis input dan kebutuhan konsistensi Anda.

Apakah saya memiliki hak komersial atas video yang dihasilkan?

Ya! Setiap kreasi Wan 2.6 dilengkapi dengan hak penggunaan komersial penuh. Video siap produksi untuk kampanye pemasaran, deliverable klien, konten brand, dan aplikasi komersial tanpa persyaratan lisensi tambahan.

Mengapa Menggunakan Wan 2.6 di Atlas Cloud?

Manfaatkan infrastruktur tingkat enterprise untuk alur kerja generasi video profesional Anda

Infrastruktur yang Dibangun Khusus

Deploy generasi multi-shot dan kemampuan R2V Wan 2.6 pada infrastruktur yang dioptimalkan khusus untuk beban kerja video AI yang menuntut. Performa maksimal untuk generasi 1080p 15 detik.

API Terpadu untuk Semua Model

Akses Wan 2.6 (T2V, I2V, R2V) bersama 300+ model AI (LLM, gambar, video, audio) melalui satu API terpadu. Integrasi tunggal untuk semua kebutuhan AI generatif Anda dengan autentikasi yang konsisten.

Harga Kompetitif

Hemat hingga 70% dibandingkan AWS dengan harga bayar sesuai pemakaian yang transparan. Tanpa biaya tersembunyi, tanpa komitmen—skalakan dari prototipe ke produksi tanpa menguras kantong.

Keamanan Bersertifikat SOC I & II

Video referensi dan konten yang dihasilkan dilindungi dengan sertifikasi SOC I & II dan kepatuhan HIPAA. Keamanan tingkat enterprise dengan transmisi dan penyimpanan terenkripsi.

SLA Uptime 99,9%

Keandalan tingkat enterprise dengan jaminan uptime 99,9%. Generasi video multi-shot Wan 2.6 Anda selalu tersedia untuk kampanye produksi dan alur kerja konten kritis.

Integrasi Mudah

Integrasi lengkap dalam hitungan menit dengan REST API dan SDK multi-bahasa (Python, Node.js, Go). Beralih antara mode T2V, I2V, dan R2V dengan mulus dengan struktur endpoint terpadu.

99.9%

Uptime

70%

Biaya Lebih Rendah vs AWS

300+

Model Gen AI

24/7

Dukungan Pro

Spesifikasi Teknis

Architecture

Transformer Lanjutan dengan Pemahaman Multi-Modal

Resolution

1080p (Full HD)

Frame Rate

24 FPS

Duration

5-15 detik (tergantung mode)

Aspect Ratios

16:9, 9:16, 1:1

Generation Modes

T2V, I2V, R2V

Audio

Sinkronisasi native dengan sinkronisasi gerak bibir

Commercial Rights

Penggunaan komersial penuh termasuk

Rasakan Generasi Video Multi-Shot Profesional

Bergabunglah dengan pembuat konten, pemasar, dan pembuat film di seluruh dunia yang merevolusi produksi video dengan kemampuan penceritaan multi-shot dan konsistensi karakter yang revolusioner dari Wan 2.6.

Alibaba WAN 2.6 Image Edit

Alibaba WAN 2.6 Image Edit enables you to upload an existing visual and specify the desired adjustments. The model preserves layout and subject structure while implementing high-quality updates based on natural language.

Why creators love it

Structure-preserving edits: Make lighting, color, or object changes without breaking composition.
Text-guided styling: Reimagine materials, moods, or art styles with concise prompts.
Prompt expansion on demand: Enable automatic prompt enrichment when you need extra detail.
Flexible output sizes: Pick the resolution that best matches your downstream workflow.

Perfect for

Marketing and design teams refining campaign visuals.
E-commerce sellers upgrading product imagery.
Content creators polishing thumbnails, covers, and posts.
Artists experimenting with variations of their original work.

Billing rules

Minimum charge: 1 image.
Total cost = number of images × price per resolution.

How to use

Provide the image you want to refine. (Image dimensions must be in (384, 5000))
Describe the desired adjustments in the prompt.
Choose the target resolution and submit.
Review the enhanced output and download the version you like best.

Pro tips

Start with clear instructions about colors, lighting, or objects to adjust.
Pair positive and negative prompts to control what should or should not appear.
Keep source images at or above your target resolution for optimal fidelity.

Note

If you did not upload the image locally, please ensure that the image URL is accessible! A successfully accessible image will display a preview in the interface.

Recommended Resolutions

Aspect Ratio	Exact (W×H)	Exact Pixels	Rounded (W×H, ÷64)	Rounded Pixels
1:1	1448 × 1448	2,096,704	1408 × 1408	1,982,464
3:2	1773 × 1182	2,095,686	1728 × 1152	1,990,656
4:3	1672 × 1254	2,096,688	1664 × 1216	2,023,424
16:9	1936 × 1089	2,108,304	1920 × 1088	2,088,960
21:9	2212 × 948	2,096,976	2176 × 960	2,088,960
1:1	1024 × 1024	1,048,576	1024 × 1024	1,048,576
3:2	1254 × 836	1,048,344	1216 × 832	1,011,712
4:3	1182 × 887	1,048,434	1152 × 896	1,032,192
16:9	1365 × 768	1,048,320	1344 × 768	1,032,192
21:9	1564 × 670	1,047,880	1536 × 640	983,040
1:1	323 × 323	104,329	320 × 320	102,400
3:2	397 × 264	104,808	384 × 256	98,304
4:3	374 × 280	104,720	448 × 320	143,360
16:9	432 × 243	104,976	448 × 256	114,688
21:9	495 × 212	104,940	576 × 256	147,456

Jelajahi Model Serupa

Wan-2.7 Pro Image-to-image

Edits and recomposes images with Wan 2.7 image pro using text instructions and multi-image references for higher quality outputs.

Wan-2.7 Pro Text-to-image

Generates images from text prompts with Wan 2.7 image pro, supporting higher fidelity outputs and 4K-ready workflows.

Wan-2.7 Image-to-image

Edits and recomposes images with Wan 2.7 image using text instructions, multi-image references, and optional interaction boxes.

Wan-2.7 Text-to-image

Generates images from text prompts with Wan 2.7 image, supporting fast iteration and strong prompt fidelity for illustration and photorealistic outputs.

Qwen Image 2.0 Pro Text-to-image

Qwen Image 2.0 Pro is a professional-grade text-to-image model with superior quality and advanced prompt understanding. Up to 2k. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Qwen Image 2.0 Pro Edit

Qwen Image 2.0 Pro Edit is a professional-grade image editing model with superior quality and advanced instruction understanding. Up to 2k. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Qwen Image 2.0 Edit

Qwen Image 2.0 Edit is an advanced image-editing model with improved quality and better understanding of instructions. Up to 2k. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Qwen Image 2.0 Text-to-image

Qwen Image 2.0 is an advanced text-to-image model with enhanced image quality and improved prompt understanding. Up to 2k. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Qwen-Image Edit Plus 20251215

Supports multiple image inputs and outputs, allowing for precise modification of text within images, addition, deletion, or movement of objects, alteration of subject actions, transfer of image styles, and enhancement of image details.

From$0.03/GAMBAR

$0.021/GAMBAR

-30%