Z-Image Turbo
text-till-bild
TURBO

Z-Image Turbo API by Alibaba

z-image/turbo
Turbo

Z-Image-Turbo is a 6 billion parameter text-to-image model that generates photorealistic images in sub-second time. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Inmatning

Laddar parameterkonfiguration...

Utmatning

Vilande
Dina genererade bilder visas här
Konfigurera parametrar och klicka på Kör för att börja generera

Varje körning kostar $0.01. För $10 kan du köra cirka 1000 gånger.

Du kan fortsätta med:

Parametrar

Kodexempel

import requests
import time

# Step 1: Start image generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "z-image/turbo",
    "prompt": "A beautiful landscape with mountains and lake",
    "width": 512,
    "height": 512,
    "steps": 20,
    "guidance_scale": 7.5,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] == "completed":
            print("Generated image:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

image_url = check_status()

Installera

Installera det nödvändiga paketet för ditt programmeringsspråk.

bash
pip install requests

Autentisering

Alla API-förfrågningar kräver autentisering via en API key. Du kan hämta din API key från Atlas Cloud-instrumentpanelen.

bash
export ATLASCLOUD_API_KEY="your-api-key-here"

HTTP Headers

python
import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}
Håll din API key säker

Exponera aldrig din API key i klientkod eller publika arkiv. Använd miljövariabler eller en backend-proxy istället.

Skicka en förfrågan

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Skicka en förfrågan

Skicka en asynkron genereringsförfrågan. API:et returnerar ett prediction ID som du kan använda för att kontrollera statusen och hämta resultatet.

POST/api/v1/model/generateImage

Förfrågningsinnehåll

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "z-image/turbo",
    "input": {
        "prompt": "A beautiful landscape with mountains and lake"
    }
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")

Svar

{
  "id": "pred_abc123",
  "status": "processing",
  "model": "model-name",
  "created_at": "2025-01-01T00:00:00Z"
}

Kontrollera status

Polla prediction-endpointen för att kontrollera den aktuella statusen för din förfrågan.

GET/api/v1/model/prediction/{prediction_id}

Polling-exempel

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

Statusvärden

processingFörfrågan bearbetas fortfarande.
completedGenereringen är klar. Utdata är tillgängliga.
succeededGenereringen lyckades. Utdata är tillgängliga.
failedGenereringen misslyckades. Kontrollera error-fältet.

Slutfört svar

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.png"
    ],
    "metrics": {
      "predict_time": 8.3
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

Ladda upp filer

Ladda upp filer till Atlas Cloud-lagring och få en URL som du kan använda i dina API-förfrågningar. Använd multipart/form-data för uppladdning.

POST/api/v1/model/uploadMedia

Uppladdningsexempel

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

Svar

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

Input Schema

Följande parametrar accepteras i förfrågningsinnehållet.

Totalt: 0Obligatorisk: 0Valfri: 0

Inga parametrar tillgängliga.

Exempel på förfrågningsinnehåll

json
{
  "model": "z-image/turbo"
}

Output Schema

API:et returnerar ett prediction-svar med de genererade utdata-URL:erna.

idstringrequired
Unique identifier for the prediction.
statusstringrequired
Current status of the prediction.
processingcompletedsucceededfailed
modelstringrequired
The model used for generation.
outputsarray[string]
Array of output URLs. Available when status is "completed".
errorstring
Error message if status is "failed".
metricsobject
Performance metrics.
predict_timenumber
Time taken for image generation in seconds.
created_atstringrequired
ISO 8601 timestamp when the prediction was created.
Format: date-time
completed_atstring
ISO 8601 timestamp when the prediction was completed.
Format: date-time

Exempelsvar

json
{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.png"
  ],
  "metrics": {
    "predict_time": 8.3
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills integrerar 300+ AI-modeller direkt i din AI-kodassistent. Ett kommando för att installera, sedan använd naturligt språk för att generera bilder, videor och chatta med LLM.

Stödda klienter

Claude Code
OpenAI Codex
Gemini CLI
Cursor
Windsurf
VS Code
Trae
GitHub Copilot
Cline
Roo Code
Amp
Goose
Replit
40+ stödda klienter

Installera

bash
npx skills add AtlasCloudAI/atlas-cloud-skills

Konfigurera API Key

Hämta din API key från Atlas Cloud-instrumentpanelen och ställ in den som en miljövariabel.

bash
export ATLASCLOUD_API_KEY="your-api-key-here"

Funktioner

När det är installerat kan du använda naturligt språk i din AI-assistent för att komma åt alla Atlas Cloud-modeller.

BildgenereringGenerera bilder med modeller som Nano Banana 2, Z-Image och fler.
VideoskapandeSkapa videor från text eller bilder med Kling, Vidu, Veo m.fl.
LLM-chattChatta med Qwen, DeepSeek och andra stora språkmodeller.
MediauppladdningLadda upp lokala filer för bildredigering och bild-till-video-arbetsflöden.

MCP Server

Atlas Cloud MCP Server ansluter din IDE med 300+ AI-modeller via Model Context Protocol. Fungerar med alla MCP-kompatibla klienter.

Stödda klienter

Cursor
VS Code
Windsurf
Claude Code
OpenAI Codex
Gemini CLI
Cline
Roo Code
100+ stödda klienter

Installera

bash
npx -y atlascloud-mcp

Konfiguration

Lägg till följande konfiguration i din IDE:s MCP-inställningsfil.

json
{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

Tillgängliga verktyg

atlas_generate_imageGenerera bilder från textpromptar.
atlas_generate_videoSkapa videor från text eller bilder.
atlas_chatChatta med stora språkmodeller.
atlas_list_modelsBläddra bland 300+ tillgängliga AI-modeller.
atlas_quick_generateInnehållsskapande i ett steg med automatiskt modellval.
atlas_upload_mediaLadda upp lokala filer för API-arbetsflöden.

API Schema

Schema ej tillgängligt

Logga in för att visa förfrågningshistorik

Du måste vara inloggad för att få tillgång till din modellförfrågningshistorik.

Logga In

Z-Image Turbo - Blixtsnabb Text-till-Bild-Generering

NYT

6 Miljarder Parametermodell från Alibaba TONGYIMAI

Z-Image Turbo är den #1-rankade öppen källkod text-till-bild-modellen som överträffar FLUX.2 [dev], HunyuanImage 3.0 och Qwen-Image i Artificial Analysis Image Arena. Byggd av Alibabas Tongyi-MAI-team (en separat avdelning från Qwen/Wan) uppnår denna 6 miljarders parametermodell generering under en sekund genom avancerad Decoupled-DMD-destillation medan den bibehåller fotorealistisk kvalitet. Med endast 8 inferenssteg ryms den i 16GB VRAM och levererar professionella resultat optimerade för hastighetskritiska produktionsmiljöer.

Ultrasnabb Generering
  • Endast 8 inferenssteg (vs 20-50 för konkurrenter)
  • Generering under en sekund på H800 GPU:er
  • 1.31-1.41× snabbare än Qwen Image per steg
  • Ryms i 16GB VRAM (RTX 3060/4090)
Fotorealistisk Kvalitet
  • #1-rankad öppen källkod-modell på AI Arena
  • Tvåspråkig textrendering (engelska & kinesiska)
  • Robust instruktionsefterlevnad
  • Slår FLUX.1 [dev] och Qwen i alla kategorier

Alibabas Strategiska Modellportfölj

Alibaba erbjuder tre specialiserade AI-bildgenereringssystem, var och en optimerad för olika användningsfall

Hastighetsmästare

Z-Image Turbo

Tongyi-MAI Team

Best For: Hastighetskritiska produktionsarbetsbelastningar
  • ⚡ Snabbast: 8 steg, generering under en sekund
  • 🏆 #1-rankad öppen källkod-modell
  • 💰 Mest kostnadseffektiv ($0.005/bild)
  • 🎯 Optimerad för snabb iteration
Kvalitetskung

Qwen-Image

Qwen Team

Best For: Slutliga renderingar av maximal kvalitet
  • 🎨 Oöverträffad fotorealism & hudtexturer
  • 💡 Överlägsna ljusinteraktioner
  • ⏱️ Långsammare (20s vs 5-10s för Z-Image)
  • 🎯 Bäst för högklassigt produktionsarbete
Mångsidighetsprofi

Wan 2.5/2.6

Wan Team

Best For: Multimedia-mångsidighet
  • 🎬 Text-till-Video + Bild-till-Video
  • 📹 Stöd för flera upplösningar (480P-720P)
  • 🔄 Audio-visuell synkronisering
  • 🎯 Korsmodal innehållsgenerering

Key Insight: Z-Image Turbo är 1.31-1.41× snabbare än Qwen-Image per steg, vilket gör den idealisk för applikationer som kräver snabb generering. Medan Qwen-Image erbjuder något bättre fotorealism för slutliga renderingar, ger Z-Image Turbo den bästa balansen mellan hastighet och kvalitet för produktionsmiljöer.

Tekniska Höjdpunkter

Prestanda
S3-DiT-Arkitektur

Anammar Single-Stream Diffusion Transformer (S3-DiT)-arkitekturen som förenar bearbetningen av olika villkorade ingångar. Denna 6 miljarders parameterdesign uppnår professionella resultat utan beräkningsoverheaden hos större modeller samtidigt som den bibehåller toppmodern kvalitet.

Hastighet
Decoupled-DMD-Destillation

Avancerad destillationsalgoritm med CFG Augmentation och Distribution Matching-mekanismer möjliggör 8-stegs inferens (vs 20-50 för konkurrenter). Uppnår generering under en sekund på H800 GPU:er och körs smidigt på konsument-RTX 3060/4090 med 16GB VRAM.

Kvalitet
Ledande Öppen Källkod-Prestanda

Rankad som #1 öppen källkod-modell i Artificial Analysis Image Arena och slår FLUX.2 [dev], HunyuanImage 3.0 och Qwen-Image. Utmärker sig i tvåspråkig textrendering (engelska & kinesiska), fotorealistisk generering och robust instruktionsföljning. Släppt under Apache 2.0-licens för kommersiellt bruk.

Perfekt För

🎨
Digital Konstskapande
📸
Produktfotografering
📊
Marknadsföringsmaterial
🎬
Konceptkonst
📱
Innehåll för Sociala Medier
🖼️
Stockfotografering
🎮
Speltillgångar
Kreativ Prototypframställning

Varför Välja Z-Image Turbo

Omedelbara Resultat
Generering under en sekund med noll kallstartslatens. Få dina bilder omedelbart utan väntan.
💰
Kostnadseffektiv
Överkomligt pris på $0.005 per bild. Skala dina kreativa projekt utan att spränga budgeten.
🔌
Färdigt API
Enkel REST API-integration. Börja generera bilder på några minuter med vår omfattande dokumentation.

Tekniska Specifikationer

Modellarkitektur6 Miljarder Parametrar
Inferenssteg8 NFEs (Antal Funktionsutvärderingar)
GenereringshastighetUnder en sekund på H800, 5-10s på konsument-GPU:er
VRAM-Krav16GB (RTX 3060/4090-kompatibel)
ArkitekturSingle-Stream Diffusion Transformer (S3-DiT)
DestillationsmetodDecoupled-DMD med CFG Augmentation
LicensApache 2.0 (Kommersiellt Bruk Tillåtet)
Ranking#1 Öppen Källkod på Artificial Analysis Arena
Prissättning$0.005 per Bild

Börja Skapa med Z-Image Turbo

Upplev blixtsnabb, fotorealistisk bildgenerering idag. Ingen installation krävs, ring bara vårt API och börja skapa.

Inga kallstarter - omedelbar generering
Överkomligt pris - $0.005 per bild
Professionella kvalitetsresultat

Z-Image-Turbo — 6B-parameter, ultra-fast text-to-image

Z-Image-Turbo is a 6B-parameter text-to-image model from Tongyi-MAI, engineered for production workloads where latency and throughput really matter. It uses only 8 sampling steps to render a full image, achieving sub-second latency on data-center GPUs and running comfortably on many 16 GB VRAM consumer cards.

Ultra-fast generation with production-ready quality

Where many diffusion models need dozens of steps, Z-Image-Turbo is aggressively optimised around an 8-step sampler. That keeps inference extremely fast while still delivering photorealistic images and reliable on-image text, making it a strong fit for interactive products, dashboards, and large-scale backends—not just offline batch jobs.

Why it looks so good?

  • Photorealistic output at speed Generates high-fidelity, realistic images that work for product photos, hero banners, and UI visuals without multi-second waits.
  • Bilingual prompts and text Understands prompts in English and Chinese, and can render multilingual text directly in the image—helpful for cross-market campaigns, posters, and screenshots.
  • Low-latency, low-step design Only 8 function evaluations per image deliver extremely low latency, ideal for chatbots, configuration tools, design assistants, and any “click → image” experience.
  • Friendly VRAM footprint Runs well in 16 GB VRAM environments, reducing hardware costs and making local or edge deployments more realistic.
  • Scales for bulk generation Its efficiency makes large jobs—catalogues, continuous feed images, or auto-generated thumbnails—practical without blowing up compute budgets.
  • Reproducible generations A controllable seed parameter lets you recreate a previous image or generate small, controlled variations for brand safety and experimentation.

How to use

  • prompt – natural-language description of the scene, style, and any on-image text (English or Chinese).
  • size (width / height) – choose the output resolution; supports square and rectangular images up to high resolutions (for example, 1536 × 1536).
  • seed – set to -1 for random results, or use a fixed integer to make outputs reproducible.

Pricing

Simple per-image billing:

  • Without prompt rewriting (prompt_extend=false): $0.015 per generated image
  • With prompt rewriting (prompt_extend=true): $0.03 per generated image

Try more models and see their difference!

  • Nano Banana Pro – Text-to-Image – Google’s Nano Banana Pro (Gemini 3.0 Pro Image family) delivers high-quality multi-image generation with extremely low cost per image, ideal for large-scale applications.
  • Seedream V4 – Text-to-Image – ByteDance’s high-resolution text-to-image model with rich detail and diverse styles, well suited for creative illustration and commercial visuals.
  • FLUX.2 [dev] – Text-to-Image – A lightweight FLUX.2-based base model hosted by AtlasCloud, optimised for efficient inference and LoRA-friendly training.

Paper

Tongyi-MAI/Z-Image-Turbo

Börja från 300+ Modeller,

Utforska alla modeller

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.