z-image/turbo

Texto a Imagen

TURBO

Z-Image Turbo API by Alibaba

z-image/turbo

Turbo

Z-Image-Turbo is a 6 billion parameter text-to-image model that generates photorealistic images in sub-second time. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Entrada

Cargando configuración de parámetros...

Salida

Inactivo

Las imágenes generadas se mostrarán aquí

Configura los parámetros y haz clic en ejecutar para comenzar a generar

Cada ejecución costará $0.01. Con $10 puedes ejecutar aproximadamente 1000 veces.

Puedes continuar con:

Imagen a Video Imagen a Imagen

Parámetros

Ejemplo de código
import requests
import time

# Step 1: Start image generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "z-image/turbo",
    "prompt": "A beautiful landscape with mountains and lake",
    "width": 512,
    "height": 512,
    "steps": 20,
    "guidance_scale": 7.5,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] == "completed":
            print("Generated image:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

image_url = check_status()

Instalar

Instala el paquete de dependencias necesario.

pip install requests

Autenticación

Todas las solicitudes de API requieren autenticación mediante una clave de API. Puedes obtener tu clave de API desde el panel de Atlas Cloud.

export ATLASCLOUD_API_KEY="your-api-key-here"

Encabezados HTTP

import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}

Mantén tu clave de API segura

Nunca expongas tu clave de API en código del lado del cliente ni en repositorios públicos. Usa variables de entorno o un proxy de backend en su lugar.

Enviar una solicitud

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Enviar una solicitud

Envía una solicitud de generación asíncrona. La API devuelve un ID de predicción que puedes usar para verificar el estado y obtener el resultado.

POST/api/v1/model/generateImage

Cuerpo de la solicitud

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "z-image/turbo",
    "prompt": "A beautiful landscape with mountains and lake"
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['data']['id']}")
print(f"Status: {result['data']['status']}")

Respuesta

{
  "code": 200,
  "data": {
    "id": "pred_abc123",
    "status": "processing",
    "model": "model-name",
    "created_at": "2025-01-01T00:00:00Z"
  }
}

Verificar estado

Consulta el endpoint de predicción para verificar el estado actual de tu solicitud.

GET/api/v1/model/prediction/{prediction_id}

Ejemplo de polling

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

Valores de estado

processingLa solicitud aún se está procesando.

completedLa generación está completa. Las salidas están disponibles.

succeededLa generación fue exitosa. Las salidas están disponibles.

failedLa generación falló. Verifica el campo de error.

Respuesta completada

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.png"
    ],
    "metrics": {
      "predict_time": 8.3
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

Subir archivos

Sube archivos al almacenamiento de Atlas Cloud y obtén una URL que puedes usar en tus solicitudes de API. Usa multipart/form-data para subir.

POST/api/v1/model/uploadMedia

Ejemplo de carga

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

Respuesta

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

Schema de entrada

Los siguientes parámetros se aceptan en el cuerpo de la solicitud.

Total: 0Obligatorio: 0Opcional: 0

No hay parámetros disponibles.

Ejemplo de cuerpo de solicitud

{
  "model": "z-image/turbo"
}

Schema de salida

La API devuelve una respuesta de predicción con las URL de salida generadas.

idstringrequired

Unique identifier for the prediction.

statusstringrequired

Current status of the prediction.

processingcompletedsucceededfailed

modelstringrequired

The model used for generation.

outputsarray[string]

Array of output URLs. Available when status is "completed".

errorstring

Error message if status is "failed".

metricsobject

Performance metrics.

predict_timenumber

Time taken for image generation in seconds.

created_atstringrequired

ISO 8601 timestamp when the prediction was created.

Format: date-time

completed_atstring

ISO 8601 timestamp when the prediction was completed.

Format: date-time

Ejemplo de respuesta

{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.png"
  ],
  "metrics": {
    "predict_time": 8.3
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills integra más de 300 modelos de IA directamente en tu asistente de codificación con IA. Un solo comando para instalar y luego usa lenguaje natural para generar imágenes, videos y chatear con LLM.

Clientes compatibles

Claude Code

OpenAI Codex

Gemini CLI

Cursor

Windsurf

VS Code

Trae

GitHub Copilot

Cline

Roo Code

Amp

Goose

Replit

40+ clientes compatibles

Instalar

npx skills add AtlasCloudAI/atlas-cloud-skills

Configurar clave de API

Obtén tu clave de API desde el panel de Atlas Cloud y configúrala como variable de entorno.

export ATLASCLOUD_API_KEY="your-api-key-here"

Funcionalidades

Una vez instalado, puedes usar lenguaje natural en tu asistente de IA para acceder a todos los modelos de Atlas Cloud.

Generación de imágenesGenera imágenes con modelos como Nano Banana 2, Z-Image y más.

Creación de videosCrea videos a partir de texto o imágenes con Kling, Vidu, Veo, etc.

Chat con LLMChatea con Qwen, DeepSeek y otros modelos de lenguaje de gran escala.

Carga de mediosSube archivos locales para flujos de trabajo de edición de imágenes e imagen a video.

Más información

github.com/AtlasCloudAI/atlas-cloud-skills

MCP Server

Atlas Cloud MCP Server conecta tu IDE con más de 300 modelos de IA a través del Model Context Protocol. Funciona con cualquier cliente compatible con MCP.

Clientes compatibles

Cursor

VS Code

Windsurf

Claude Code

OpenAI Codex

Gemini CLI

Cline

Roo Code

100+ clientes compatibles

Instalar

npx -y atlascloud-mcp

Configuración

Agrega la siguiente configuración al archivo de configuración de MCP de tu IDE.

{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

Herramientas disponibles

atlas_generate_imageGenera imágenes a partir de indicaciones de texto.

atlas_generate_videoCrea videos a partir de texto o imágenes.

atlas_chatChatea con modelos de lenguaje de gran escala.

atlas_list_modelsExplora más de 300 modelos de IA disponibles.

atlas_quick_generateCreación de contenido en un solo paso con selección automática de modelo.

atlas_upload_mediaSube archivos locales para flujos de trabajo de API.

Más información

github.com/AtlasCloudAI/mcp-server

API Schema

Schema no disponible

Sin ejemplos disponibles

Cargando...

Z-Image Turbo - Generación de Texto a Imagen Ultrarrápida

NUEVO

Modelo de 6 Mil Millones de Parámetros de Alibaba TONGYIMAI

Z-Image Turbo es el modelo de texto a imagen de código abierto clasificado #1, superando a FLUX.2 [dev], HunyuanImage 3.0 y Qwen-Image en el Artificial Analysis Image Arena. Construido por el equipo Tongyi-MAI de Alibaba (una división separada de Qwen/Wan), este modelo de 6 mil millones de parámetros logra generación en menos de un segundo mediante destilación avanzada Decoupled-DMD mientras mantiene calidad fotorrealista. Con solo 8 pasos de inferencia, se ajusta a 16GB VRAM y entrega resultados profesionales optimizados para entornos de producción críticos en velocidad.

Generación Ultrarrápida

Solo 8 pasos de inferencia (vs 20-50 de competidores)
Generación en menos de un segundo en GPUs H800
1.31-1.41× más rápido que Qwen Image por paso
Cabe en 16GB VRAM (RTX 3060/4090)

Calidad Fotorrealista

Modelo de código abierto clasificado #1 en AI Arena
Renderizado de texto bilingüe (inglés y chino)
Adherencia robusta a instrucciones
Supera a FLUX.1 [dev] y Qwen en todas las categorías

Portafolio Estratégico de Modelos de Alibaba

Alibaba ofrece tres sistemas especializados de generación de imágenes IA, cada uno optimizado para diferentes casos de uso

Campeón de Velocidad

Z-Image Turbo

Equipo Tongyi-MAI

Best For: Cargas de trabajo de producción críticas en velocidad

⚡ Más rápido: 8 pasos, generación en menos de un segundo
🏆 Modelo de código abierto clasificado #1
💰 Más rentable ($0.005/imagen)
🎯 Optimizado para iteración rápida

Rey de Calidad

Qwen-Image

Equipo Qwen

Best For: Renderizados finales de máxima calidad

🎨 Fotorrealismo y texturas de piel incomparables
💡 Interacciones de iluminación superiores
⏱️ Más lento (20s vs 5-10s para Z-Image)
🎯 Mejor para trabajo de producción de alta gama

Pro de Versatilidad

Wan 2.5/2.6

Equipo Wan

Best For: Versatilidad multimedia

🎬 Texto a Video + Imagen a Video
📹 Soporte multiresolución (480P-720P)
🔄 Sincronización audiovisual
🎯 Generación de contenido multimodal

Key Insight: Z-Image Turbo es 1.31-1.41× más rápido que Qwen-Image por paso, lo que lo hace ideal para aplicaciones que requieren generación rápida. Aunque Qwen-Image ofrece un fotorrealismo ligeramente mejor para renderizados finales, Z-Image Turbo proporciona el mejor equilibrio entre velocidad y calidad para entornos de producción.

Aspectos Técnicos Destacados

Rendimiento

Arquitectura S3-DiT

Adopta la arquitectura Single-Stream Diffusion Transformer (S3-DiT) que unifica el procesamiento de diversas entradas condicionales. Este diseño de 6 mil millones de parámetros logra resultados profesionales sin la sobrecarga computacional de modelos más grandes mientras mantiene calidad de vanguardia.

Velocidad

Destilación Decoupled-DMD

Algoritmo de destilación avanzado con mecanismos de CFG Augmentation y Distribution Matching permite inferencia de 8 pasos (vs 20-50 para competidores). Logra generación en menos de un segundo en GPUs H800 y funciona sin problemas en RTX 3060/4090 de consumo con 16GB VRAM.

Calidad

Rendimiento Líder en Código Abierto

Clasificado como modelo de código abierto #1 en Artificial Analysis Image Arena, superando a FLUX.2 [dev], HunyuanImage 3.0 y Qwen-Image. Destaca en renderizado de texto bilingüe (inglés y chino), generación fotorrealista y seguimiento robusto de instrucciones. Lanzado bajo licencia Apache 2.0 para uso comercial.

Perfecto Para

🎨

Creación de Arte Digital

📸

Fotografía de Productos

📊

Materiales de Marketing

🎬

Arte Conceptual

📱

Contenido de Redes Sociales

🖼️

Fotografía de Stock

🎮

Activos de Juegos

✨

Prototipado Creativo

Por Qué Elegir Z-Image Turbo

⚡

Resultados Instantáneos

Generación en menos de un segundo con latencia de arranque en frío cero. Obtén tus imágenes inmediatamente sin esperar.

💰

Rentable

Precio asequible de $0.005 por imagen. Escala tus proyectos creativos sin salirte del presupuesto.

🔌

API Lista para Usar

Integración simple de REST API. Comienza a generar imágenes en minutos con nuestra documentación completa.

Especificaciones Técnicas

Arquitectura del Modelo6 Mil Millones de Parámetros

Pasos de Inferencia8 NFEs (Número de Evaluaciones de Función)

Velocidad de GeneraciónMenos de un segundo en H800, 5-10s en GPUs de consumo

Requisito de VRAM16GB (compatible con RTX 3060/4090)

ArquitecturaTransformador de difusión de flujo único (S3-DiT)

Método de DestilaciónDecoupled-DMD con CFG Augmentation

LicenciaApache 2.0 (Uso Comercial Permitido)

Clasificación#1 de Código Abierto en Artificial Analysis Arena

Precio$0.005 por Imagen

Comienza a Crear con Z-Image Turbo

Experimenta generación de imágenes fotorrealistas ultrarrápida hoy. Sin configuración requerida, solo llama a nuestra API y comienza a crear.

Sin arranques en frío - generación instantánea

Precio asequible - $0.005 por imagen

Resultados de calidad profesional

Z-Image-Turbo — 6B-parameter, ultra-fast text-to-image

Z-Image-Turbo is a 6B-parameter text-to-image model from Tongyi-MAI, engineered for production workloads where latency and throughput really matter. It uses only 8 sampling steps to render a full image, achieving sub-second latency on data-center GPUs and running comfortably on many 16 GB VRAM consumer cards.

Ultra-fast generation with production-ready quality

Where many diffusion models need dozens of steps, Z-Image-Turbo is aggressively optimised around an 8-step sampler. That keeps inference extremely fast while still delivering photorealistic images and reliable on-image text, making it a strong fit for interactive products, dashboards, and large-scale backends—not just offline batch jobs.

Why it looks so good?

Photorealistic output at speed Generates high-fidelity, realistic images that work for product photos, hero banners, and UI visuals without multi-second waits.
Bilingual prompts and text Understands prompts in English and Chinese, and can render multilingual text directly in the image—helpful for cross-market campaigns, posters, and screenshots.
Low-latency, low-step design Only 8 function evaluations per image deliver extremely low latency, ideal for chatbots, configuration tools, design assistants, and any “click → image” experience.
Friendly VRAM footprint Runs well in 16 GB VRAM environments, reducing hardware costs and making local or edge deployments more realistic.
Scales for bulk generation Its efficiency makes large jobs—catalogues, continuous feed images, or auto-generated thumbnails—practical without blowing up compute budgets.
Reproducible generations A controllable seed parameter lets you recreate a previous image or generate small, controlled variations for brand safety and experimentation.

How to use

prompt – natural-language description of the scene, style, and any on-image text (English or Chinese).
size (width / height) – choose the output resolution; supports square and rectangular images up to high resolutions (for example, 1536 × 1536).
seed – set to -1 for random results, or use a fixed integer to make outputs reproducible.

Pricing

Simple per-image billing:

Without prompt rewriting (prompt_extend=false): $0.015 per generated image
With prompt rewriting (prompt_extend=true): $0.03 per generated image

Try more models and see their difference!

Nano Banana Pro – Text-to-Image – Google’s Nano Banana Pro (Gemini 3.0 Pro Image family) delivers high-quality multi-image generation with extremely low cost per image, ideal for large-scale applications.
Seedream V4 – Text-to-Image – ByteDance’s high-resolution text-to-image model with rich detail and diverse styles, well suited for creative illustration and commercial visuals.
FLUX.2 [dev] – Text-to-Image – A lightweight FLUX.2-based base model hosted by AtlasCloud, optimised for efficient inference and LoRA-friendly training.

Paper

Tongyi-MAI/Z-Image-Turbo

Explorar Modelos Similares

NEW

Texto a Imagen

Openai GPT Image 2 Text-to-Image

GPT Image 2 text to image is OpenAI's fast, cost-efficient text-to-image generator powered by GPT-5 guidance. Create photorealistic shots, product renders, concept art, and stylized graphics from natural-language prompts (optionally conditioned with an image). Supports custom aspect ratios, seeds, negative prompts, hex color hints, and style presets. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Openai GPT Image 2 Edit

GPT Image 2 Edit is OpenAI's image model for precise, natural-language edits. Add/remove objects, swap backgrounds, retouch faces, adjust colors/lighting, edit text/graphics, crop/resize, and apply hex color control. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

GPT Image 2 Developer Edit

GPT Image 2 Developer Edit applies natural-language instructions to one or more reference images, with common aspect ratios and 1k, 2k, or supported 4k output tiers. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

GPT Image 2 Developer Text-to-Image

GPT Image 2 Developer Text-to-Image generates polished visuals from natural-language prompts, with common aspect ratios and 1k, 2k, or supported 4k output tiers. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

MAI-Image-2.5-Flash Text-to-image

Microsoft's fast, cost-optimized text-to-image generation model, creating high-quality images at lower cost using the same diffusion-based architecture as MAI-Image-2.5.

MAI-Image-2.5 Edit

Microsoft's flagship image-to-image editing model, enabling precise, controllable edits to existing images through natural language instructions.

MAI-Image-2.5 Text-to-image

Microsoft's flagship text-to-image generation model, designed to create high-quality, visually rich images from natural language prompts.

Midjourney V8.1 Remove Background

Midjourney automatically removes the background from an input image, returning one transparent-background result.

Midjourney V8.1 Style Transfer

Midjourney retexture changes the artistic style of an input image while preserving its composition, returning four restyled results.

Midjourney V8.1 Blend

Midjourney V8.1 blends two to five input images into four fused results, with an optional guiding prompt and native 2K HD.

Midjourney V8.1 Image-to-Image

Midjourney V8.1 re-imagines an input image guided by a text prompt, returning four variations. Supports native 2K HD, style reference, and aspect-ratio / stylize / chaos / weird controls.

Seed3D 2.0 Image-to-3D

ByteDance Seed3D 2.0 — generates a textured, PBR-shaded 3D model (glb/obj/usd/usdz) from a single input image. Returns a downloadable .zip archive containing the 3D file.

Midjourney V8.1 Text-to-Image

Midjourney V8.1 generates four images from a text prompt, with optional native 2K HD, a style reference, and aspect-ratio / stylize / chaos / weird controls.

Hunyuan 3D Rapid Image-to-3D

Tencent Hunyuan 3D Rapid (Express) — fast lightweight 3D mesh generation from a single image, with optional PBR materials. Outputs GLB/OBJ/USDZ/FBX/STL/MP4.

Hunyuan 3D Rapid Text-to-3D

Tencent Hunyuan 3D Rapid (Express) — fast lightweight 3D mesh generation from a text prompt, with optional PBR materials. Outputs GLB/OBJ/USDZ/FBX/STL/MP4.

Hunyuan 3D Pro Image-to-3D

Tencent Hunyuan 3D Pro (v3.1) — high-quality textured 3D mesh generation from a single image, with optional PBR materials and custom face count. Outputs GLB/OBJ/USDZ/FBX/STL.

IMAGE-TO-3D

From

$0.02/imagen

Una sola API para toda la IA multimedia.

Explorar Todos los Modelos

Z-Image Turbo API by Alibaba

Entrada

Salida

Parámetros

Ejemplo de código

Instalar

Autenticación

Encabezados HTTP

Enviar una solicitud

Enviar una solicitud

Cuerpo de la solicitud

Respuesta

Verificar estado

Ejemplo de polling

Valores de estado

Respuesta completada

Subir archivos

Ejemplo de carga

Respuesta

Schema de entrada

Ejemplo de cuerpo de solicitud

Schema de salida

Ejemplo de respuesta

Atlas Cloud Skills

Clientes compatibles

Instalar

Configurar clave de API

Funcionalidades

MCP Server

Clientes compatibles

Instalar

Configuración

Herramientas disponibles

API Schema

Z-Image Turbo - Generación de Texto a Imagen Ultrarrápida

Portafolio Estratégico de Modelos de Alibaba

Z-Image Turbo

Qwen-Image

Wan 2.5/2.6

Aspectos Técnicos Destacados

Perfecto Para

Por Qué Elegir Z-Image Turbo

Resultados Instantáneos

Rentable

API Lista para Usar

Especificaciones Técnicas

Comienza a Crear con Z-Image Turbo

Z-Image-Turbo — 6B-parameter, ultra-fast text-to-image

Ultra-fast generation with production-ready quality

Why it looks so good?

How to use

Pricing

Try more models and see their difference!

Paper

Explorar Modelos Similares

Openai GPT Image 2 Text-to-Image

Openai GPT Image 2 Edit

GPT Image 2 Developer Edit

GPT Image 2 Developer Text-to-Image

MAI-Image-2.5-Flash Text-to-image

MAI-Image-2.5 Edit

MAI-Image-2.5 Text-to-image

Midjourney V8.1 Remove Background

Midjourney V8.1 Style Transfer

Midjourney V8.1 Blend

Midjourney V8.1 Image-to-Image

Seed3D 2.0 Image-to-3D

Midjourney V8.1 Text-to-Image

Hunyuan 3D Rapid Image-to-3D

Hunyuan 3D Rapid Text-to-3D

Hunyuan 3D Pro Image-to-3D

Una sola API para toda la IA multimedia.

Join our Discord community

Entrada

Salida

Parámetros

Ejemplo de código

Instalar

Autenticación

Encabezados HTTP