Z-Image-Turbo is a 6 billion parameter text-to-image model that generates photorealistic images in sub-second time. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.
Z-Image-Turbo is a 6 billion parameter text-to-image model that generates photorealistic images in sub-second time. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.
Z-Image-Turbo is a 6B-parameter text-to-image model from Tongyi-MAI, engineered for production workloads where latency and throughput really matter. It uses only 8 sampling steps to render a full image, achieving sub-second latency on data-center GPUs and running comfortably on many 16 GB VRAM consumer cards.
Where many diffusion models need dozens of steps, Z-Image-Turbo is aggressively optimised around an 8-step sampler. That keeps inference extremely fast while still delivering photorealistic images and reliable on-image text, making it a strong fit for interactive products, dashboards, and large-scale backends—not just offline batch jobs.
Simple per-image billing:
Modelo de 6 Bilhões de Parâmetros da Alibaba TONGYIMAI
Z-Image Turbo é o modelo de texto para imagem de código aberto classificado como #1, superando FLUX.2 [dev], HunyuanImage 3.0 e Qwen-Image no Artificial Analysis Image Arena. Construído pela equipe Tongyi-MAI da Alibaba (uma divisão separada de Qwen/Wan), este modelo de 6 bilhões de parâmetros alcança geração em menos de um segundo através de destilação avançada Decoupled-DMD mantendo qualidade fotorrealista. Com apenas 8 passos de inferência, cabe em 16GB VRAM e entrega resultados profissionais otimizados para ambientes de produção críticos em velocidade.
A Alibaba oferece três sistemas especializados de geração de imagens IA, cada um otimizado para diferentes casos de uso
Equipe Tongyi-MAI
Equipe Qwen
Equipe Wan
Key Insight: Z-Image Turbo é 1.31-1.41× mais rápido que Qwen-Image por passo, tornando-o ideal para aplicações que requerem geração rápida. Embora Qwen-Image ofereça fotorrealismo ligeiramente melhor para renderizações finais, Z-Image Turbo proporciona o melhor equilíbrio entre velocidade e qualidade para ambientes de produção.
Adota a arquitetura Single-Stream Diffusion Transformer (S3-DiT) que unifica o processamento de diversas entradas condicionais. Este design de 6 bilhões de parâmetros alcança resultados profissionais sem a sobrecarga computacional de modelos maiores enquanto mantém qualidade de ponta.
Algoritmo de destilação avançado com mecanismos de CFG Augmentation e Distribution Matching permite inferência de 8 passos (vs 20-50 para concorrentes). Alcança geração em menos de um segundo em GPUs H800 e roda suavemente em RTX 3060/4090 de consumo com 16GB VRAM.
Classificado como modelo de código aberto #1 no Artificial Analysis Image Arena, superando FLUX.2 [dev], HunyuanImage 3.0 e Qwen-Image. Destaca-se em renderização de texto bilíngue (inglês e chinês), geração fotorrealista e seguimento robusto de instruções. Lançado sob licença Apache 2.0 para uso comercial.
Experimente geração de imagens fotorrealistas ultrarrápida hoje. Sem configuração necessária, apenas chame nossa API e comece a criar.
Tudo no Atlas Cloud.