Z-Image-Turbo is a 6 billion parameter text-to-image model that generates photorealistic images in sub-second time. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.
Z-Image-Turbo is a 6 billion parameter text-to-image model that generates photorealistic images in sub-second time. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.
Z-Image-Turbo is a 6B-parameter text-to-image model from Tongyi-MAI, engineered for production workloads where latency and throughput really matter. It uses only 8 sampling steps to render a full image, achieving sub-second latency on data-center GPUs and running comfortably on many 16 GB VRAM consumer cards.
Where many diffusion models need dozens of steps, Z-Image-Turbo is aggressively optimised around an 8-step sampler. That keeps inference extremely fast while still delivering photorealistic images and reliable on-image text, making it a strong fit for interactive products, dashboards, and large-scale backends—not just offline batch jobs.
Simple per-image billing:
阿里巴巴通義萬相團隊 60 億參數模型
Z-Image Turbo 是排名第一的開源文生圖模型,在 Artificial Analysis Image Arena 上超越了 FLUX.2 [dev]、HunyuanImage 3.0 和 Qwen-Image。由阿里巴巴通義萬相團隊(獨立於 Qwen/Wan 團隊)打造,這款 60 億參數模型透過先進的 Decoupled-DMD 蒸餾技術實現亞秒級生成,同時保持逼真的圖像品質。僅需 8 個推理步驟,適配 16GB 顯存,為速度關鍵的生產環境提供專業級結果。
阿里巴巴提供三大專業 AI 圖像生成系統,各自針對不同應用場景優化
通義萬相團隊
通義千問團隊
通義萬相團隊
Key Insight: Z-Image Turbo 比 Qwen-Image 每步快 1.31-1.41 倍,非常適合需要快速生成的應用場景。雖然 Qwen-Image 在最終渲染的真實感方面略勝一籌,但 Z-Image Turbo 在生產環境中提供了速度和品質的最佳平衡。
採用單流擴散 Transformer(S3-DiT)架構,統一處理各種條件輸入。這種 60 億參數設計在不增加大模型計算開銷的情況下實現專業級結果,同時保持最先進的品質。
先進的蒸餾演算法配合 CFG 增強和分佈匹配機制,實現 8 步推理(競品需 20-50 步)。在 H800 GPU 上實現亞秒級生成,在消費級 RTX 3060/4090(16GB 顯存)上流暢運行。
在 Artificial Analysis Image Arena 上排名第一的開源模型,超越 FLUX.2 [dev]、HunyuanImage 3.0 和 Qwen-Image。擅長中英文雙語文本渲染、逼真圖像生成和強大的指令遵循。採用 Apache 2.0 許可證,允許商業使用。
體驗極速、逼真的圖像生成。無需設定,呼叫我們的 API 即可開始創作。
盡在 Atlas Cloud。