Z-Image-Turbo is a 6 billion parameter text-to-image model that generates photorealistic images in sub-second time. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.
Z-Image-Turbo is a 6 billion parameter text-to-image model that generates photorealistic images in sub-second time. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.
Z-Image-Turbo is a 6B-parameter text-to-image model from Tongyi-MAI, engineered for production workloads where latency and throughput really matter. It uses only 8 sampling steps to render a full image, achieving sub-second latency on data-center GPUs and running comfortably on many 16 GB VRAM consumer cards.
Where many diffusion models need dozens of steps, Z-Image-Turbo is aggressively optimised around an 8-step sampler. That keeps inference extremely fast while still delivering photorealistic images and reliable on-image text, making it a strong fit for interactive products, dashboards, and large-scale backends—not just offline batch jobs.
Simple per-image billing:
阿里巴巴通义万相团队 60 亿参数模型
Z-Image Turbo 是排名第一的开源文生图模型,在 Artificial Analysis Image Arena 上超越了 FLUX.2 [dev]、HunyuanImage 3.0 和 Qwen-Image。由阿里巴巴通义万相团队(独立于 Qwen/Wan 团队)打造,这款 60 亿参数模型通过先进的 Decoupled-DMD 蒸馏技术实现亚秒级生成,同时保持逼真的图像质量。仅需 8 个推理步骤,适配 16GB 显存,为速度关键的生产环境提供专业级结果。
阿里巴巴提供三大专业 AI 图像生成系统,各自针对不同应用场景优化
通义万相团队
通义千问团队
通义万相团队
Key Insight: Z-Image Turbo 比 Qwen-Image 每步快 1.31-1.41 倍,非常适合需要快速生成的应用场景。虽然 Qwen-Image 在最终渲染的真实感方面略胜一筹,但 Z-Image Turbo 在生产环境中提供了速度和质量的最佳平衡。
采用单流扩散 Transformer(S3-DiT)架构,统一处理各种条件输入。这种 60 亿参数设计在不增加大模型计算开销的情况下实现专业级结果,同时保持最先进的质量。
先进的蒸馏算法配合 CFG 增强和分布匹配机制,实现 8 步推理(竞品需 20-50 步)。在 H800 GPU 上实现亚秒级生成,在消费级 RTX 3060/4090(16GB 显存)上流畅运行。
在 Artificial Analysis Image Arena 上排名第一的开源模型,超越 FLUX.2 [dev]、HunyuanImage 3.0 和 Qwen-Image。擅长中英文双语文本渲染、逼真图像生成和强大的指令遵循。采用 Apache 2.0 许可证,允许商业使用。
体验极速、逼真的图像生成。无需设置,调用我们的 API 即可开始创作。
尽在 Atlas Cloud。