Z-Image-Turbo is a 6 billion parameter text-to-image model that generates photorealistic images in sub-second time. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.
Z-Image-Turbo is a 6 billion parameter text-to-image model that generates photorealistic images in sub-second time. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.
Z-Image-Turbo is a 6B-parameter text-to-image model from Tongyi-MAI, engineered for production workloads where latency and throughput really matter. It uses only 8 sampling steps to render a full image, achieving sub-second latency on data-center GPUs and running comfortably on many 16 GB VRAM consumer cards.
Where many diffusion models need dozens of steps, Z-Image-Turbo is aggressively optimised around an 8-step sampler. That keeps inference extremely fast while still delivering photorealistic images and reliable on-image text, making it a strong fit for interactive products, dashboards, and large-scale backends—not just offline batch jobs.
Simple per-image billing:
Alibaba TONGYIMAI チームによる 60 億パラメータモデル
Z-Image Turbo は、Artificial Analysis Image Arena で FLUX.2 [dev]、HunyuanImage 3.0、Qwen-Image を上回る第 1 位のオープンソーステキスト to 画像モデルです。Alibaba の通義万相チーム(Qwen/Wan とは別部門)が構築したこの 60 億パラメータモデルは、先進的な Decoupled-DMD 蒸留により、写真のようなクオリティを維持しながら 1 秒未満の生成を実現します。推論ステップはわずか 8 回で、16GB VRAM に収まり、速度重視の本番環境向けにプロフェッショナルな結果を提供します。
Alibaba は、それぞれ異なるユースケースに最適化された 3 つの専門的な AI 画像生成システムを提供しています
通義万相チーム
Qwen チーム
Wan チーム
Key Insight: Z-Image Turbo は Qwen-Image より 1 ステップあたり 1.31-1.41 倍高速で、高速生成を必要とするアプリケーションに最適です。最終レンダリングの写真リアリズムでは Qwen-Image がやや優れていますが、Z-Image Turbo は本番環境において速度と品質の最適なバランスを提供します。
さまざまな条件入力の処理を統一する Single-Stream Diffusion Transformer(S3-DiT)アーキテクチャを採用。この 60 億パラメータ設計は、大規模モデルの計算オーバーヘッドなしにプロフェッショナルな結果を実現し、最先端の品質を維持します。
CFG 拡張と分布マッチングメカニズムを備えた先進的な蒸留アルゴリズムにより、8 ステップ推論を実現(競合は 20-50 ステップ)。H800 GPU で 1 秒未満の生成を達成し、16GB VRAM のコンシューマー向け RTX 3060/4090 でスムーズに動作します。
Artificial Analysis Image Arena でオープンソースモデル第 1 位にランク、FLUX.2 [dev]、HunyuanImage 3.0、Qwen-Image を凌駕。英語と中国語のバイリンガルテキストレンダリング、写真のような生成、強力な指示追従に優れています。商用利用可能な Apache 2.0 ライセンスでリリース。
超高速で写真のような画像生成を今すぐ体験。セットアップ不要、API を呼び出すだけで制作を開始できます。
Atlas Cloudでのみ。