z-image/turbo-lora

Z-Image-Turbo LoRA (6B) enables ultra-fast text-to-image generation with external LoRA support. Generate photorealistic images in sub-second latency while applying up to 3 LoRAs for custom styles. Ready-to-use REST API, best performance, no coldstarts, affordable pricing.

TEXT-TO-IMAGENEWHOT
文生图

Z-Image-Turbo LoRA (6B) enables ultra-fast text-to-image generation with external LoRA support. Generate photorealistic images in sub-second latency while applying up to 3 LoRAs for custom styles. Ready-to-use REST API, best performance, no coldstarts, affordable pricing.

Z-Image-Turbo LoRA — 6B-parameter, ultra-fast text-to-image with custom styles

Z-Image-Turbo LoRA is a personalised version of Tongyi-MAI’s 6B-parameter Z-Image-Turbo model. It keeps the same 8-step, ultra-fast sampler and low VRAM footprint, while letting you plug in up to three LoRA adapters to inject your own styles, characters, or brand identity into each generation.

Ultra-fast generation with LoRA personalisation

Where many diffusion models need dozens of steps, Z-Image-Turbo LoRA stays aggressively optimised around 8 sampling steps. On top of that, it adds LoRA hooks so you can steer the visual style without retraining the base model—perfect for interactive products, dashboards, and large-scale backends that still need a branded look.

Why it looks so good

  • Photorealistic output at speed Generates high-fidelity, realistic images suitable for product photos, hero banners, and UI visuals—now with your own LoRA styles layered on top.
  • Bilingual prompts and text Understands prompts in English and Chinese, and can render multilingual on-image text, ideal for cross-market campaigns and UI screenshots.
  • LoRA-powered customisation Attach up to 3 LoRAs per request to add a specific art style, character look, or brand aesthetics without touching the base weights.
  • Low-latency, low-step design Only 8 function evaluations per image deliver extremely low latency, ideal for chatbots, configuration tools, design assistants, and any “type → image” workflow.
  • Friendly VRAM footprint Runs well in 16 GB VRAM environments, reducing hardware costs and making local or edge deployments more realistic—even with LoRAs enabled.
  • Scales for bulk generation The efficient sampler keeps large jobs—catalogues, continuous feeds, or mass thumbnail generation—practical, even when every image uses one or more LoRAs.
  • Reproducible generations A controllable seed parameter lets you recreate previous images or generate small, controlled variations for brand safety and experimentation.

How to use

  • prompt – natural-language description of the scene, style, and any on-image text (English or Chinese).
  • size (width / height) – choose the output resolution that fits your use case.
  • seed – set to -1 for random results, or use a fixed integer to make outputs reproducible.
  • loras – optional list of up to three LoRA adapters:
    • path – a LoRA identifier such as owner/model-name or a direct .safetensors URL.
    • scale – numeric strength for that LoRA; higher values apply a stronger stylistic effect.

You can click “Add Item” in the loras panel to add 1–3 LoRAs. They are combined during generation, so a single prompt can mix, for example, a character LoRA, a style LoRA, and a brand-colour LoRA.

For detailed, step-by-step guidance on finding, uploading, and using LoRAs on AtlasCloud, see our LoRA tutorials How to use LoRA.

Pricing

Simple per-image billing:

  • $0.008 per generated image

详细规格

概览:

模型提供商:TONGYIMAI
模型类型:text-to-image
部署方式:推理 API;Playground
定价:$0.01/pic

关键参数:

尺寸上限:最大宽度 × 高度(用户可配置)
LoRA 支持:
种子选项:N/A

创作你的下一件杰作

Z-Image Turbo - 极速文生图模型

最新

阿里巴巴通义万相团队 60 亿参数模型

Z-Image Turbo 是排名第一的开源文生图模型,在 Artificial Analysis Image Arena 上超越了 FLUX.2 [dev]、HunyuanImage 3.0 和 Qwen-Image。由阿里巴巴通义万相团队(独立于 Qwen/Wan 团队)打造,这款 60 亿参数模型通过先进的 Decoupled-DMD 蒸馏技术实现亚秒级生成,同时保持逼真的图像质量。仅需 8 个推理步骤,适配 16GB 显存,为速度关键的生产环境提供专业级结果。

超快速生成
  • 仅需 8 个推理步骤(竞品需 20-50 步)
  • H800 GPU 上实现亚秒级生成
  • 比 Qwen Image 每步快 1.31-1.41 倍
  • 适配 16GB 显存(RTX 3060/4090)
逼真质量
  • AI Arena 开源模型排名第一
  • 中英文双语文本渲染
  • 强大的指令遵循能力
  • 全方位超越 FLUX.1 [dev] 和 Qwen

阿里巴巴战略模型矩阵

阿里巴巴提供三大专业 AI 图像生成系统,各自针对不同应用场景优化

速度冠军

Z-Image Turbo

通义万相团队

Best For: 速度关键的生产工作负载
  • ⚡ 最快:8 步推理,亚秒生成
  • 🏆 开源模型排名第一
  • 💰 最具性价比($0.005/张)
  • 🎯 快速迭代优化
质量之王

Qwen-Image

通义千问团队

Best For: 最高质量的最终渲染
  • 🎨 无与伦比的真实感和皮肤纹理
  • 💡 卓越的光照交互效果
  • ⏱️ 较慢(20秒 vs Z-Image 的 5-10秒)
  • 🎯 适合高端制作工作
多功能专家

Wan 2.5/2.6

通义万相团队

Best For: 多媒体多样性
  • 🎬 文生视频 + 图生视频
  • 📹 多分辨率支持(480P-720P)
  • 🔄 音视频同步
  • 🎯 跨模态内容生成

Key Insight: Z-Image Turbo 比 Qwen-Image 每步快 1.31-1.41 倍,非常适合需要快速生成的应用场景。虽然 Qwen-Image 在最终渲染的真实感方面略胜一筹,但 Z-Image Turbo 在生产环境中提供了速度和质量的最佳平衡。

技术亮点

性能
S3-DiT 架构

采用单流扩散 Transformer(S3-DiT)架构,统一处理各种条件输入。这种 60 亿参数设计在不增加大模型计算开销的情况下实现专业级结果,同时保持最先进的质量。

速度
Decoupled-DMD 蒸馏

先进的蒸馏算法配合 CFG 增强和分布匹配机制,实现 8 步推理(竞品需 20-50 步)。在 H800 GPU 上实现亚秒级生成,在消费级 RTX 3060/4090(16GB 显存)上流畅运行。

质量
领先的开源性能

在 Artificial Analysis Image Arena 上排名第一的开源模型,超越 FLUX.2 [dev]、HunyuanImage 3.0 和 Qwen-Image。擅长中英文双语文本渲染、逼真图像生成和强大的指令遵循。采用 Apache 2.0 许可证,允许商业使用。

完美适用于

🎨
数字艺术创作
📸
产品摄影
📊
营销素材
🎬
概念设计
📱
社交媒体内容
🖼️
图库摄影
🎮
游戏资产
创意原型设计

为什么选择 Z-Image Turbo

即时生成
亚秒级生成,零冷启动延迟。立即获得您的图像,无需任何等待。
💰
高性价比
实惠的价格,每张图片仅需 $0.005。轻松扩展您的创意项目,无需担心预算。
🔌
开箱即用的 API
简单的 REST API 集成。通过我们完善的文档,几分钟内即可开始生成图像。

技术规格

模型架构60 亿参数
推理步骤8 NFEs(函数评估次数)
生成速度H800 亚秒级,消费级 GPU 5-10 秒
显存要求16GB(兼容 RTX 3060/4090)
架构单流扩散 Transformer(S3-DiT)
蒸馏方法Decoupled-DMD 配合 CFG 增强
许可证Apache 2.0(允许商业使用)
排名Artificial Analysis Arena 开源第一
价格每张图片 $0.005

立即开始使用 Z-Image Turbo

体验极速、逼真的图像生成。无需设置,调用我们的 API 即可开始创作。

零冷启动 - 即时生成
实惠价格 - 每张 $0.005
专业级质量结果
300+ 模型,即刻开启,

尽在 Atlas Cloud。