Z-Image Turbo
Văn bản-Hình ảnh
TURBO

Z-Image Turbo API by Alibaba

z-image/turbo
Turbo

Z-Image-Turbo is a 6 billion parameter text-to-image model that generates photorealistic images in sub-second time. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Đầu vào

Đang tải cấu hình tham số...

Đầu ra

Nhàn rỗi
Hình ảnh đã tạo của bạn sẽ xuất hiện ở đây
Cấu hình tham số và nhấp Chạy để bắt đầu tạo

Mỗi lần chạy có giá $0.01. Với $10, bạn có thể chạy khoảng 1000 lần.

Bạn có thể tiếp tục với:

Tham số

Ví dụ mã

import requests
import time

# Step 1: Start image generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "z-image/turbo",
    "prompt": "A beautiful landscape with mountains and lake",
    "width": 512,
    "height": 512,
    "steps": 20,
    "guidance_scale": 7.5,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] == "completed":
            print("Generated image:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

image_url = check_status()

Cài đặt

Cài đặt gói cần thiết cho ngôn ngữ lập trình của bạn.

bash
pip install requests

Xác thực

Tất cả các yêu cầu API đều cần xác thực thông qua khóa API. Bạn có thể lấy khóa API từ bảng điều khiển Atlas Cloud.

bash
export ATLASCLOUD_API_KEY="your-api-key-here"

HTTP Headers

python
import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}
Bảo mật khóa API của bạn

Không bao giờ để lộ khóa API trong mã phía máy khách hoặc kho lưu trữ công khai. Thay vào đó, hãy sử dụng biến môi trường hoặc proxy phía máy chủ.

Gửi yêu cầu

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Gửi yêu cầu

Gửi yêu cầu tạo nội dung bất đồng bộ. API trả về một ID dự đoán mà bạn có thể sử dụng để kiểm tra trạng thái và lấy kết quả.

POST/api/v1/model/generateImage

Nội dung yêu cầu

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "z-image/turbo",
    "input": {
        "prompt": "A beautiful landscape with mountains and lake"
    }
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")

Phản hồi

{
  "id": "pred_abc123",
  "status": "processing",
  "model": "model-name",
  "created_at": "2025-01-01T00:00:00Z"
}

Kiểm tra trạng thái

Truy vấn endpoint dự đoán để kiểm tra trạng thái hiện tại của yêu cầu.

GET/api/v1/model/prediction/{prediction_id}

Ví dụ truy vấn

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

Giá trị trạng thái

processingYêu cầu vẫn đang được xử lý.
completedQuá trình tạo đã hoàn tất. Kết quả đầu ra đã sẵn sàng.
succeededQuá trình tạo thành công. Kết quả đầu ra đã sẵn sàng.
failedQuá trình tạo thất bại. Kiểm tra trường lỗi.

Phản hồi hoàn tất

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.png"
    ],
    "metrics": {
      "predict_time": 8.3
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

Tải tệp lên

Tải tệp lên bộ nhớ Atlas Cloud và nhận URL mà bạn có thể sử dụng trong các yêu cầu API của mình. Sử dụng multipart/form-data để tải lên.

POST/api/v1/model/uploadMedia

Ví dụ tải lên

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

Phản hồi

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

Input Schema

Các tham số sau được chấp nhận trong nội dung yêu cầu.

Tổng cộng: 0Bắt buộc: 0Tùy chọn: 0

Không có tham số nào.

Ví dụ nội dung yêu cầu

json
{
  "model": "z-image/turbo"
}

Output Schema

API trả về phản hồi dự đoán với các URL đầu ra đã tạo.

idstringrequired
Unique identifier for the prediction.
statusstringrequired
Current status of the prediction.
processingcompletedsucceededfailed
modelstringrequired
The model used for generation.
outputsarray[string]
Array of output URLs. Available when status is "completed".
errorstring
Error message if status is "failed".
metricsobject
Performance metrics.
predict_timenumber
Time taken for image generation in seconds.
created_atstringrequired
ISO 8601 timestamp when the prediction was created.
Format: date-time
completed_atstring
ISO 8601 timestamp when the prediction was completed.
Format: date-time

Ví dụ phản hồi

json
{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.png"
  ],
  "metrics": {
    "predict_time": 8.3
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills tích hợp hơn 300 mô hình AI trực tiếp vào trợ lý lập trình AI của bạn. Một lệnh để cài đặt, sau đó sử dụng ngôn ngữ tự nhiên để tạo hình ảnh, video và trò chuyện với LLM.

Ứng dụng được hỗ trợ

Claude Code
OpenAI Codex
Gemini CLI
Cursor
Windsurf
VS Code
Trae
GitHub Copilot
Cline
Roo Code
Amp
Goose
Replit
40+ ứng dụng được hỗ trợ

Cài đặt

bash
npx skills add AtlasCloudAI/atlas-cloud-skills

Thiết lập khóa API

Lấy khóa API từ bảng điều khiển Atlas Cloud và đặt nó làm biến môi trường.

bash
export ATLASCLOUD_API_KEY="your-api-key-here"

Khả năng

Sau khi cài đặt, bạn có thể sử dụng ngôn ngữ tự nhiên trong trợ lý AI để truy cập tất cả các mô hình Atlas Cloud.

Tạo hình ảnhTạo hình ảnh với các mô hình như Nano Banana 2, Z-Image và nhiều hơn nữa.
Tạo videoTạo video từ văn bản hoặc hình ảnh với Kling, Vidu, Veo, v.v.
Trò chuyện LLMTrò chuyện với Qwen, DeepSeek và các mô hình ngôn ngữ lớn khác.
Tải lên phương tiệnTải tệp cục bộ lên để chỉnh sửa hình ảnh và quy trình chuyển hình ảnh sang video.

MCP Server

Atlas Cloud MCP Server kết nối IDE của bạn với hơn 300 mô hình AI thông qua Model Context Protocol. Hoạt động với bất kỳ ứng dụng tương thích MCP nào.

Ứng dụng được hỗ trợ

Cursor
VS Code
Windsurf
Claude Code
OpenAI Codex
Gemini CLI
Cline
Roo Code
100+ ứng dụng được hỗ trợ

Cài đặt

bash
npx -y atlascloud-mcp

Cấu hình

Thêm cấu hình sau vào tệp cài đặt MCP của IDE.

json
{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

Công cụ khả dụng

atlas_generate_imageTạo hình ảnh từ mô tả văn bản.
atlas_generate_videoTạo video từ văn bản hoặc hình ảnh.
atlas_chatTrò chuyện với các mô hình ngôn ngữ lớn.
atlas_list_modelsDuyệt hơn 300 mô hình AI khả dụng.
atlas_quick_generateTạo nội dung một bước với tự động chọn mô hình.
atlas_upload_mediaTải tệp cục bộ lên cho quy trình API.

Schema API

Schema không khả dụng

Đăng nhập để xem lịch sử yêu cầu

Bạn cần đăng nhập để truy cập lịch sử yêu cầu mô hình của mình.

Đăng nhập

Z-Image Turbo - Tạo Ảnh Từ Văn Bản Cực Nhanh

MỚI

Mô Hình 6 Tỷ Tham Số Của Alibaba TONGYIMAI

Z-Image Turbo là mô hình văn bản sang hình ảnh mã nguồn mở xếp hạng #1, vượt trội hơn FLUX.2 [dev], HunyuanImage 3.0 và Qwen-Image trên Artificial Analysis Image Arena. Được xây dựng bởi đội ngũ Tongyi-MAI của Alibaba (một bộ phận riêng biệt với Qwen/Wan), mô hình 6 tỷ tham số này đạt được tốc độ tạo dưới một giây thông qua chưng cất Decoupled-DMD tiên tiến trong khi vẫn duy trì chất lượng như ảnh thật. Chỉ với 8 bước suy luận, phù hợp với 16GB VRAM và mang lại kết quả chuyên nghiệp được tối ưu hóa cho môi trường sản xuất yêu cầu tốc độ cao.

Tạo Cực Nhanh
  • Chỉ 8 bước suy luận (so với 20-50 của đối thủ)
  • Tạo dưới một giây trên GPU H800
  • Nhanh hơn Qwen Image 1.31-1.41× mỗi bước
  • Phù hợp với 16GB VRAM (RTX 3060/4090)
Chất Lượng Như Ảnh Thật
  • Mô hình mã nguồn mở xếp hạng #1 trên AI Arena
  • Hiển thị văn bản song ngữ (tiếng Anh & tiếng Trung)
  • Tuân thủ hướng dẫn mạnh mẽ
  • Vượt trội hơn FLUX.1 [dev] và Qwen ở mọi danh mục

Danh Mục Mô Hình Chiến Lược Của Alibaba

Alibaba cung cấp ba hệ thống tạo ảnh AI chuyên biệt, mỗi hệ thống được tối ưu hóa cho các trường hợp sử dụng khác nhau

Nhà Vô Địch Tốc Độ

Z-Image Turbo

Đội Tongyi-MAI

Best For: Khối lượng công việc sản xuất yêu cầu tốc độ cao
  • ⚡ Nhanh nhất: 8 bước, tạo dưới một giây
  • 🏆 Mô hình mã nguồn mở xếp hạng #1
  • 💰 Tiết kiệm chi phí nhất ($0.005/ảnh)
  • 🎯 Tối ưu hóa cho lặp lại nhanh
Vua Chất Lượng

Qwen-Image

Đội Qwen

Best For: Kết xuất cuối cùng chất lượng tối đa
  • 🎨 Chất lượng như ảnh thật & kết cấu da vô song
  • 💡 Tương tác ánh sáng vượt trội
  • ⏱️ Chậm hơn (20s so với 5-10s của Z-Image)
  • 🎯 Tốt nhất cho công việc sản xuất cao cấp
Chuyên Gia Đa Năng

Wan 2.5/2.6

Đội Wan

Best For: Tính đa năng đa phương tiện
  • 🎬 Văn Bản-Video + Ảnh-Video
  • 📹 Hỗ trợ đa độ phân giải (480P-720P)
  • 🔄 Đồng bộ hóa âm thanh-hình ảnh
  • 🎯 Tạo nội dung đa phương thức

Key Insight: Z-Image Turbo nhanh hơn Qwen-Image 1.31-1.41× mỗi bước, làm cho nó lý tưởng cho các ứng dụng yêu cầu tạo nhanh. Mặc dù Qwen-Image cung cấp chất lượng như ảnh thật tốt hơn một chút cho kết xuất cuối cùng, Z-Image Turbo mang lại sự cân bằng tốt nhất giữa tốc độ và chất lượng cho môi trường sản xuất.

Điểm Nổi Bật Kỹ Thuật

Hiệu Năng
Kiến Trúc S3-DiT

Áp dụng kiến trúc Single-Stream Diffusion Transformer (S3-DiT) thống nhất xử lý các đầu vào có điều kiện khác nhau. Thiết kế 6 tỷ tham số này đạt được kết quả chuyên nghiệp mà không có chi phí tính toán của các mô hình lớn hơn trong khi vẫn duy trì chất lượng tiên tiến.

Tốc Độ
Chưng Cất Decoupled-DMD

Thuật toán chưng cất tiên tiến với cơ chế CFG Augmentation và Distribution Matching cho phép suy luận 8 bước (so với 20-50 của đối thủ). Đạt được tạo dưới một giây trên GPU H800 và chạy mượt mà trên RTX 3060/4090 dành cho người tiêu dùng với 16GB VRAM.

Chất Lượng
Hiệu Năng Mã Nguồn Mở Hàng Đầu

Xếp hạng mô hình mã nguồn mở #1 trên Artificial Analysis Image Arena, vượt trội hơn FLUX.2 [dev], HunyuanImage 3.0 và Qwen-Image. Xuất sắc trong hiển thị văn bản song ngữ (tiếng Anh & tiếng Trung), tạo như ảnh thật và tuân thủ hướng dẫn mạnh mẽ. Được phát hành theo giấy phép Apache 2.0 cho mục đích thương mại.

Hoàn Hảo Cho

🎨
Tạo Nghệ Thuật Số
📸
Chụp Ảnh Sản Phẩm
📊
Tài Liệu Marketing
🎬
Nghệ Thuật Khái Niệm
📱
Nội Dung Mạng Xã Hội
🖼️
Chụp Ảnh Stock
🎮
Tài Sản Trò Chơi
Tạo Mẫu Sáng Tạo

Tại Sao Chọn Z-Image Turbo

Kết Quả Tức Thì
Tạo dưới một giây với độ trễ khởi động lạnh bằng không. Nhận ảnh của bạn ngay lập tức mà không cần chờ đợi.
💰
Tiết Kiệm Chi Phí
Giá cả phải chăng $0.005 mỗi ảnh. Mở rộng các dự án sáng tạo của bạn mà không vượt quá ngân sách.
🔌
API Sẵn Sàng Sử Dụng
Tích hợp REST API đơn giản. Bắt đầu tạo ảnh trong vài phút với tài liệu toàn diện của chúng tôi.

Thông Số Kỹ Thuật

Kiến Trúc Mô Hình6 Tỷ Tham Số
Bước Suy Luận8 NFEs (Số Lần Đánh Giá Hàm)
Tốc Độ TạoDưới một giây trên H800, 5-10s trên GPU người tiêu dùng
Yêu Cầu VRAM16GB (tương thích RTX 3060/4090)
Kiến TrúcSingle-Stream Diffusion Transformer (S3-DiT)
Phương Pháp Chưng CấtDecoupled-DMD với CFG Augmentation
Giấy PhépApache 2.0 (Cho Phép Sử Dụng Thương Mại)
Xếp Hạng#1 Mã Nguồn Mở trên Artificial Analysis Arena
Giá$0.005 Mỗi Ảnh

Bắt Đầu Tạo Với Z-Image Turbo

Trải nghiệm tạo ảnh như ảnh thật cực nhanh ngay hôm nay. Không cần thiết lập, chỉ cần gọi API của chúng tôi và bắt đầu tạo.

Không khởi động lạnh - tạo tức thì
Giá phải chăng - $0.005 mỗi ảnh
Kết quả chất lượng chuyên nghiệp

Z-Image-Turbo — 6B-parameter, ultra-fast text-to-image

Z-Image-Turbo is a 6B-parameter text-to-image model from Tongyi-MAI, engineered for production workloads where latency and throughput really matter. It uses only 8 sampling steps to render a full image, achieving sub-second latency on data-center GPUs and running comfortably on many 16 GB VRAM consumer cards.

Ultra-fast generation with production-ready quality

Where many diffusion models need dozens of steps, Z-Image-Turbo is aggressively optimised around an 8-step sampler. That keeps inference extremely fast while still delivering photorealistic images and reliable on-image text, making it a strong fit for interactive products, dashboards, and large-scale backends—not just offline batch jobs.

Why it looks so good?

  • Photorealistic output at speed Generates high-fidelity, realistic images that work for product photos, hero banners, and UI visuals without multi-second waits.
  • Bilingual prompts and text Understands prompts in English and Chinese, and can render multilingual text directly in the image—helpful for cross-market campaigns, posters, and screenshots.
  • Low-latency, low-step design Only 8 function evaluations per image deliver extremely low latency, ideal for chatbots, configuration tools, design assistants, and any “click → image” experience.
  • Friendly VRAM footprint Runs well in 16 GB VRAM environments, reducing hardware costs and making local or edge deployments more realistic.
  • Scales for bulk generation Its efficiency makes large jobs—catalogues, continuous feed images, or auto-generated thumbnails—practical without blowing up compute budgets.
  • Reproducible generations A controllable seed parameter lets you recreate a previous image or generate small, controlled variations for brand safety and experimentation.

How to use

  • prompt – natural-language description of the scene, style, and any on-image text (English or Chinese).
  • size (width / height) – choose the output resolution; supports square and rectangular images up to high resolutions (for example, 1536 × 1536).
  • seed – set to -1 for random results, or use a fixed integer to make outputs reproducible.

Pricing

Simple per-image billing:

  • Without prompt rewriting (prompt_extend=false): $0.015 per generated image
  • With prompt rewriting (prompt_extend=true): $0.03 per generated image

Try more models and see their difference!

  • Nano Banana Pro – Text-to-Image – Google’s Nano Banana Pro (Gemini 3.0 Pro Image family) delivers high-quality multi-image generation with extremely low cost per image, ideal for large-scale applications.
  • Seedream V4 – Text-to-Image – ByteDance’s high-resolution text-to-image model with rich detail and diverse styles, well suited for creative illustration and commercial visuals.
  • FLUX.2 [dev] – Text-to-Image – A lightweight FLUX.2-based base model hosted by AtlasCloud, optimised for efficient inference and LoRA-friendly training.

Paper

Tongyi-MAI/Z-Image-Turbo

Bắt đầu với 300+ Mô hình,

Khám phá tất cả mô hình

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.