alibaba/wan-2.6/image-to-video

Hình ảnh-Video

Wan 2.6 Image-to-Video API by Alibaba

alibaba/wan-2.6/image-to-video

Image-to-video

A speed-optimized image-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.

Đầu vào

Đang tải cấu hình tham số...

Đầu ra

Nhàn rỗi

Video đã tạo của bạn sẽ xuất hiện ở đây

Cấu hình tham số và nhấp Chạy để bắt đầu tạo

Mỗi lần chạy có giá $0.07. Với $10, bạn có thể chạy khoảng 142 lần.

Bạn có thể tiếp tục với:

Seedance 2.0 Kling v3 Vidu Wan2.7

Tham số

Ví dụ mã
import requests
import time

# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "alibaba/wan-2.6/image-to-video",
    "prompt": "A beautiful sunset over the ocean with gentle waves",
    "width": 512,
    "height": 512,
    "duration": 3,
    "fps": 24,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] in ["completed", "succeeded"]:
            print("Generated video:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

video_url = check_status()

Cài đặt

Cài đặt gói cần thiết cho ngôn ngữ lập trình của bạn.

pip install requests

Xác thực

Tất cả các yêu cầu API đều cần xác thực thông qua khóa API. Bạn có thể lấy khóa API từ bảng điều khiển Atlas Cloud.

export ATLASCLOUD_API_KEY="your-api-key-here"

HTTP Headers

import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}

Bảo mật khóa API của bạn

Không bao giờ để lộ khóa API trong mã phía máy khách hoặc kho lưu trữ công khai. Thay vào đó, hãy sử dụng biến môi trường hoặc proxy phía máy chủ.

Gửi yêu cầu

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Gửi yêu cầu

Gửi một yêu cầu tạo nội dung không đồng bộ. API trả về một prediction ID mà bạn có thể dùng để kiểm tra trạng thái và lấy kết quả.

POST/api/v1/model/generateVideo

Nội dung yêu cầu

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "alibaba/wan-2.6/image-to-video",
    "prompt": "A beautiful sunset over the ocean with gentle waves"
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['data']['id']}")
print(f"Status: {result['data']['status']}")

Phản hồi

{
  "code": 200,
  "data": {
    "id": "pred_abc123",
    "status": "processing",
    "model": "model-name",
    "created_at": "2025-01-01T00:00:00Z"
  }
}

Kiểm tra trạng thái

Truy vấn (poll) endpoint prediction để kiểm tra trạng thái hiện tại của yêu cầu.

GET/api/v1/model/prediction/{prediction_id}

Ví dụ truy vấn

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

Giá trị trạng thái

processingYêu cầu vẫn đang được xử lý.

completedQuá trình tạo đã hoàn tất. Kết quả đầu ra đã sẵn sàng.

succeededQuá trình tạo thành công. Kết quả đầu ra đã sẵn sàng.

failedTạo nội dung thất bại. Hãy kiểm tra trường error.

Phản hồi hoàn tất

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.mp4"
    ],
    "metrics": {
      "predict_time": 45.2
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

Tải tệp lên

Tải tệp lên bộ nhớ Atlas Cloud và nhận URL mà bạn có thể sử dụng trong các yêu cầu API của mình. Sử dụng multipart/form-data để tải lên.

POST/api/v1/model/uploadMedia

Ví dụ tải lên

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

Phản hồi

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

Input Schema

Các tham số sau được chấp nhận trong nội dung yêu cầu.

Tổng cộng: 0Bắt buộc: 0Tùy chọn: 0

Không có tham số nào khả dụng.

Ví dụ nội dung yêu cầu

{
  "model": "alibaba/wan-2.6/image-to-video"
}

Output Schema

API trả về phản hồi prediction kèm theo các URL đầu ra đã tạo.

idstringrequired

Unique identifier for the prediction.

statusstringrequired

Current status of the prediction.

processingcompletedsucceededfailed

modelstringrequired

The model used for generation.

outputsarray[string]

Array of output URLs. Available when status is "completed".

errorstring

Error message if status is "failed".

metricsobject

Performance metrics.

predict_timenumber

Time taken for video generation in seconds.

created_atstringrequired

ISO 8601 timestamp when the prediction was created.

Format: date-time

completed_atstring

ISO 8601 timestamp when the prediction was completed.

Format: date-time

Ví dụ phản hồi

{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.mp4"
  ],
  "metrics": {
    "predict_time": 45.2
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills tích hợp hơn 300 mô hình AI trực tiếp vào trợ lý lập trình AI của bạn. Một lệnh để cài đặt, sau đó sử dụng ngôn ngữ tự nhiên để tạo hình ảnh, video và trò chuyện với LLM.

Ứng dụng được hỗ trợ

Claude Code

OpenAI Codex

Gemini CLI

Cursor

Windsurf

VS Code

Trae

GitHub Copilot

Cline

Roo Code

Amp

Goose

Replit

40+ ứng dụng được hỗ trợ

Cài đặt

npx skills add AtlasCloudAI/atlas-cloud-skills

Thiết lập khóa API

Lấy khóa API từ bảng điều khiển Atlas Cloud và đặt nó làm biến môi trường.

export ATLASCLOUD_API_KEY="your-api-key-here"

Khả năng

Sau khi cài đặt, bạn có thể sử dụng ngôn ngữ tự nhiên trong trợ lý AI để truy cập tất cả các mô hình Atlas Cloud.

Tạo hình ảnhTạo hình ảnh với các mô hình như Nano Banana 2, Z-Image và nhiều hơn nữa.

Tạo videoTạo video từ văn bản hoặc hình ảnh với Kling, Vidu, Veo, v.v.

Trò chuyện LLMTrò chuyện với Qwen, DeepSeek và các mô hình ngôn ngữ lớn khác.

Tải lên phương tiệnTải tệp cục bộ lên để chỉnh sửa hình ảnh và quy trình chuyển hình ảnh sang video.

Tìm hiểu thêm

github.com/AtlasCloudAI/atlas-cloud-skills

MCP Server

Atlas Cloud MCP Server kết nối IDE của bạn với hơn 300 mô hình AI thông qua Model Context Protocol. Hoạt động với bất kỳ ứng dụng tương thích MCP nào.

Ứng dụng được hỗ trợ

Cursor

VS Code

Windsurf

Claude Code

OpenAI Codex

Gemini CLI

Cline

Roo Code

100+ ứng dụng được hỗ trợ

Cài đặt

npx -y atlascloud-mcp

Cấu hình

Thêm cấu hình sau vào tệp cài đặt MCP của IDE.

{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

Công cụ khả dụng

atlas_generate_imageTạo hình ảnh từ mô tả văn bản.

atlas_generate_videoTạo video từ văn bản hoặc hình ảnh.

atlas_chatTrò chuyện với các mô hình ngôn ngữ lớn.

atlas_list_modelsDuyệt hơn 300 mô hình AI khả dụng.

atlas_quick_generateTạo nội dung một bước với khả năng tự động chọn mô hình tốt nhất.

atlas_upload_mediaTải tệp cục bộ lên cho quy trình API.

Tìm hiểu thêm

github.com/AtlasCloudAI/mcp-server

Schema API

Schema không khả dụng

Không có ví dụ

Đang tải...

🎬TẠO VIDEO ĐA CẢNH QUAY

Wan 2.6Sáng Tạo Video AI Đa Cảnh Quay Chuyên Nghiệp

Bước đột phá mới nhất của Alibaba trong lĩnh vực tạo video AI. Tạo video 1080p dài tới 15 giây với khả năng kể chuyện đa cảnh quay, tính nhất quán nhân vật dựa trên video tham chiếu và đồng bộ âm thanh - hình ảnh gốc. Mô hình đầu tiên thực sự hiểu logic phân cảnh, mở ra khả năng kể chuyện điện ảnh.

Đột Phá Mang Tính Cách Mạng

Điều khiến Wan 2.6 trở thành nhân tố thay đổi cuộc chơi trong tạo video AI

Kể Chuyện Đa Cảnh Quay

Mô hình đầu tiên hiểu logic phân cảnh. Tự động tạo các cảnh quay liên tiếp với chuyển cảnh mạch lạc, duy trì diện mạo nhân vật và tính nhất quán môi trường qua các lần chuyển cảnh—mang đến mạch truyện hoàn chỉnh chỉ trong một lần tạo 15 giây.

Tham Chiếu sang Video (R2V)

Tải lên video tham chiếu 2-30 giây để trích xuất và bảo toàn diện mạo nhân vật, mẫu chuyển động và đặc điểm giọng nói. Tạo diễn xuất nhân vật nhất quán trên nhiều video với độ chính xác chưa từng có.

Kết Xuất Văn Bản Chính Xác

Khả năng kết xuất văn bản hàng đầu ngành cho bao bì sản phẩm, biển hiệu và nội dung thương hiệu. Tạo văn bản rõ ràng, dễ đọc trong khung hình video—thiết yếu cho ứng dụng tiếp thị và thương mại.

Khả Năng Cốt Lõi

Thời Lượng Mở Rộng 15 Giây

Tạo tối đa 15 giây mỗi video với cấu trúc "Ba Hồi" đầy đủ (Dựng lên → Hành động → Giải quyết)

Chất Lượng 1080p Chuyên Nghiệp

Đầu ra gốc 1080p ở 24fps với chất lượng điện ảnh và độ ổn định hình ảnh được cải thiện

Đồng Bộ Âm Thanh Gốc

Đối thoại khớp với chuyển động môi, nhạc nền điều chỉnh theo nhịp độ, hiệu ứng âm thanh kích hoạt hoàn hảo

Tính Nhất Quán Nhân Vật

Duy trì diện mạo, trang phục và bản sắc nhân vật qua các cảnh quay và nhiều video

Điều Khiển Máy Quay Điện Ảnh

Chuyển động máy quay chuyên nghiệp bao gồm quay ngang, zoom, cảnh theo dõi và chuyển động dolly

Tỷ Lệ Khung Hình Linh Hoạt

16:9 (YouTube), 9:16 (Reels), 1:1 (Vuông) - tối ưu hóa nền tảng không cần cắt xén hậu kỳ

Wan 2.6 vs Wan 2.5: Cải Tiến Lớn

Xem có gì mới trong phiên bản mới nhất

Thời Lượng Video

Lên đến 15 giây

Wan 2.5: Tối đa 10 giây

Khả Năng Đa Cảnh Quay

Hiểu logic storyboard

Wan 2.5: Cảnh quay đơn hoặc biến hình hỗn loạn

Hỗ Trợ Video Tham Chiếu

Chế độ R2V với bảo toàn đầy đủ

Wan 2.5: Chỉ tham chiếu hình ảnh

Tính Nhất Quán Nhân Vật

Xuất sắc giữa các cảnh quay

Wan 2.5: Vấn đề trôi nhân vật

Độ Ổn Định Chuyển Động

Giảm rung và lỗi hình

Wan 2.5: Thỉnh thoảng trôi khung hình

Hiểu Lệnh Nhắc

Cảnh phức tạp nhiều nhân vật

Wan 2.5: Tạo cảnh cơ bản

Ba Chế Độ Tạo Chuyên Biệt

Chọn chế độ phù hợp cho quy trình sáng tạo của bạn

Văn Bản sang Video (T2V)

Phổ Biến Nhất

Tạo video hoàn chỉnh từ lệnh văn bản với phân đoạn đa cảnh quay nâng cao và xử lý lệnh cải tiến. Hoàn hảo cho kể chuyện và khám phá sáng tạo.

Phân đoạn cảnh quay tự động từ lệnh đơn
Hiểu tương tác nhiều nhân vật
Chuyển động máy quay và tín hiệu cảm xúc
Bảo toàn chi tiết môi trường

Hình Ảnh sang Video (I2V)

Nâng Cao

Biến hình ảnh tĩnh thành video chuyển động với tính mạch lạc chuyển động được cải thiện. Lý tưởng cho trưng bày sản phẩm, hoạt hình ảnh và kể chuyện hình ảnh.

Kết xuất văn bản chính xác cho sản phẩm
Nhất quán phong cách qua các khung hình
Chuyển động tự nhiên từ hình ảnh tĩnh
Tối ưu hóa hình ảnh dựa trên câu chuyện

Tham Chiếu sang Video (R2V)

MỚI

Tải lên video tham chiếu (2-30s) để bảo toàn diện mạo nhân vật, mẫu chuyển động và giọng nói. Đảm bảo nhất quán mạnh nhất cho nội dung dựa trên nhân vật.

Bảo toàn bản sắc nhân vật đầy đủ
Trích xuất đặc điểm giọng nói
Sao chép mẫu chuyển động
Cảnh đồng diễn nhiều nhân vật

Hoàn Hảo Cho

Tiếp Thị & Quảng Cáo

Demo sản phẩm với kết xuất văn bản, chiến dịch thương hiệu với nhân vật nhất quán và video quảng cáo

Sáng Tạo Nội Dung

Video YouTube, reels mạng xã hội, kể chuyện đa cảnh quay và quy trình chỉnh sửa video

Thương Mại Điện Tử

Trưng bày sản phẩm với văn bản chính xác, video hướng dẫn và tái tạo lời chứng thực khách hàng

Giáo Dục & Đào Tạo

Nội dung giảng dạy, tài liệu khóa học và câu chuyện giáo dục đa cảnh

Giải Trí

Phim ngắn, câu chuyện dựa trên nhân vật, chuỗi điện ảnh và thử nghiệm sáng tạo

Tiền Kỳ Hình Ảnh Hóa

Phát triển khái niệm phim, tạo storyboard và lập kế hoạch cảnh cho sản xuất

Tích Hợp API Wan 2.6 T2V, I2V và R2V

Bộ API đầy đủ cho tạo Văn Bản sang Video, Hình Ảnh sang Video và Tham Chiếu sang Video

API Văn Bản sang Video (T2V API)

API Wan 2.6 T2V của chúng tôi biến lệnh văn bản thành video điện ảnh đa cảnh quay với phân đoạn cảnh tự động. Tạo video 1080p chuyên nghiệp lên đến 15 giây với đồng bộ âm thanh gốc.

Kể chuyện đa cảnh quay từ lệnh đơn

Thời lượng 15 giây với cấu trúc Ba Hồi

Hiểu lệnh nâng cao cho cảnh phức tạp

Tỷ lệ khung hình linh hoạt: 16:9, 9:16, 1:1

API Hình Ảnh sang Video (I2V API)

API Wan 2.6 I2V của chúng tôi thổi sức sống vào hình ảnh tĩnh với điều khiển chuyển động chính xác và kết xuất văn bản. Hoàn hảo cho video sản phẩm, hoạt hình ảnh và tạo nội dung thương hiệu.

Kết xuất văn bản chính xác cho sản phẩm và biển hiệu

Nhất quán phong cách trong khung hình hoạt hình

Chuyển động tự nhiên với tính mạch lạc cải thiện

Đầu ra hình ảnh được tối ưu hóa theo câu chuyện

API Tham Chiếu sang Video (R2V API)

API Wan 2.6 R2V của chúng tôi bảo toàn bản sắc nhân vật từ video tham chiếu. Tải lên clip 2-30 giây để trích xuất diện mạo, giọng nói và mẫu chuyển động cho tạo nhân vật nhất quán.

Bảo toàn diện mạo và bản sắc nhân vật

Trích xuất và sao chép đặc điểm giọng nói

Phân tích và tái tạo mẫu chuyển động

Hỗ trợ cảnh nhiều nhân vật

💡

Bộ API Đầy Đủ

Cả ba chế độ API Wan 2.6 (T2V API, I2V API, R2V API) đều hỗ trợ kiến trúc RESTful với tài liệu đầy đủ. Bắt đầu với SDK cho Python, Node.js và nhiều hơn. Mỗi endpoint bao gồm đồng bộ nghe nhìn gốc và quyền sử dụng thương mại đầy đủ.

Cách Bắt Đầu với Wan 2.6

Bắt đầu tạo video chuyên nghiệp trong vài phút với hai lộ trình đơn giản

Tích Hợp API

Cho nhà phát triển xây dựng ứng dụng

Đăng Ký & Đăng Nhập

Tạo tài khoản Atlas Cloud hoặc đăng nhập để truy cập bảng điều khiển

Thêm Phương Thức Thanh Toán

Liên kết thẻ tín dụng trong phần Thanh Toán để nạp tiền vào tài khoản

Tạo Khóa API

Điều hướng đến Bảng điều khiển → Khóa API và tạo khóa xác thực

Bắt Đầu Xây Dựng

Sử dụng endpoint API T2V, I2V hoặc R2V để tích hợp Wan 2.6 vào ứng dụng

Trải Nghiệm Playground

Cho thử nghiệm và thí nghiệm nhanh

Đăng Ký & Đăng Nhập

Tạo tài khoản Atlas Cloud hoặc đăng nhập để truy cập nền tảng

Thêm Phương Thức Thanh Toán

Liên kết thẻ tín dụng trong phần Thanh Toán để bắt đầu

Sử Dụng Playground

Đi đến playground Wan 2.6, chọn chế độ T2V/I2V/R2V và tạo video ngay lập tức

💡

Mẹo Chuyên Nghiệp: Trước tiên hãy thử nghiệm các chế độ tạo khác nhau trong Playground để hiểu cái nào hoạt động tốt nhất cho trường hợp sử dụng của bạn, sau đó tích hợp API tương ứng cho quy mô sản xuất.

Câu Hỏi Thường Gặp

Điều gì khiến khả năng đa cảnh quay của Wan 2.6 trở nên độc đáo?

Wan 2.6 là mô hình đầu tiên thực sự hiểu logic phân cảnh. Không như Wan 2.5 tạo ra hiệu ứng "biến hình" hỗn loạn, Wan 2.6 có thể tự động phân tách một lệnh đơn thành nhiều cảnh quay riêng biệt với chuyển cảnh mạch lạc, duy trì tính nhất quán nhân vật qua các lần chuyển cảnh.

Tham Chiếu sang Video (R2V) hoạt động như thế nào?

Tải lên video tham chiếu 2-30 giây, và Wan 2.6 trích xuất diện mạo nhân vật, mẫu chuyển động và đặc điểm giọng nói. Sau đó bạn có thể tạo video mới có cùng nhân vật với bản sắc nhất quán—lý tưởng cho việc tạo loạt nội dung dựa trên nhân vật.

Định dạng và thời lượng video nào được hỗ trợ?

Wan 2.6 tạo video 1080p ở 24fps với thời lượng từ 5 đến 15 giây. Tỷ lệ khung hình được hỗ trợ bao gồm 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) và 1:1 (định dạng vuông), được tối ưu hóa cho từng nền tảng mà không cần cắt xén hậu kỳ.

Wan 2.6 có thể kết xuất văn bản trong video không?

Có! Wan 2.6 có khả năng kết xuất văn bản hàng đầu ngành cho bao bì sản phẩm, biển hiệu và nội dung thương hiệu. Mô hình có thể tạo văn bản rõ ràng, dễ đọc trong khung hình video—tính năng quan trọng mà Seedance và hầu hết đối thủ không có.

Sự khác biệt giữa các chế độ T2V, I2V và R2V là gì?

T2V (Văn Bản sang Video) tạo từ lệnh văn bản với khả năng đa cảnh quay. I2V (Hình Ảnh sang Video) làm động hình ảnh tĩnh với kết xuất văn bản chính xác. R2V (Tham Chiếu sang Video) sử dụng tham chiếu video để bảo toàn bản sắc nhân vật qua các lần tạo. Chọn dựa trên loại đầu vào và nhu cầu nhất quán của bạn.

Tôi có quyền thương mại đối với video được tạo không?

Có! Mọi tác phẩm Wan 2.6 đều đi kèm với quyền sử dụng thương mại đầy đủ. Video sẵn sàng sản xuất cho chiến dịch tiếp thị, sản phẩm giao khách hàng, nội dung thương hiệu và ứng dụng thương mại mà không cần yêu cầu cấp phép bổ sung.

Tại Sao Sử Dụng Wan 2.6 trên Atlas Cloud?

Tận dụng cơ sở hạ tầng cấp doanh nghiệp cho quy trình tạo video chuyên nghiệp của bạn

Cơ Sở Hạ Tầng Xây Dựng Chuyên Biệt

Triển khai khả năng tạo đa cảnh quay và R2V của Wan 2.6 trên cơ sở hạ tầng được tối ưu hóa đặc biệt cho khối lượng công việc video AI đòi hỏi cao. Hiệu suất tối đa cho tạo 1080p 15 giây.

API Thống Nhất Cho Tất Cả Mô Hình

Truy cập Wan 2.6 (T2V, I2V, R2V) cùng với hơn 300 mô hình AI (LLM, hình ảnh, video, âm thanh) qua một API thống nhất. Tích hợp đơn lẻ cho tất cả nhu cầu AI tạo sinh với xác thực nhất quán.

Giá Cạnh Tranh

Tiết kiệm đến 70% so với AWS với giá trả theo sử dụng minh bạch. Không có phí ẩn, không cam kết—mở rộng từ mẫu thử đến sản xuất mà không phá vỡ ngân sách.

Bảo Mật Chứng Nhận SOC I & II

Video tham chiếu và nội dung được tạo của bạn được bảo vệ với chứng nhận SOC I & II và tuân thủ HIPAA. Bảo mật cấp doanh nghiệp với truyền tải và lưu trữ được mã hóa.

SLA Hoạt Động 99,9%

Độ tin cậy cấp doanh nghiệp với đảm bảo hoạt động 99,9%. Tạo video đa cảnh quay Wan 2.6 của bạn luôn sẵn sàng cho chiến dịch sản xuất và quy trình nội dung quan trọng.

Tích Hợp Dễ Dàng

Tích hợp hoàn chỉnh trong vài phút với REST API và SDK đa ngôn ngữ (Python, Node.js, Go). Chuyển đổi liền mạch giữa các chế độ T2V, I2V và R2V với cấu trúc endpoint thống nhất.

99.9%

Hoạt Động

70%

Chi Phí Thấp Hơn vs AWS

300+

Mô Hình AI Tạo Sinh

24/7

Hỗ Trợ Chuyên Nghiệp

Thông Số Kỹ Thuật

Architecture

Transformer Tiên Tiến với Hiểu Biết Đa Phương Thức

Resolution

1080p (Full HD)

Frame Rate

24 FPS

Duration

5-15 giây (phụ thuộc chế độ)

Aspect Ratios

16:9, 9:16, 1:1

Generation Modes

T2V, I2V, R2V

Audio

Đồng bộ gốc với đồng bộ môi

Commercial Rights

Sử dụng thương mại đầy đủ bao gồm

Trải Nghiệm Tạo Video Đa Cảnh Quay Chuyên Nghiệp

Tham gia cùng các nhà sáng tạo nội dung, nhà tiếp thị và nhà làm phim trên toàn thế giới đang cách mạng hóa sản xuất video với khả năng kể chuyện đa cảnh quay và tính nhất quán nhân vật đột phá của Wan 2.6.

Alibaba WAN 2.6 Image-to-Video Model

Alibaba WAN 2.6 is an advanced image-to-video model on Alibaba Cloud’s DashScope. It generates high-quality videos from images and supports output resolutions of 720p and 1080p.

What makes it stand out?

More affordable: Wan 2.6 is more streamlined and cost-effective - reducing creator expenses and offering more options.
One-pass A/V sync: Wan 2.6 creates a fully synchronized video (audio/voiceover + lip-sync) from a single, well-structured prompt - no separate recording or manual alignment required.
Multilingual friendly: Wan 2.6 reliably processes like Chinese prompts for A/V-synced videos.
Longer duration & more video size options: Wan 2.6 delivers up to 10 seconds and 6 aspect/size options, enabling more storytelling room and publishing flexibility.
Multi-shot storytelling: Generates cohesive multi-shot narratives, keeping key details consistent across shots and offering auto shot-split for simple prompts.
Video reference generation: Uses a reference video's appearance and voice to guide new videos; supports human or arbitrary subjects, single or dual performers.
15s long videos: Produces videos up to 15 seconds, expanding temporal capacity for richer storytelling.

Designed For

Marketing teams: Fast, polished demos/tutorials—low cost, consistent style.
Global enterprises: Multilingual, lip-synced videos with subtitles for efficient localization.
Storytellers & YouTubers: Immersive narratives while maintaining cadence and quality—driving growth.
Corporate training teams: HD videos over docs—clearer key points, better communication.

Pricing

The table below lists prices for easy comparsion.

Output Resolution	Duration (5s)	Duration (10s)
720p	$0.5	$1
1080p	$0.75	$1.5

Billing Rules

Minimum charge: 5 seconds
Per-second rate = (price per 5 seconds) ÷ 5
Billed duration = video length in seconds (rounded up), with a 5-second minimum
Total cost = billed duration × per-second rate (by output resolution)

How to Use

Write your prompt.
Upload an audio file (optional) for voice/music.
Choose the video size (resolution/aspect).
Select the video duration (e.g., 5s / 10s).
Submit and wait for processing.
Preview and download the result.

Khám phá Các Mô hình Tương tự

NEW

HOT

Văn bản-Video

Van-2.6 Text-to-video

A speed-optimized text-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.

Van-2.6 Image-to-video

A speed-optimized image-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.

HappyHorse-1.1 Reference-to-video

Generates videos from one to nine reference images and a text prompt, supporting 720P or 1080P output, flexible aspect ratios, and durations from 3 to 15 seconds.

HappyHorse-1.1 Image-to-video

Animates a first-frame image into video with optional prompt guidance, 720P or 1080P output, and durations from 3 to 15 seconds.

HappyHorse-1.1 Text-to-video

Generates videos from text prompts with HappyHorse 1.1, supporting 720P or 1080P output, flexible aspect ratios, and durations from 3 to 15 seconds.

HappyHorse-1.0 Image-to-video

Animates a first-frame image into video with optional prompt guidance, 720P or 1080P output, and durations from 3 to 15 seconds.

HappyHorse-1.0 Text-to-video

Generates videos from text prompts with HappyHorse 1.0, supporting 720P or 1080P output, flexible aspect ratios, and durations from 3 to 15 seconds.

HappyHorse-1.0 Video-edit

Edits an input video with text instructions and optional reference images, supporting 720P or 1080P output.

HappyHorse-1.0 Reference-to-video

Generates videos from one to nine reference images and a text prompt, supporting 720P or 1080P output, flexible aspect ratios, and durations from 3 to 15 seconds.

From

$0.14/GIÂY