
Wan 2.6 Image-to-Video API by Alibaba
A speed-optimized image-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.
Đầu vào
Đầu ra
Nhàn rỗiMỗi lần chạy có giá $0.07. Với $10, bạn có thể chạy khoảng 142 lần.
Bạn có thể tiếp tục với:
Ví dụ mã
import requests
import time
# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "alibaba/wan-2.6/image-to-video",
"prompt": "A beautiful sunset over the ocean with gentle waves",
"width": 512,
"height": 512,
"duration": 3,
"fps": 24,
}
generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]
# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
def check_status():
while True:
response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
result = response.json()
if result["data"]["status"] in ["completed", "succeeded"]:
print("Generated video:", result["data"]["outputs"][0])
return result["data"]["outputs"][0]
elif result["data"]["status"] == "failed":
raise Exception(result["data"]["error"] or "Generation failed")
else:
# Still processing, wait 2 seconds
time.sleep(2)
video_url = check_status()Cài đặt
Cài đặt gói cần thiết cho ngôn ngữ lập trình của bạn.
pip install requestsXác thực
Tất cả các yêu cầu API đều cần xác thực thông qua khóa API. Bạn có thể lấy khóa API từ bảng điều khiển Atlas Cloud.
export ATLASCLOUD_API_KEY="your-api-key-here"HTTP Headers
import os
API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {API_KEY}"
}Không bao giờ để lộ khóa API trong mã phía máy khách hoặc kho lưu trữ công khai. Thay vào đó, hãy sử dụng biến môi trường hoặc proxy phía máy chủ.
Gửi yêu cầu
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "your-model",
"prompt": "A beautiful landscape"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())Gửi yêu cầu
Gửi yêu cầu tạo nội dung bất đồng bộ. API trả về một ID dự đoán mà bạn có thể sử dụng để kiểm tra trạng thái và lấy kết quả.
/api/v1/model/generateVideoNội dung yêu cầu
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "alibaba/wan-2.6/image-to-video",
"input": {
"prompt": "A beautiful sunset over the ocean with gentle waves"
}
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")Phản hồi
{
"id": "pred_abc123",
"status": "processing",
"model": "model-name",
"created_at": "2025-01-01T00:00:00Z"
}Kiểm tra trạng thái
Truy vấn endpoint dự đoán để kiểm tra trạng thái hiện tại của yêu cầu.
/api/v1/model/prediction/{prediction_id}Ví dụ truy vấn
import requests
import time
prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
while True:
response = requests.get(url, headers=headers)
result = response.json()
status = result["data"]["status"]
print(f"Status: {status}")
if status in ["completed", "succeeded"]:
output_url = result["data"]["outputs"][0]
print(f"Output URL: {output_url}")
break
elif status == "failed":
print(f"Error: {result['data'].get('error', 'Unknown')}")
break
time.sleep(3)Giá trị trạng thái
processingYêu cầu vẫn đang được xử lý.completedQuá trình tạo đã hoàn tất. Kết quả đầu ra đã sẵn sàng.succeededQuá trình tạo thành công. Kết quả đầu ra đã sẵn sàng.failedQuá trình tạo thất bại. Kiểm tra trường lỗi.Phản hồi hoàn tất
{
"data": {
"id": "pred_abc123",
"status": "completed",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}
}Tải tệp lên
Tải tệp lên bộ nhớ Atlas Cloud và nhận URL mà bạn có thể sử dụng trong các yêu cầu API của mình. Sử dụng multipart/form-data để tải lên.
/api/v1/model/uploadMediaVí dụ tải lên
import requests
url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
with open("image.png", "rb") as f:
files = {"file": ("image.png", f, "image/png")}
response = requests.post(url, headers=headers, files=files)
result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")Phản hồi
{
"data": {
"download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
"file_name": "image.png",
"content_type": "image/png",
"size": 1024000
}
}Input Schema
Các tham số sau được chấp nhận trong nội dung yêu cầu.
Không có tham số nào.
Ví dụ nội dung yêu cầu
{
"model": "alibaba/wan-2.6/image-to-video"
}Output Schema
API trả về phản hồi dự đoán với các URL đầu ra đã tạo.
Ví dụ phản hồi
{
"id": "pred_abc123",
"status": "completed",
"model": "model-name",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}Atlas Cloud Skills
Atlas Cloud Skills tích hợp hơn 300 mô hình AI trực tiếp vào trợ lý lập trình AI của bạn. Một lệnh để cài đặt, sau đó sử dụng ngôn ngữ tự nhiên để tạo hình ảnh, video và trò chuyện với LLM.
Ứng dụng được hỗ trợ
Cài đặt
npx skills add AtlasCloudAI/atlas-cloud-skillsThiết lập khóa API
Lấy khóa API từ bảng điều khiển Atlas Cloud và đặt nó làm biến môi trường.
export ATLASCLOUD_API_KEY="your-api-key-here"Khả năng
Sau khi cài đặt, bạn có thể sử dụng ngôn ngữ tự nhiên trong trợ lý AI để truy cập tất cả các mô hình Atlas Cloud.
MCP Server
Atlas Cloud MCP Server kết nối IDE của bạn với hơn 300 mô hình AI thông qua Model Context Protocol. Hoạt động với bất kỳ ứng dụng tương thích MCP nào.
Ứng dụng được hỗ trợ
Cài đặt
npx -y atlascloud-mcpCấu hình
Thêm cấu hình sau vào tệp cài đặt MCP của IDE.
{
"mcpServers": {
"atlascloud": {
"command": "npx",
"args": [
"-y",
"atlascloud-mcp"
],
"env": {
"ATLASCLOUD_API_KEY": "your-api-key-here"
}
}
}
}Công cụ khả dụng
Schema API
Schema không khả dụngĐăng nhập để xem lịch sử yêu cầu
Bạn cần đăng nhập để truy cập lịch sử yêu cầu mô hình của mình.
Đăng nhậpWan 2.6Sáng Tạo Video AI Đa Cảnh Quay Chuyên Nghiệp
Bước đột phá mới nhất của Alibaba trong tạo video AI. Tạo video 1080p lên đến 15 giây với kể chuyện đa cảnh quay, tính nhất quán nhân vật dựa trên tham chiếu và đồng bộ hóa nghe nhìn gốc. Mô hình đầu tiên thực sự hiểu logic storyboard cho câu chuyện điện ảnh.
Đột Phá Mang Tính Cách Mạng
Điều khiến Wan 2.6 trở thành game-changer trong tạo video AI
Kể Chuyện Đa Cảnh Quay
Mô hình đầu tiên hiểu logic storyboard. Tự động tạo các cảnh quay tuần tự với chuyển cảnh mạch lạc, duy trì diện mạo nhân vật và tính nhất quán môi trường qua các thay đổi cảnh—cho phép cung câu chuyện hoàn chỉnh trong một lần tạo 15 giây.
Tham Chiếu sang Video (R2V)
Tải lên video tham chiếu 2-30 giây để trích xuất và bảo toàn diện mạo nhân vật, mẫu chuyển động và đặc điểm giọng nói. Tạo diễn xuất nhân vật nhất quán trên nhiều video với độ chính xác chưa từng có.
Kết Xuất Văn Bản Chính Xác
Khả năng kết xuất văn bản hàng đầu ngành cho bao bì sản phẩm, biển hiệu và nội dung thương hiệu. Tạo văn bản rõ ràng, dễ đọc trong khung hình video—thiết yếu cho ứng dụng tiếp thị và thương mại.
Khả Năng Cốt Lõi
Thời Lượng Mở Rộng 15 Giây
Tạo tối đa 15 giây mỗi video với cấu trúc "Ba Hồi" đầy đủ (Dựng lên → Hành động → Giải quyết)
Chất Lượng 1080p Chuyên Nghiệp
Đầu ra gốc 1080p ở 24fps với chất lượng điện ảnh và độ ổn định hình ảnh được cải thiện
Đồng Bộ Âm Thanh Gốc
Đối thoại khớp với chuyển động môi, nhạc nền điều chỉnh theo nhịp độ, hiệu ứng âm thanh kích hoạt hoàn hảo
Tính Nhất Quán Nhân Vật
Duy trì diện mạo, trang phục và bản sắc nhân vật qua các cảnh quay và nhiều video
Điều Khiển Máy Quay Điện Ảnh
Chuyển động máy quay chuyên nghiệp bao gồm quay ngang, zoom, cảnh theo dõi và chuyển động dolly
Tỷ Lệ Khung Hình Linh Hoạt
16:9 (YouTube), 9:16 (Reels), 1:1 (Vuông) - tối ưu hóa nền tảng không cần cắt xén hậu kỳ
Wan 2.6 vs Wan 2.5: Cải Tiến Lớn
Xem có gì mới trong phiên bản mới nhất
Ba Chế Độ Tạo Chuyên Biệt
Chọn chế độ phù hợp cho quy trình sáng tạo của bạn
Văn Bản sang Video (T2V)
Phổ Biến NhấtTạo video hoàn chỉnh từ lệnh văn bản với phân đoạn đa cảnh quay nâng cao và xử lý lệnh cải tiến. Hoàn hảo cho kể chuyện và khám phá sáng tạo.
- Phân đoạn cảnh quay tự động từ lệnh đơn
- Hiểu tương tác nhiều nhân vật
- Chuyển động máy quay và tín hiệu cảm xúc
- Bảo toàn chi tiết môi trường
Hình Ảnh sang Video (I2V)
Nâng CaoBiến hình ảnh tĩnh thành video chuyển động với tính mạch lạc chuyển động được cải thiện. Lý tưởng cho trưng bày sản phẩm, hoạt hình ảnh và kể chuyện hình ảnh.
- Kết xuất văn bản chính xác cho sản phẩm
- Nhất quán phong cách qua các khung hình
- Chuyển động tự nhiên từ hình ảnh tĩnh
- Tối ưu hóa hình ảnh dựa trên câu chuyện
Tham Chiếu sang Video (R2V)
MỚITải lên video tham chiếu (2-30s) để bảo toàn diện mạo nhân vật, mẫu chuyển động và giọng nói. Đảm bảo nhất quán mạnh nhất cho nội dung dựa trên nhân vật.
- Bảo toàn bản sắc nhân vật đầy đủ
- Trích xuất đặc điểm giọng nói
- Sao chép mẫu chuyển động
- Cảnh đồng diễn nhiều nhân vật
Hoàn Hảo Cho
Tiếp Thị & Quảng Cáo
Demo sản phẩm với kết xuất văn bản, chiến dịch thương hiệu với nhân vật nhất quán và video quảng cáo
Sáng Tạo Nội Dung
Video YouTube, reels mạng xã hội, kể chuyện đa cảnh quay và quy trình chỉnh sửa video
Thương Mại Điện Tử
Trưng bày sản phẩm với văn bản chính xác, video hướng dẫn và tái tạo lời chứng thực khách hàng
Giáo Dục & Đào Tạo
Nội dung giảng dạy, tài liệu khóa học và câu chuyện giáo dục đa cảnh
Giải Trí
Phim ngắn, câu chuyện dựa trên nhân vật, chuỗi điện ảnh và thử nghiệm sáng tạo
Tiền Hình Dung
Phát triển khái niệm phim, tạo storyboard và lập kế hoạch cảnh cho sản xuất
Tích Hợp API Wan 2.6 T2V, I2V và R2V
Bộ API đầy đủ cho tạo Văn Bản sang Video, Hình Ảnh sang Video và Tham Chiếu sang Video
API Văn Bản sang Video (T2V API)
API Wan 2.6 T2V của chúng tôi biến lệnh văn bản thành video điện ảnh đa cảnh quay với phân đoạn cảnh tự động. Tạo video 1080p chuyên nghiệp lên đến 15 giây với đồng bộ âm thanh gốc.
API Hình Ảnh sang Video (I2V API)
API Wan 2.6 I2V của chúng tôi thổi sức sống vào hình ảnh tĩnh với điều khiển chuyển động chính xác và kết xuất văn bản. Hoàn hảo cho video sản phẩm, hoạt hình ảnh và tạo nội dung thương hiệu.
API Tham Chiếu sang Video (R2V API)
API Wan 2.6 R2V của chúng tôi bảo toàn bản sắc nhân vật từ video tham chiếu. Tải lên clip 2-30 giây để trích xuất diện mạo, giọng nói và mẫu chuyển động cho tạo nhân vật nhất quán.
Bộ API Đầy Đủ
Cả ba chế độ API Wan 2.6 (T2V API, I2V API, R2V API) đều hỗ trợ kiến trúc RESTful với tài liệu đầy đủ. Bắt đầu với SDK cho Python, Node.js và nhiều hơn. Mỗi endpoint bao gồm đồng bộ nghe nhìn gốc và quyền sử dụng thương mại đầy đủ.
Cách Bắt Đầu với Wan 2.6
Bắt đầu tạo video chuyên nghiệp trong vài phút với hai lộ trình đơn giản
Tích Hợp API
Cho nhà phát triển xây dựng ứng dụng
Đăng Ký & Đăng Nhập
Tạo tài khoản Atlas Cloud hoặc đăng nhập để truy cập bảng điều khiển
Thêm Phương Thức Thanh Toán
Liên kết thẻ tín dụng trong phần Thanh Toán để nạp tiền vào tài khoản
Tạo Khóa API
Điều hướng đến Bảng điều khiển → Khóa API và tạo khóa xác thực
Bắt Đầu Xây Dựng
Sử dụng endpoint API T2V, I2V hoặc R2V để tích hợp Wan 2.6 vào ứng dụng
Trải Nghiệm Playground
Cho thử nghiệm và thí nghiệm nhanh
Đăng Ký & Đăng Nhập
Tạo tài khoản Atlas Cloud hoặc đăng nhập để truy cập nền tảng
Thêm Phương Thức Thanh Toán
Liên kết thẻ tín dụng trong phần Thanh Toán để bắt đầu
Sử Dụng Playground
Đi đến playground Wan 2.6, chọn chế độ T2V/I2V/R2V và tạo video ngay lập tức
Câu Hỏi Thường Gặp
Điều gì khiến khả năng đa cảnh quay của Wan 2.6 trở nên độc đáo?
Wan 2.6 là mô hình đầu tiên thực sự hiểu logic storyboard. Không giống Wan 2.5 tạo hiệu ứng "biến hình" lộn xộn, Wan 2.6 có thể tự động phân đoạn một lệnh đơn thành nhiều cảnh quay riêng biệt với chuyển cảnh mạch lạc, duy trì tính nhất quán nhân vật qua các thay đổi cảnh.
Tham Chiếu sang Video (R2V) hoạt động như thế nào?
Tải lên video tham chiếu 2-30 giây, và Wan 2.6 trích xuất diện mạo nhân vật, mẫu chuyển động và đặc điểm giọng nói. Sau đó bạn có thể tạo video mới có cùng nhân vật với bản sắc nhất quán—lý tưởng cho việc tạo loạt nội dung dựa trên nhân vật.
Định dạng và thời lượng video nào được hỗ trợ?
Wan 2.6 tạo video 1080p ở 24fps với thời lượng từ 5 đến 15 giây. Tỷ lệ khung hình được hỗ trợ bao gồm 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) và 1:1 (định dạng vuông), được tối ưu hóa cho từng nền tảng mà không cần cắt xén hậu kỳ.
Wan 2.6 có thể kết xuất văn bản trong video không?
Có! Wan 2.6 có khả năng kết xuất văn bản hàng đầu ngành cho bao bì sản phẩm, biển hiệu và nội dung thương hiệu. Mô hình có thể tạo văn bản rõ ràng, dễ đọc trong khung hình video—tính năng quan trọng mà Seedance và hầu hết đối thủ không có.
Sự khác biệt giữa các chế độ T2V, I2V và R2V là gì?
T2V (Văn Bản sang Video) tạo từ lệnh văn bản với khả năng đa cảnh quay. I2V (Hình Ảnh sang Video) làm động hình ảnh tĩnh với kết xuất văn bản chính xác. R2V (Tham Chiếu sang Video) sử dụng tham chiếu video để bảo toàn bản sắc nhân vật qua các lần tạo. Chọn dựa trên loại đầu vào và nhu cầu nhất quán của bạn.
Tôi có quyền thương mại đối với video được tạo không?
Có! Mọi tác phẩm Wan 2.6 đều đi kèm với quyền sử dụng thương mại đầy đủ. Video sẵn sàng sản xuất cho chiến dịch tiếp thị, sản phẩm giao khách hàng, nội dung thương hiệu và ứng dụng thương mại mà không cần yêu cầu cấp phép bổ sung.
Tại Sao Sử Dụng Wan 2.6 trên Atlas Cloud?
Tận dụng cơ sở hạ tầng cấp doanh nghiệp cho quy trình tạo video chuyên nghiệp của bạn
Cơ Sở Hạ Tầng Xây Dựng Chuyên Biệt
Triển khai khả năng tạo đa cảnh quay và R2V của Wan 2.6 trên cơ sở hạ tầng được tối ưu hóa đặc biệt cho khối lượng công việc video AI đòi hỏi cao. Hiệu suất tối đa cho tạo 1080p 15 giây.
API Thống Nhất Cho Tất Cả Mô Hình
Truy cập Wan 2.6 (T2V, I2V, R2V) cùng với hơn 300 mô hình AI (LLM, hình ảnh, video, âm thanh) qua một API thống nhất. Tích hợp đơn lẻ cho tất cả nhu cầu AI tạo sinh với xác thực nhất quán.
Giá Cạnh Tranh
Tiết kiệm đến 70% so với AWS với giá trả theo sử dụng minh bạch. Không có phí ẩn, không cam kết—mở rộng từ mẫu thử đến sản xuất mà không phá vỡ ngân sách.
Bảo Mật Chứng Nhận SOC I & II
Video tham chiếu và nội dung được tạo của bạn được bảo vệ với chứng nhận SOC I & II và tuân thủ HIPAA. Bảo mật cấp doanh nghiệp với truyền tải và lưu trữ được mã hóa.
SLA Hoạt Động 99,9%
Độ tin cậy cấp doanh nghiệp với đảm bảo hoạt động 99,9%. Tạo video đa cảnh quay Wan 2.6 của bạn luôn sẵn sàng cho chiến dịch sản xuất và quy trình nội dung quan trọng.
Tích Hợp Dễ Dàng
Tích hợp hoàn chỉnh trong vài phút với REST API và SDK đa ngôn ngữ (Python, Node.js, Go). Chuyển đổi liền mạch giữa các chế độ T2V, I2V và R2V với cấu trúc endpoint thống nhất.
Thông Số Kỹ Thuật
Trải Nghiệm Tạo Video Đa Cảnh Quay Chuyên Nghiệp
Tham gia cùng các nhà sáng tạo nội dung, nhà tiếp thị và nhà làm phim trên toàn thế giới đang cách mạng hóa sản xuất video với khả năng kể chuyện đa cảnh quay và tính nhất quán nhân vật đột phá của Wan 2.6.
Alibaba WAN 2.6 Image-to-Video Model
Alibaba WAN 2.6 is an advanced image-to-video model on Alibaba Cloud’s DashScope. It generates high-quality videos from images and supports output resolutions of 720p and 1080p.
What makes it stand out?
-
More affordable: Wan 2.6 is more streamlined and cost-effective - reducing creator expenses and offering more options.
-
One-pass A/V sync: Wan 2.6 creates a fully synchronized video (audio/voiceover + lip-sync) from a single, well-structured prompt - no separate recording or manual alignment required.
-
Multilingual friendly: Wan 2.6 reliably processes like Chinese prompts for A/V-synced videos.
-
Longer duration & more video size options: Wan 2.6 delivers up to 10 seconds and 6 aspect/size options, enabling more storytelling room and publishing flexibility.
-
Multi-shot storytelling: Generates cohesive multi-shot narratives, keeping key details consistent across shots and offering auto shot-split for simple prompts.
-
Video reference generation: Uses a reference video's appearance and voice to guide new videos; supports human or arbitrary subjects, single or dual performers.
-
15s long videos: Produces videos up to 15 seconds, expanding temporal capacity for richer storytelling.
Designed For
-
Marketing teams: Fast, polished demos/tutorials—low cost, consistent style.
-
Global enterprises: Multilingual, lip-synced videos with subtitles for efficient localization.
-
Storytellers & YouTubers: Immersive narratives while maintaining cadence and quality—driving growth.
-
Corporate training teams: HD videos over docs—clearer key points, better communication.
Pricing
The table below lists prices for easy comparsion.
| Output Resolution | Duration (5s) | Duration (10s) |
|---|---|---|
| 720p | $0.5 | $1 |
| 1080p | $0.75 | $1.5 |
Billing Rules
-
Minimum charge: 5 seconds
-
Per-second rate = (price per 5 seconds) ÷ 5
-
Billed duration = video length in seconds (rounded up), with a 5-second minimum
-
Total cost = billed duration × per-second rate (by output resolution)
How to Use
-
Write your prompt.
-
Upload an audio file (optional) for voice/music.
-
Choose the video size (resolution/aspect).
-
Select the video duration (e.g., 5s / 10s).
-
Submit and wait for processing.
-
Preview and download the result.






