
Wan 2.6 Text-to-Video API by Alibaba
A speed-optimized text-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.
입력
출력
대기요청당 $0.07가 소요됩니다. $10로 이 모델을 약 142번 실행할 수 있습니다.
다음으로 할 수 있는 작업:
코드 예시
import requests
import time
# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "alibaba/wan-2.6/text-to-video",
"prompt": "A beautiful sunset over the ocean with gentle waves",
"width": 512,
"height": 512,
"duration": 3,
"fps": 24,
}
generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]
# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
def check_status():
while True:
response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
result = response.json()
if result["data"]["status"] in ["completed", "succeeded"]:
print("Generated video:", result["data"]["outputs"][0])
return result["data"]["outputs"][0]
elif result["data"]["status"] == "failed":
raise Exception(result["data"]["error"] or "Generation failed")
else:
# Still processing, wait 2 seconds
time.sleep(2)
video_url = check_status()설치
사용하는 언어에 필요한 패키지를 설치하세요.
pip install requests인증
모든 API 요청에는 API 키를 통한 인증이 필요합니다. Atlas Cloud 대시보드에서 API 키를 받을 수 있습니다.
export ATLASCLOUD_API_KEY="your-api-key-here"HTTP 헤더
import os
API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {API_KEY}"
}클라이언트 측 코드나 공개 저장소에 API 키를 노출하지 마세요. 대신 환경 변수 또는 백엔드 프록시를 사용하세요.
요청 제출
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "your-model",
"prompt": "A beautiful landscape"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())요청 제출
비동기 생성 요청을 제출합니다. API는 상태 확인 및 결과 조회에 사용할 수 있는 예측 ID를 반환합니다.
/api/v1/model/generateVideo요청 본문
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "alibaba/wan-2.6/text-to-video",
"input": {
"prompt": "A beautiful sunset over the ocean with gentle waves"
}
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")응답
{
"id": "pred_abc123",
"status": "processing",
"model": "model-name",
"created_at": "2025-01-01T00:00:00Z"
}상태 확인
예측 엔드포인트를 폴링하여 요청의 현재 상태를 확인합니다.
/api/v1/model/prediction/{prediction_id}폴링 예시
import requests
import time
prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
while True:
response = requests.get(url, headers=headers)
result = response.json()
status = result["data"]["status"]
print(f"Status: {status}")
if status in ["completed", "succeeded"]:
output_url = result["data"]["outputs"][0]
print(f"Output URL: {output_url}")
break
elif status == "failed":
print(f"Error: {result['data'].get('error', 'Unknown')}")
break
time.sleep(3)상태 값
processing요청이 아직 처리 중입니다.completed생성이 완료되었습니다. 출력을 사용할 수 있습니다.succeeded생성이 성공했습니다. 출력을 사용할 수 있습니다.failed생성에 실패했습니다. 오류 필드를 확인하세요.완료 응답
{
"data": {
"id": "pred_abc123",
"status": "completed",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}
}파일 업로드
Atlas Cloud 스토리지에 파일을 업로드하고 API 요청에 사용할 수 있는 URL을 받습니다. multipart/form-data를 사용하여 업로드합니다.
/api/v1/model/uploadMedia업로드 예시
import requests
url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
with open("image.png", "rb") as f:
files = {"file": ("image.png", f, "image/png")}
response = requests.post(url, headers=headers, files=files)
result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")응답
{
"data": {
"download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
"file_name": "image.png",
"content_type": "image/png",
"size": 1024000
}
}입력 Schema
다음 매개변수가 요청 본문에서 사용 가능합니다.
사용 가능한 매개변수가 없습니다.
요청 본문 예시
{
"model": "alibaba/wan-2.6/text-to-video"
}출력 Schema
API는 생성된 출력 URL이 포함된 예측 응답을 반환합니다.
응답 예시
{
"id": "pred_abc123",
"status": "completed",
"model": "model-name",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}Atlas Cloud Skills
Atlas Cloud Skills는 300개 이상의 AI 모델을 AI 코딩 어시스턴트에 직접 통합합니다. 한 번의 명령으로 설치하고 자연어로 이미지, 동영상 생성 및 LLM과 대화할 수 있습니다.
지원 클라이언트
설치
npx skills add AtlasCloudAI/atlas-cloud-skillsAPI 키 설정
Atlas Cloud 대시보드에서 API 키를 받아 환경 변수로 설정하세요.
export ATLASCLOUD_API_KEY="your-api-key-here"기능
설치 후 AI 어시스턴트에서 자연어를 사용하여 모든 Atlas Cloud 모델에 접근할 수 있습니다.
MCP Server
Atlas Cloud MCP Server는 Model Context Protocol을 통해 IDE와 300개 이상의 AI 모델을 연결합니다. MCP 호환 클라이언트에서 사용할 수 있습니다.
지원 클라이언트
설치
npx -y atlascloud-mcp설정
다음 설정을 IDE의 MCP 설정 파일에 추가하세요.
{
"mcpServers": {
"atlascloud": {
"command": "npx",
"args": [
"-y",
"atlascloud-mcp"
],
"env": {
"ATLASCLOUD_API_KEY": "your-api-key-here"
}
}
}
}사용 가능한 도구
API 스키마
스키마를 사용할 수 없음Wan 2.6전문가급 멀티샷 AI 비디오 제작
Alibaba의 최신 AI 비디오 생성 기술 혁신. 멀티샷 스토리텔링, 참조 기반 캐릭터 일관성, 네이티브 오디오-비주얼 동기화를 갖춘 최대 15초 1080p 비디오를 제작하세요. 시네마틱 내러티브를 위한 스토리보드 로직을 진정으로 이해하는 최초의 모델입니다.
혁명적인 돌파구
Wan 2.6이 AI 비디오 생성의 게임 체인저인 이유
멀티샷 스토리텔링
스토리보드 로직을 이해하는 최초의 모델. 장면 전환을 통해 캐릭터 외관과 환경 일관성을 유지하면서 일관된 전환을 가진 연속 샷을 자동 생성—단일 15초 생성에서 완전한 스토리 아크를 구현합니다.
참조 비디오 변환(R2V)
2~30초 참조 비디오를 업로드하여 캐릭터 외관, 동작 패턴, 음성 특성을 추출하고 보존합니다. 전례 없는 정확도로 여러 비디오에 걸쳐 일관된 캐릭터 퍼포먼스를 생성하세요.
정확한 텍스트 렌더링
제품 패키징, 사이니지, 브랜드 콘텐츠를 위한 업계 최고의 텍스트 렌더링 기능. 비디오 프레임 내에 명확하고 읽기 쉬운 텍스트 생성—마케팅 및 상업 애플리케이션에 필수적입니다.
핵심 기능
15초 확장 지속 시간
완전한 "3막 구조"(설정 → 전개 → 해결)를 갖춘 최대 15초 비디오 생성
전문가급 1080p 품질
시네마틱 품질과 향상된 시각적 안정성을 갖춘 24fps 네이티브 1080p 출력
네이티브 오디오 동기화
입 모양과 대화가 일치하고, 페이싱에 맞춘 배경 음악, 완벽하게 트리거되는 효과음
캐릭터 일관성
샷과 여러 비디오를 통해 캐릭터 외관, 의상, 정체성 유지
시네마틱 카메라 제어
팬, 줌, 트래킹 샷, 달리 이동을 포함한 전문 카메라 움직임
유연한 종횡비
16:9(YouTube), 9:16(릴스), 1:1(정사각형)—후반 작업 크롭 없이 플랫폼 최적화
Wan 2.6 vs Wan 2.5: 주요 개선 사항
최신 릴리스의 새로운 기능 확인
3가지 전문 생성 모드
크리에이티브 워크플로에 적합한 모드 선택
텍스트-비디오(T2V)
가장 인기향상된 멀티샷 세그먼테이션과 개선된 프롬프트 처리를 갖춘 텍스트 프롬프트에서 완전한 비디오 생성. 스토리텔링 및 창의적 탐구에 완벽합니다.
- 단일 프롬프트에서 자동 샷 세그먼테이션
- 멀티 캐릭터 상호작용 이해
- 카메라 움직임 및 감정적 단서
- 환경 디테일 보존
이미지-비디오(I2V)
향상됨개선된 모션 일관성으로 정지 이미지를 모션 비디오로 변환. 제품 쇼케이스, 사진 애니메이션, 비주얼 스토리텔링에 이상적입니다.
- 제품의 정확한 텍스트 렌더링
- 프레임 간 스타일 일관성
- 정지 이미지에서 자연스러운 모션
- 내러티브 중심 비주얼 최적화
참조 비디오 변환(R2V)
신규참조 비디오(2~30초)를 업로드하여 캐릭터 외관, 동작 패턴, 음성을 보존합니다. 캐릭터 중심 콘텐츠를 위한 최강의 일관성 보장.
- 완전한 캐릭터 정체성 보존
- 음성 특성 추출
- 동작 패턴 복제
- 멀티 캐릭터 공연 장면
완벽한 용도
마케팅 & 광고
텍스트 렌더링 포함 제품 데모, 캐릭터 일관성 있는 브랜드 캠페인, 프로모션 비디오
콘텐츠 제작
YouTube 비디오, 소셜 미디어 릴스, 멀티샷 스토리텔링, 비디오 편집 워크플로
이커머스
정확한 텍스트가 있는 제품 쇼케이스, 튜토리얼 비디오, 고객 후기 재현
교육 & 훈련
교육 콘텐츠, 강좌 자료, 멀티 장면 교육 내러티브
엔터테인먼트
단편 영화, 캐릭터 중심 스토리, 시네마틱 시퀀스, 창의적 실험
프리비주얼라이제이션
영화 컨셉 개발, 스토리보드 제작, 프로덕션을 위한 장면 계획
Wan 2.6 T2V, I2V, R2V API 통합
텍스트-비디오, 이미지-비디오, 참조 비디오 변환을 위한 완전한 API 스위트
텍스트-비디오 API(T2V API)
저희 Wan 2.6 T2V API는 텍스트 프롬프트를 자동 장면 세그먼테이션이 있는 멀티샷 시네마틱 비디오로 변환합니다. 네이티브 오디오 동기화를 갖춘 최대 15초의 전문 1080p 비디오를 생성하세요.
이미지-비디오 API(I2V API)
저희 Wan 2.6 I2V API는 정확한 모션 제어와 텍스트 렌더링으로 정지 이미지에 생명을 불어넣습니다. 제품 비디오, 사진 애니메이션, 브랜드 콘텐츠 제작에 완벽합니다.
참조 비디오 변환 API(R2V API)
저희 Wan 2.6 R2V API는 참조 비디오에서 캐릭터 정체성을 보존합니다. 외관, 음성, 동작 패턴을 추출하여 일관된 캐릭터 생성을 위해 2~30초 클립을 업로드하세요.
완전한 API 스위트
모든 3가지 Wan 2.6 API 모드(T2V API, I2V API, R2V API)는 포괄적인 문서와 함께 RESTful 아키텍처를 지원합니다. Python, Node.js 등을 위한 SDK로 시작하세요. 각 엔드포인트에는 네이티브 오디오-비주얼 동기화 및 완전한 상업적 사용권이 포함됩니다.
Wan 2.6 시작하기
두 가지 간단한 경로로 몇 분 안에 전문 비디오 제작 시작
API 통합
애플리케이션을 구축하는 개발자용
가입 및 로그인
Atlas Cloud 계정을 만들거나 로그인하여 콘솔에 액세스
결제 방법 추가
청구 섹션에서 신용카드를 연결하여 계정에 자금 충전
API 키 생성
콘솔 → API 키로 이동하여 인증 키 생성
빌드 시작
T2V, I2V 또는 R2V API 엔드포인트를 사용하여 Wan 2.6을 애플리케이션에 통합
Playground 경험
빠른 테스트 및 실험용
가입 및 로그인
Atlas Cloud 계정을 만들거나 로그인하여 플랫폼에 액세스
결제 방법 추가
청구 섹션에서 신용카드를 연결하여 시작
Playground 사용
Wan 2.6 playground로 이동하여 T2V/I2V/R2V 모드를 선택하고 즉시 비디오 생성
자주 묻는 질문
Wan 2.6의 멀티샷 기능의 고유성은 무엇인가요?
Wan 2.6은 스토리보드 로직을 진정으로 이해하는 최초의 모델입니다. 지저분한 "모핑" 효과를 만든 Wan 2.5와 달리, Wan 2.6은 단일 프롬프트를 일관된 전환을 가진 여러 개의 명확한 샷으로 자동 세그먼트화하여 장면 전환을 통해 캐릭터 일관성을 유지할 수 있습니다.
참조 비디오 변환(R2V)은 어떻게 작동하나요?
2~30초 참조 비디오를 업로드하면 Wan 2.6이 캐릭터의 외관, 동작 패턴, 음성 특성을 추출합니다. 그런 다음 일관된 정체성을 가진 동일한 캐릭터를 특징으로 하는 새 비디오를 생성할 수 있습니다—캐릭터 중심 콘텐츠 시리즈를 만드는 데 이상적입니다.
지원되는 비디오 형식과 지속 시간은?
Wan 2.6은 5~15초 지속 시간으로 24fps의 1080p 비디오를 생성합니다. 지원되는 종횡비에는 16:9(YouTube), 9:16(Instagram Reels/TikTok), 1:1(정사각형 형식)이 포함되며 각 플랫폼에 최적화되어 있어 후반 작업 크롭이 필요하지 않습니다.
Wan 2.6은 비디오에서 텍스트를 렌더링할 수 있나요?
네! Wan 2.6은 제품 패키징, 사이니지, 브랜드 콘텐츠를 위한 업계 최고의 텍스트 렌더링을 갖추고 있습니다. 이 모델은 비디오 프레임 내에 명확하고 읽기 쉬운 텍스트를 생성할 수 있습니다—이것은 Seedance와 대부분의 경쟁사가 부족한 중요한 기능입니다.
T2V, I2V, R2V 모드의 차이점은 무엇인가요?
T2V(텍스트-비디오)는 멀티샷 기능을 갖춘 텍스트 프롬프트에서 생성합니다. I2V(이미지-비디오)는 정확한 텍스트 렌더링으로 정지 이미지를 애니메이션화합니다. R2V(참조 비디오 변환)는 비디오 참조를 사용하여 생성 전반에 걸쳐 캐릭터 정체성을 보존합니다. 입력 유형과 일관성 요구 사항에 따라 선택하세요.
생성된 비디오에 대한 상업적 권리가 있나요?
네! 모든 Wan 2.6 생성물에는 완전한 상업적 사용권이 포함되어 있습니다. 비디오는 추가 라이선스 요구 사항 없이 마케팅 캠페인, 클라이언트 결과물, 브랜드 콘텐츠 및 상업적 애플리케이션에 프로덕션 준비가 되어 있습니다.
Atlas Cloud에서 Wan 2.6을 사용하는 이유
전문 비디오 생성 워크플로를 위한 엔터프라이즈급 인프라 활용
목적별 인프라
까다로운 AI 비디오 워크로드에 특별히 최적화된 인프라에 Wan 2.6의 멀티샷 생성 및 R2V 기능을 배포하세요. 1080p 15초 생성을 위한 최대 성능.
모든 모델을 위한 통합 API
하나의 통합 API를 통해 Wan 2.6(T2V, I2V, R2V)과 300개 이상의 AI 모델(LLM, 이미지, 비디오, 오디오)에 액세스하세요. 일관된 인증으로 모든 생성형 AI 요구 사항을 위한 단일 통합.
경쟁력 있는 가격
투명한 종량제 가격으로 AWS 대비 최대 70% 절약. 숨겨진 수수료나 약정 없음—은행을 터뜨리지 않고 프로토타입에서 프로덕션으로 확장하세요.
SOC I & II 인증 보안
SOC I & II 인증 및 HIPAA 규정 준수로 참조 비디오와 생성된 콘텐츠를 보호합니다. 암호화된 전송 및 스토리지를 갖춘 엔터프라이즈급 보안.
99.9% 가동 시간 SLA
보장된 99.9% 가동 시간을 갖춘 엔터프라이즈급 안정성. Wan 2.6 멀티샷 비디오 생성은 프로덕션 캠페인 및 중요한 콘텐츠 워크플로를 위해 항상 사용 가능합니다.
손쉬운 통합
REST API 및 다국어 SDK(Python, Node.js, Go)로 몇 분 안에 완전한 통합. 통합 엔드포인트 구조로 T2V, I2V, R2V 모드 간 원활한 전환.
기술 사양
전문가급 멀티샷 비디오 생성 경험
Wan 2.6의 획기적인 멀티샷 스토리텔링 및 캐릭터 일관성 기능으로 비디오 제작을 혁신하고 있는 전 세계 콘텐츠 크리에이터, 마케터, 영화 제작자에 합류하세요.
Alibaba WAN 2.6 Text-to-Video Model
Alibaba WAN 2.6 is an advanced text-to-video model provided by Alibaba Cloud's DashScope platform. This model generates high-quality 480p/720p/1080p videos from text prompts.
What makes it stand out?
-
More affordable: Wan 2.6 is more streamlined and cost-effective - reducing creator expenses and offering more options.
-
One-pass A/V sync: Wan 2.6 creates a fully synchronized video (audio/voiceover + lip-sync) from a single, well-structured prompt - no separate recording or manual alignment required.
-
Multilingual friendly: Wan 2.6 reliably processes like Chinese prompts for A/V-synced videos.
-
Longer duration & more video size options: Wan 2.6 delivers up to 10 seconds and 6 aspect/size options, enabling more storytelling room and publishing flexibility.
-
Multi-shot storytelling: Generates cohesive multi-shot narratives, keeping key details consistent across shots and offering auto shot-split for simple prompts.
-
Video reference generation: Uses a reference video's appearance and voice to guide new videos; supports human or arbitrary subjects, single or dual performers.
-
15s long videos: Produces videos up to 15 seconds, expanding temporal capacity for richer storytelling.
Designed For
-
Marketing teams: Fast, polished demos/tutorials—low cost, consistent style.
-
Global enterprises: Multilingual, lip-synced videos with subtitles for efficient localization.
-
Storytellers & YouTubers: Immersive narratives while maintaining cadence and quality—driving growth.
-
Corporate training teams: HD videos over docs—clearer key points, better communication.
Pricing
The table below lists prices for easy comparsion.
| Output Resolution | Duration (5s) | Duration (10s) |
|---|---|---|
| 480p | $0.2 | $0.4 |
| 720p | $0.4 | $0.8 |
| 1080p | $0.6 | $1.2 |
Billing Rules
-
Minimum charge: 5 seconds
-
Per-second rate = (price per 5 seconds) ÷ 5
-
Billed duration = video length in seconds (rounded up), with a 5-second minimum
-
Total cost = billed duration × per-second rate (by output resolution)
How to Use
-
Write your prompt.
-
Upload an audio file (optional) for voice/music.
-
Choose the video size (resolution/aspect).
-
Select the video duration (e.g., 5s / 10s).
-
Submit and wait for processing.
-
Preview and download the result.






