
Wan 2.6 Text-to-Video API by Alibaba
A speed-optimized text-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.
الإدخال
الإخراج
في انتظار التنفيذكل مرة ستكلف $0.07 مع $10 يمكنك التشغيل حوالي 142 مرة
يمكنك المتابعة بـ:
مثال الكود
import requests
import time
# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "alibaba/wan-2.6/text-to-video",
"prompt": "A beautiful sunset over the ocean with gentle waves",
"width": 512,
"height": 512,
"duration": 3,
"fps": 24,
}
generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]
# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
def check_status():
while True:
response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
result = response.json()
if result["data"]["status"] in ["completed", "succeeded"]:
print("Generated video:", result["data"]["outputs"][0])
return result["data"]["outputs"][0]
elif result["data"]["status"] == "failed":
raise Exception(result["data"]["error"] or "Generation failed")
else:
# Still processing, wait 2 seconds
time.sleep(2)
video_url = check_status()التثبيت
قم بتثبيت الحزمة المطلوبة للغة البرمجة الخاصة بك.
pip install requestsالمصادقة
تتطلب جميع طلبات API المصادقة عبر مفتاح API. يمكنك الحصول على مفتاح API الخاص بك من لوحة تحكم Atlas Cloud.
export ATLASCLOUD_API_KEY="your-api-key-here"ترويسات HTTP
import os
API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {API_KEY}"
}لا تكشف أبدًا مفتاح API الخاص بك في الكود من جانب العميل أو المستودعات العامة. استخدم متغيرات البيئة أو وكيل الخادم الخلفي بدلاً من ذلك.
إرسال طلب
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "your-model",
"prompt": "A beautiful landscape"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())إرسال طلب
أرسل طلب توليد غير متزامن. تُرجع API معرّف التنبؤ الذي يمكنك استخدامه للتحقق من الحالة واسترداد النتيجة.
/api/v1/model/generateVideoنص الطلب
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "alibaba/wan-2.6/text-to-video",
"input": {
"prompt": "A beautiful sunset over the ocean with gentle waves"
}
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")الاستجابة
{
"id": "pred_abc123",
"status": "processing",
"model": "model-name",
"created_at": "2025-01-01T00:00:00Z"
}التحقق من الحالة
استعلم عن نقطة نهاية التنبؤ للتحقق من الحالة الحالية لطلبك.
/api/v1/model/prediction/{prediction_id}مثال الاستعلام
import requests
import time
prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
while True:
response = requests.get(url, headers=headers)
result = response.json()
status = result["data"]["status"]
print(f"Status: {status}")
if status in ["completed", "succeeded"]:
output_url = result["data"]["outputs"][0]
print(f"Output URL: {output_url}")
break
elif status == "failed":
print(f"Error: {result['data'].get('error', 'Unknown')}")
break
time.sleep(3)قيم الحالة
processingلا يزال الطلب قيد المعالجة.completedاكتمل التوليد. المخرجات متاحة.succeededنجح التوليد. المخرجات متاحة.failedفشل التوليد. تحقق من حقل الخطأ.استجابة مكتملة
{
"data": {
"id": "pred_abc123",
"status": "completed",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}
}رفع الملفات
ارفع الملفات إلى تخزين Atlas Cloud واحصل على URL يمكنك استخدامه في طلبات API الخاصة بك. استخدم multipart/form-data للرفع.
/api/v1/model/uploadMediaمثال الرفع
import requests
url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
with open("image.png", "rb") as f:
files = {"file": ("image.png", f, "image/png")}
response = requests.post(url, headers=headers, files=files)
result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")الاستجابة
{
"data": {
"download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
"file_name": "image.png",
"content_type": "image/png",
"size": 1024000
}
}Input Schema
المعاملات التالية مقبولة في نص الطلب.
لا توجد معاملات متاحة.
مثال على نص الطلب
{
"model": "alibaba/wan-2.6/text-to-video"
}Output Schema
تُرجع API استجابة تنبؤ تحتوي على عناوين URL للمخرجات المولّدة.
مثال على الاستجابة
{
"id": "pred_abc123",
"status": "completed",
"model": "model-name",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}Atlas Cloud Skills
يدمج Atlas Cloud Skills أكثر من 300 نموذج ذكاء اصطناعي مباشرة في مساعد البرمجة بالذكاء الاصطناعي الخاص بك. أمر واحد للتثبيت، ثم استخدم اللغة الطبيعية لتوليد الصور ومقاطع الفيديو والدردشة مع LLM.
العملاء المدعومون
التثبيت
npx skills add AtlasCloudAI/atlas-cloud-skillsإعداد مفتاح API
احصل على مفتاح API الخاص بك من لوحة تحكم Atlas Cloud وعيّنه كمتغير بيئة.
export ATLASCLOUD_API_KEY="your-api-key-here"الإمكانيات
بمجرد التثبيت، يمكنك استخدام اللغة الطبيعية في مساعد الذكاء الاصطناعي الخاص بك للوصول إلى جميع نماذج Atlas Cloud.
MCP Server
يربط Atlas Cloud MCP Server بيئة التطوير الخاصة بك بأكثر من 300 نموذج ذكاء اصطناعي عبر Model Context Protocol. يعمل مع أي عميل متوافق مع MCP.
العملاء المدعومون
التثبيت
npx -y atlascloud-mcpالتكوين
أضف التكوين التالي إلى ملف إعدادات MCP في بيئة التطوير الخاصة بك.
{
"mcpServers": {
"atlascloud": {
"command": "npx",
"args": [
"-y",
"atlascloud-mcp"
],
"env": {
"ATLASCLOUD_API_KEY": "your-api-key-here"
}
}
}
}الأدوات المتاحة
مخطط API
المخطط غير متاحWan 2.6إنشاء فيديو AI متعدد اللقطات احترافي
أحدث إنجاز لشركة Alibaba في إنشاء فيديو AI. أنشئ مقاطع فيديو 1080p حتى 15 ثانية مع سرد قصص متعدد اللقطات، واتساق الشخصيات المستند إلى المراجع، ومزامنة سمعية بصرية أصلية. النموذج الأول الذي يفهم حقاً منطق لوحة القصة للسرد السينمائي.
اختراقات ثورية
ما يجعل Wan 2.6 محطم قواعد اللعبة في إنشاء فيديو AI
سرد متعدد اللقطات
أول نموذج يفهم منطق لوحة القصة. يولد تلقائياً لقطات متسلسلة مع انتقالات متماسكة، مع الحفاظ على مظهر الشخصية واتساق البيئة عبر تغييرات المشهد—مما يتيح أقواس قصة كاملة في توليد واحد مدته 15 ثانية.
مرجع إلى فيديو (R2V)
قم بتحميل فيديو مرجعي من 2-30 ثانية لاستخراج والحفاظ على مظهر الشخصية وأنماط الحركة وخصائص الصوت. أنشئ عروض شخصيات متسقة عبر مقاطع فيديو متعددة بدقة غير مسبوقة.
عرض نص دقيق
قدرات عرض نصوص رائدة في الصناعة لتغليف المنتجات واللافتات ومحتوى العلامة التجارية. إنشاء نص واضح وقابل للقراءة داخل إطارات الفيديو—ضروري لتطبيقات التسويق والتجارية.
القدرات الأساسية
مدة ممتدة 15 ثانية
إنشاء حتى 15 ثانية لكل فيديو مع بنية "ثلاثة فصول" كاملة (الإعداد ← العمل ← الحل)
جودة 1080p احترافية
إخراج 1080p أصلي عند 24fps مع جودة سينمائية واستقرار بصري محسّن
مزامنة صوت أصلية
الحوار يطابق حركات الشفاه، الموسيقى الخلفية تتماشى مع الإيقاع، المؤثرات الصوتية تُفعّل بشكل مثالي
اتساق الشخصية
احتفظ بمظهر الشخصية والأزياء والهوية عبر اللقطات ومقاطع الفيديو المتعددة
تحكم الكاميرا السينمائي
حركات كاميرا احترافية بما في ذلك التحريك والتكبير ولقطات التتبع وحركات الدوللي
نسب عرض مرنة
16:9 (YouTube)، 9:16 (Reels)، 1:1 (مربع) - محسّن للمنصة بدون اقتصاص ما بعد الإنتاج
Wan 2.6 مقابل Wan 2.5: تحسينات كبيرة
شاهد الجديد في أحدث إصدار
ثلاثة أوضاع توليد متخصصة
اختر الوضع المناسب لسير عملك الإبداعي
نص إلى فيديو (T2V)
الأكثر شعبيةإنشاء مقاطع فيديو كاملة من مطالبات نصية مع تقسيم متعدد اللقطات محسّن ومعالجة مطالبات محسّنة. مثالي لسرد القصص والاستكشاف الإبداعي.
- تقسيم لقطة تلقائي من مطالبة واحدة
- فهم تفاعل متعدد الشخصيات
- حركة الكاميرا والإشارات العاطفية
- الحفاظ على تفاصيل البيئة
صورة إلى فيديو (I2V)
محسّنتحويل الصور الثابتة إلى مقاطع فيديو متحركة مع تماسك حركة محسّن. مثالي لعروض المنتجات وتحريك الصور والسرد البصري.
- عرض نص دقيق للمنتجات
- اتساق النمط عبر الإطارات
- حركة طبيعية من الصور الثابتة
- تحسين بصري مدفوع بالسرد
مرجع إلى فيديو (R2V)
جديدقم بتحميل فيديو مرجعي (2-30 ثانية) للحفاظ على مظهر الشخصية وأنماط الحركة والصوت. أقوى ضمان اتساق للمحتوى المدفوع بالشخصيات.
- حفظ هوية الشخصية الكاملة
- استخراج خصائص الصوت
- تكرار نمط الحركة
- مشاهد تمثيل مشترك متعددة الشخصيات
مثالي لـ
التسويق والإعلان
عروض منتجات مع عرض نصوص، حملات علامة تجارية مع اتساق الشخصيات، ومقاطع فيديو ترويجية
إنشاء المحتوى
مقاطع فيديو YouTube، reels وسائل التواصل الاجتماعي، سرد متعدد اللقطات، وسير عمل تحرير الفيديو
التجارة الإلكترونية
عروض منتجات بنصوص دقيقة، مقاطع فيديو تعليمية، وإعادة إنشاء شهادات العملاء
التعليم والتدريب
محتوى تعليمي، مواد دورات، وسرديات تعليمية متعددة المشاهد
الترفيه
أفلام قصيرة، قصص مدفوعة بالشخصيات، تسلسلات سينمائية، وتجارب إبداعية
التصور المسبق
تطوير مفهوم الفيلم، إنشاء لوحة القصة، وتخطيط المشهد للإنتاج
تكامل Wan 2.6 T2V و I2V و R2V API
مجموعة API كاملة لتوليد نص إلى فيديو، صورة إلى فيديو، ومرجع إلى فيديو
API نص إلى فيديو (T2V API)
يحول Wan 2.6 T2V API الخاص بنا المطالبات النصية إلى مقاطع فيديو سينمائية متعددة اللقطات مع تقسيم مشهد تلقائي. إنشاء مقاطع فيديو احترافية 1080p حتى 15 ثانية مع مزامنة صوت أصلية.
API صورة إلى فيديو (I2V API)
يبث Wan 2.6 I2V API الخاص بنا الحياة في الصور الثابتة مع تحكم حركة دقيق وعرض نصوص. مثالي لمقاطع فيديو المنتجات وتحريك الصور وإنشاء محتوى العلامة التجارية.
API مرجع إلى فيديو (R2V API)
يحافظ Wan 2.6 R2V API الخاص بنا على هوية الشخصية من مقاطع الفيديو المرجعية. قم بتحميل مقاطع 2-30 ثانية لاستخراج المظهر والصوت وأنماط الحركة لتوليد شخصية متسق.
مجموعة API كاملة
جميع أوضاع Wan 2.6 API الثلاثة (T2V API، I2V API، R2V API) تدعم بنية RESTful مع وثائق شاملة. ابدأ مع SDK لـ Python و Node.js والمزيد. كل نقطة نهاية تتضمن مزامنة سمعية بصرية أصلية وحقوق استخدام تجاري كاملة.
كيفية البدء مع Wan 2.6
ابدأ في إنشاء مقاطع فيديو احترافية في دقائق مع مسارين بسيطين
تكامل API
للمطورين الذين يبنون التطبيقات
التسجيل وتسجيل الدخول
أنشئ حساب Atlas Cloud الخاص بك أو سجّل الدخول للوصول إلى وحدة التحكم
إضافة طريقة الدفع
اربط بطاقتك الائتمانية في قسم الفواتير لتمويل حسابك
إنشاء مفتاح API
انتقل إلى وحدة التحكم ← مفاتيح API وأنشئ مفتاح المصادقة الخاص بك
ابدأ البناء
استخدم نقاط نهاية T2V أو I2V أو R2V API لدمج Wan 2.6 في تطبيقك
تجربة Playground
للاختبار السريع والتجريب
التسجيل وتسجيل الدخول
أنشئ حساب Atlas Cloud الخاص بك أو سجّل الدخول للوصول إلى المنصة
إضافة طريقة الدفع
اربط بطاقتك الائتمانية في قسم الفواتير للبدء
استخدام Playground
اذهب إلى Wan 2.6 playground، اختر وضع T2V/I2V/R2V، وأنشئ مقاطع فيديو فوراً
الأسئلة الشائعة
ما الذي يجعل قدرة متعددة اللقطات في Wan 2.6 فريدة؟
Wan 2.6 هو النموذج الأول الذي يفهم حقاً منطق لوحة القصة. على عكس Wan 2.5 الذي أنشأ تأثيرات "تحول" فوضوية، يمكن لـ Wan 2.6 تقسيم مطالبة واحدة تلقائياً إلى لقطات متعددة متميزة مع انتقالات متماسكة، مع الحفاظ على اتساق الشخصية عبر تغييرات المشهد.
كيف يعمل مرجع إلى فيديو (R2V)؟
قم بتحميل فيديو مرجعي من 2-30 ثانية، ويستخرج Wan 2.6 مظهر الشخصية وأنماط الحركة وخصائص الصوت. يمكنك بعد ذلك إنشاء مقاطع فيديو جديدة تعرض نفس الشخصية بهوية متسقة—مثالي لإنشاء سلسلة محتوى مدفوعة بالشخصيات.
ما هي تنسيقات ومدد الفيديو المدعومة؟
ينشئ Wan 2.6 مقاطع فيديو 1080p عند 24fps مع مدد من 5 إلى 15 ثانية. نسب العرض المدعومة تشمل 16:9 (YouTube)، 9:16 (Instagram Reels/TikTok)، و1:1 (تنسيق مربع)، محسّنة لكل منصة دون الحاجة إلى اقتصاص ما بعد الإنتاج.
هل يمكن لـ Wan 2.6 عرض النصوص في مقاطع الفيديو؟
نعم! يحتوي Wan 2.6 على عرض نصوص رائد في الصناعة لتغليف المنتجات واللافتات ومحتوى العلامة التجارية. يمكن للنموذج إنشاء نص واضح وقابل للقراءة داخل إطارات الفيديو—ميزة حاسمة يفتقر إليها Seedance ومعظم المنافسين.
ما الفرق بين أوضاع T2V و I2V و R2V؟
T2V (نص إلى فيديو) ينشئ من مطالبات نصية مع قدرة متعددة اللقطات. I2V (صورة إلى فيديو) يحرك الصور الثابتة مع عرض نصوص دقيق. R2V (مرجع إلى فيديو) يستخدم مراجع فيديو للحفاظ على هوية الشخصية عبر التوليدات. اختر بناءً على نوع الإدخال واحتياجات الاتساق الخاصة بك.
هل لدي حقوق تجارية على مقاطع الفيديو المُنشأة؟
نعم! كل إبداع Wan 2.6 يأتي مع حقوق استخدام تجاري كاملة. مقاطع الفيديو جاهزة للإنتاج للحملات التسويقية والتسليمات للعملاء ومحتوى العلامة التجارية والتطبيقات التجارية بدون متطلبات ترخيص إضافية.
لماذا تستخدم Wan 2.6 على Atlas Cloud؟
استفد من البنية التحتية على مستوى المؤسسات لسير عمل توليد الفيديو الاحترافي الخاص بك
بنية تحتية مخصصة الغرض
انشر توليد متعدد اللقطات وقدرات R2V لـ Wan 2.6 على بنية تحتية محسّنة خصيصاً لأحمال عمل فيديو AI المطلوبة. أقصى أداء لتوليد 1080p 15 ثانية.
API موحد لجميع النماذج
الوصول إلى Wan 2.6 (T2V، I2V، R2V) جنباً إلى جنب مع أكثر من 300 نموذج AI (LLMs، صورة، فيديو، صوت) من خلال API موحد واحد. تكامل واحد لجميع احتياجات AI التوليدية الخاصة بك مع مصادقة متسقة.
أسعار تنافسية
وفّر حتى 70% مقارنة بـ AWS مع تسعير شفاف بالدفع حسب الاستخدام. بدون رسوم مخفية، بدون التزامات—قم بالتوسع من نموذج أولي إلى إنتاج دون كسر الميزانية.
أمان معتمد SOC I & II
مقاطع الفيديو المرجعية والمحتوى المُنشأ محمية بشهادات SOC I & II وامتثال HIPAA. أمان على مستوى المؤسسات مع نقل وتخزين مشفر.
SLA بنسبة 99.9% وقت تشغيل
موثوقية على مستوى المؤسسات مع ضمان وقت تشغيل 99.9%. توليد الفيديو متعدد اللقطات Wan 2.6 الخاص بك متاح دائماً للحملات الإنتاجية وسير عمل المحتوى الحرج.
تكامل سهل
تكامل كامل في دقائق مع REST API و SDK متعدد اللغات (Python، Node.js، Go). تبديل سلس بين أوضاع T2V و I2V و R2V مع بنية نقطة نهاية موحدة.
المواصفات التقنية
تجربة توليد الفيديو متعدد اللقطات الاحترافي
انضم إلى منشئي المحتوى والمسوقين وصانعي الأفلام في جميع أنحاء العالم الذين يقومون بثورة في إنتاج الفيديو بقدرات Wan 2.6 الرائدة في السرد متعدد اللقطات واتساق الشخصيات.
Alibaba WAN 2.6 Text-to-Video Model
Alibaba WAN 2.6 is an advanced text-to-video model provided by Alibaba Cloud's DashScope platform. This model generates high-quality 480p/720p/1080p videos from text prompts.
What makes it stand out?
-
More affordable: Wan 2.6 is more streamlined and cost-effective - reducing creator expenses and offering more options.
-
One-pass A/V sync: Wan 2.6 creates a fully synchronized video (audio/voiceover + lip-sync) from a single, well-structured prompt - no separate recording or manual alignment required.
-
Multilingual friendly: Wan 2.6 reliably processes like Chinese prompts for A/V-synced videos.
-
Longer duration & more video size options: Wan 2.6 delivers up to 10 seconds and 6 aspect/size options, enabling more storytelling room and publishing flexibility.
-
Multi-shot storytelling: Generates cohesive multi-shot narratives, keeping key details consistent across shots and offering auto shot-split for simple prompts.
-
Video reference generation: Uses a reference video's appearance and voice to guide new videos; supports human or arbitrary subjects, single or dual performers.
-
15s long videos: Produces videos up to 15 seconds, expanding temporal capacity for richer storytelling.
Designed For
-
Marketing teams: Fast, polished demos/tutorials—low cost, consistent style.
-
Global enterprises: Multilingual, lip-synced videos with subtitles for efficient localization.
-
Storytellers & YouTubers: Immersive narratives while maintaining cadence and quality—driving growth.
-
Corporate training teams: HD videos over docs—clearer key points, better communication.
Pricing
The table below lists prices for easy comparsion.
| Output Resolution | Duration (5s) | Duration (10s) |
|---|---|---|
| 480p | $0.2 | $0.4 |
| 720p | $0.4 | $0.8 |
| 1080p | $0.6 | $1.2 |
Billing Rules
-
Minimum charge: 5 seconds
-
Per-second rate = (price per 5 seconds) ÷ 5
-
Billed duration = video length in seconds (rounded up), with a 5-second minimum
-
Total cost = billed duration × per-second rate (by output resolution)
How to Use
-
Write your prompt.
-
Upload an audio file (optional) for voice/music.
-
Choose the video size (resolution/aspect).
-
Select the video duration (e.g., 5s / 10s).
-
Submit and wait for processing.
-
Preview and download the result.






