alibaba/wan-2.6/text-to-video

A speed-optimized text-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.

TEXT-TO-VIDEOHOTNEW
نص إلى فيديو

A speed-optimized text-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.

Alibaba WAN 2.6 Text-to-Video Model

Alibaba WAN 2.6 is an advanced text-to-video model provided by Alibaba Cloud's DashScope platform. This model generates high-quality 480p/720p/1080p videos from text prompts.

What makes it stand out?

  • More affordable: Wan 2.6 is more streamlined and cost-effective - reducing creator expenses and offering more options.

  • One-pass A/V sync: Wan 2.6 creates a fully synchronized video (audio/voiceover + lip-sync) from a single, well-structured prompt - no separate recording or manual alignment required.

  • Multilingual friendly: Wan 2.6 reliably processes like Chinese prompts for A/V-synced videos.

  • Longer duration & more video size options: Wan 2.6 delivers up to 10 seconds and 6 aspect/size options, enabling more storytelling room and publishing flexibility.

  • Multi-shot storytelling: Generates cohesive multi-shot narratives, keeping key details consistent across shots and offering auto shot-split for simple prompts.

  • Video reference generation: Uses a reference video's appearance and voice to guide new videos; supports human or arbitrary subjects, single or dual performers.

  • 15s long videos: Produces videos up to 15 seconds, expanding temporal capacity for richer storytelling.

Designed For

  • Marketing teams: Fast, polished demos/tutorials—low cost, consistent style.

  • Global enterprises: Multilingual, lip-synced videos with subtitles for efficient localization.

  • Storytellers & YouTubers: Immersive narratives while maintaining cadence and quality—driving growth.

  • Corporate training teams: HD videos over docs—clearer key points, better communication.

Pricing

The table below lists prices for easy comparsion.

Output ResolutionDuration (5s)Duration (10s)
480p$0.2$0.4
720p$0.4$0.8
1080p$0.6$1.2

Billing Rules

  • Minimum charge: 5 seconds

  • Per-second rate = (price per 5 seconds) ÷ 5

  • Billed duration = video length in seconds (rounded up), with a 5-second minimum

  • Total cost = billed duration × per-second rate (by output resolution)

How to Use

  1. Write your prompt.

  2. Upload an audio file (optional) for voice/music.

  3. Choose the video size (resolution/aspect).

  4. Select the video duration (e.g., 5s / 10s).

  5. Submit and wait for processing.

  6. Preview and download the result.

تفاصيل المواصفات

نظرة عامة:

مزود النموذج:QWEN
نوع النموذج:text-to-video
النشر:Inference API; Playground
التسعير:$0.0700/second

المعاملات الرئيسية:

الحد الأقصى للحجم:الحد الأقصى للعرض × الارتفاع (قابل للتكوين)
دعم LoRA:غير مدعوم
خيارات البذرة:N/A

أنشئ تحفتك الفنية التالية

🎬إنشاء فيديو متعدد اللقطات

Wan 2.6إنشاء فيديو AI متعدد اللقطات احترافي

أحدث إنجاز لشركة Alibaba في إنشاء فيديو AI. أنشئ مقاطع فيديو 1080p حتى 15 ثانية مع سرد قصص متعدد اللقطات، واتساق الشخصيات المستند إلى المراجع، ومزامنة سمعية بصرية أصلية. النموذج الأول الذي يفهم حقاً منطق لوحة القصة للسرد السينمائي.

اختراقات ثورية

ما يجعل Wan 2.6 محطم قواعد اللعبة في إنشاء فيديو AI

سرد متعدد اللقطات

أول نموذج يفهم منطق لوحة القصة. يولد تلقائياً لقطات متسلسلة مع انتقالات متماسكة، مع الحفاظ على مظهر الشخصية واتساق البيئة عبر تغييرات المشهد—مما يتيح أقواس قصة كاملة في توليد واحد مدته 15 ثانية.

مرجع إلى فيديو (R2V)

قم بتحميل فيديو مرجعي من 2-30 ثانية لاستخراج والحفاظ على مظهر الشخصية وأنماط الحركة وخصائص الصوت. أنشئ عروض شخصيات متسقة عبر مقاطع فيديو متعددة بدقة غير مسبوقة.

عرض نص دقيق

قدرات عرض نصوص رائدة في الصناعة لتغليف المنتجات واللافتات ومحتوى العلامة التجارية. إنشاء نص واضح وقابل للقراءة داخل إطارات الفيديو—ضروري لتطبيقات التسويق والتجارية.

القدرات الأساسية

مدة ممتدة 15 ثانية

إنشاء حتى 15 ثانية لكل فيديو مع بنية "ثلاثة فصول" كاملة (الإعداد ← العمل ← الحل)

جودة 1080p احترافية

إخراج 1080p أصلي عند 24fps مع جودة سينمائية واستقرار بصري محسّن

مزامنة صوت أصلية

الحوار يطابق حركات الشفاه، الموسيقى الخلفية تتماشى مع الإيقاع، المؤثرات الصوتية تُفعّل بشكل مثالي

اتساق الشخصية

احتفظ بمظهر الشخصية والأزياء والهوية عبر اللقطات ومقاطع الفيديو المتعددة

تحكم الكاميرا السينمائي

حركات كاميرا احترافية بما في ذلك التحريك والتكبير ولقطات التتبع وحركات الدوللي

نسب عرض مرنة

16:9 (YouTube)، 9:16 (Reels)، 1:1 (مربع) - محسّن للمنصة بدون اقتصاص ما بعد الإنتاج

Wan 2.6 مقابل Wan 2.5: تحسينات كبيرة

شاهد الجديد في أحدث إصدار

مدة الفيديو
حتى 15 ثانية
Wan 2.5: 10 ثوانٍ كحد أقصى
قدرة متعددة اللقطات
يفهم منطق لوحة القصة
Wan 2.5: لقطة واحدة أو تحول فوضوي
دعم فيديو مرجعي
وضع R2V مع حفظ كامل
Wan 2.5: مرجع صورة فقط
اتساق الشخصية
ممتاز عبر اللقطات
Wan 2.5: مشاكل انجراف الشخصية
استقرار الحركة
اهتزاز وتشوهات مخفضة
Wan 2.5: انجراف إطار عرضي
فهم المطالبات
مشاهد معقدة متعددة الشخصيات
Wan 2.5: توليد مشهد أساسي

ثلاثة أوضاع توليد متخصصة

اختر الوضع المناسب لسير عملك الإبداعي

نص إلى فيديو (T2V)

الأكثر شعبية

إنشاء مقاطع فيديو كاملة من مطالبات نصية مع تقسيم متعدد اللقطات محسّن ومعالجة مطالبات محسّنة. مثالي لسرد القصص والاستكشاف الإبداعي.

  • تقسيم لقطة تلقائي من مطالبة واحدة
  • فهم تفاعل متعدد الشخصيات
  • حركة الكاميرا والإشارات العاطفية
  • الحفاظ على تفاصيل البيئة

صورة إلى فيديو (I2V)

محسّن

تحويل الصور الثابتة إلى مقاطع فيديو متحركة مع تماسك حركة محسّن. مثالي لعروض المنتجات وتحريك الصور والسرد البصري.

  • عرض نص دقيق للمنتجات
  • اتساق النمط عبر الإطارات
  • حركة طبيعية من الصور الثابتة
  • تحسين بصري مدفوع بالسرد

مرجع إلى فيديو (R2V)

جديد

قم بتحميل فيديو مرجعي (2-30 ثانية) للحفاظ على مظهر الشخصية وأنماط الحركة والصوت. أقوى ضمان اتساق للمحتوى المدفوع بالشخصيات.

  • حفظ هوية الشخصية الكاملة
  • استخراج خصائص الصوت
  • تكرار نمط الحركة
  • مشاهد تمثيل مشترك متعددة الشخصيات

مثالي لـ

التسويق والإعلان

عروض منتجات مع عرض نصوص، حملات علامة تجارية مع اتساق الشخصيات، ومقاطع فيديو ترويجية

إنشاء المحتوى

مقاطع فيديو YouTube، reels وسائل التواصل الاجتماعي، سرد متعدد اللقطات، وسير عمل تحرير الفيديو

التجارة الإلكترونية

عروض منتجات بنصوص دقيقة، مقاطع فيديو تعليمية، وإعادة إنشاء شهادات العملاء

التعليم والتدريب

محتوى تعليمي، مواد دورات، وسرديات تعليمية متعددة المشاهد

الترفيه

أفلام قصيرة، قصص مدفوعة بالشخصيات، تسلسلات سينمائية، وتجارب إبداعية

التصور المسبق

تطوير مفهوم الفيلم، إنشاء لوحة القصة، وتخطيط المشهد للإنتاج

تكامل Wan 2.6 T2V و I2V و R2V API

مجموعة API كاملة لتوليد نص إلى فيديو، صورة إلى فيديو، ومرجع إلى فيديو

API نص إلى فيديو (T2V API)

يحول Wan 2.6 T2V API الخاص بنا المطالبات النصية إلى مقاطع فيديو سينمائية متعددة اللقطات مع تقسيم مشهد تلقائي. إنشاء مقاطع فيديو احترافية 1080p حتى 15 ثانية مع مزامنة صوت أصلية.

سرد متعدد اللقطات من مطالبة واحدة
مدة 15 ثانية مع بنية ثلاثة فصول
فهم مطالبات محسّن للمشاهد المعقدة
نسب عرض مرنة: 16:9، 9:16، 1:1

API صورة إلى فيديو (I2V API)

يبث Wan 2.6 I2V API الخاص بنا الحياة في الصور الثابتة مع تحكم حركة دقيق وعرض نصوص. مثالي لمقاطع فيديو المنتجات وتحريك الصور وإنشاء محتوى العلامة التجارية.

عرض نص دقيق للمنتجات واللافتات
اتساق النمط في إطارات التحريك
حركة طبيعية مع تماسك محسّن
إخراج بصري محسّن للسرد

API مرجع إلى فيديو (R2V API)

يحافظ Wan 2.6 R2V API الخاص بنا على هوية الشخصية من مقاطع الفيديو المرجعية. قم بتحميل مقاطع 2-30 ثانية لاستخراج المظهر والصوت وأنماط الحركة لتوليد شخصية متسق.

الحفاظ على مظهر وهوية الشخصية
استخراج وتكرار خصائص الصوت
تحليل وإعادة إنتاج أنماط الحركة
دعم مشاهد متعددة الشخصيات
💡

مجموعة API كاملة

جميع أوضاع Wan 2.6 API الثلاثة (T2V API، I2V API، R2V API) تدعم بنية RESTful مع وثائق شاملة. ابدأ مع SDK لـ Python و Node.js والمزيد. كل نقطة نهاية تتضمن مزامنة سمعية بصرية أصلية وحقوق استخدام تجاري كاملة.

كيفية البدء مع Wan 2.6

ابدأ في إنشاء مقاطع فيديو احترافية في دقائق مع مسارين بسيطين

تكامل API

للمطورين الذين يبنون التطبيقات

1

التسجيل وتسجيل الدخول

أنشئ حساب Atlas Cloud الخاص بك أو سجّل الدخول للوصول إلى وحدة التحكم

2

إضافة طريقة الدفع

اربط بطاقتك الائتمانية في قسم الفواتير لتمويل حسابك

3

إنشاء مفتاح API

انتقل إلى وحدة التحكم ← مفاتيح API وأنشئ مفتاح المصادقة الخاص بك

4

ابدأ البناء

استخدم نقاط نهاية T2V أو I2V أو R2V API لدمج Wan 2.6 في تطبيقك

تجربة Playground

للاختبار السريع والتجريب

1

التسجيل وتسجيل الدخول

أنشئ حساب Atlas Cloud الخاص بك أو سجّل الدخول للوصول إلى المنصة

2

إضافة طريقة الدفع

اربط بطاقتك الائتمانية في قسم الفواتير للبدء

3

استخدام Playground

اذهب إلى Wan 2.6 playground، اختر وضع T2V/I2V/R2V، وأنشئ مقاطع فيديو فوراً

💡
نصيحة احترافية: اختبر أوضاع التوليد المختلفة في Playground أولاً لفهم أيها يعمل بشكل أفضل لحالة الاستخدام الخاصة بك، ثم ادمج API المقابل لنطاق الإنتاج.

الأسئلة الشائعة

ما الذي يجعل قدرة متعددة اللقطات في Wan 2.6 فريدة؟

Wan 2.6 هو النموذج الأول الذي يفهم حقاً منطق لوحة القصة. على عكس Wan 2.5 الذي أنشأ تأثيرات "تحول" فوضوية، يمكن لـ Wan 2.6 تقسيم مطالبة واحدة تلقائياً إلى لقطات متعددة متميزة مع انتقالات متماسكة، مع الحفاظ على اتساق الشخصية عبر تغييرات المشهد.

كيف يعمل مرجع إلى فيديو (R2V)؟

قم بتحميل فيديو مرجعي من 2-30 ثانية، ويستخرج Wan 2.6 مظهر الشخصية وأنماط الحركة وخصائص الصوت. يمكنك بعد ذلك إنشاء مقاطع فيديو جديدة تعرض نفس الشخصية بهوية متسقة—مثالي لإنشاء سلسلة محتوى مدفوعة بالشخصيات.

ما هي تنسيقات ومدد الفيديو المدعومة؟

ينشئ Wan 2.6 مقاطع فيديو 1080p عند 24fps مع مدد من 5 إلى 15 ثانية. نسب العرض المدعومة تشمل 16:9 (YouTube)، 9:16 (Instagram Reels/TikTok)، و1:1 (تنسيق مربع)، محسّنة لكل منصة دون الحاجة إلى اقتصاص ما بعد الإنتاج.

هل يمكن لـ Wan 2.6 عرض النصوص في مقاطع الفيديو؟

نعم! يحتوي Wan 2.6 على عرض نصوص رائد في الصناعة لتغليف المنتجات واللافتات ومحتوى العلامة التجارية. يمكن للنموذج إنشاء نص واضح وقابل للقراءة داخل إطارات الفيديو—ميزة حاسمة يفتقر إليها Seedance ومعظم المنافسين.

ما الفرق بين أوضاع T2V و I2V و R2V؟

T2V (نص إلى فيديو) ينشئ من مطالبات نصية مع قدرة متعددة اللقطات. I2V (صورة إلى فيديو) يحرك الصور الثابتة مع عرض نصوص دقيق. R2V (مرجع إلى فيديو) يستخدم مراجع فيديو للحفاظ على هوية الشخصية عبر التوليدات. اختر بناءً على نوع الإدخال واحتياجات الاتساق الخاصة بك.

هل لدي حقوق تجارية على مقاطع الفيديو المُنشأة؟

نعم! كل إبداع Wan 2.6 يأتي مع حقوق استخدام تجاري كاملة. مقاطع الفيديو جاهزة للإنتاج للحملات التسويقية والتسليمات للعملاء ومحتوى العلامة التجارية والتطبيقات التجارية بدون متطلبات ترخيص إضافية.

لماذا تستخدم Wan 2.6 على Atlas Cloud؟

استفد من البنية التحتية على مستوى المؤسسات لسير عمل توليد الفيديو الاحترافي الخاص بك

بنية تحتية مخصصة الغرض

انشر توليد متعدد اللقطات وقدرات R2V لـ Wan 2.6 على بنية تحتية محسّنة خصيصاً لأحمال عمل فيديو AI المطلوبة. أقصى أداء لتوليد 1080p 15 ثانية.

API موحد لجميع النماذج

الوصول إلى Wan 2.6 (T2V، I2V، R2V) جنباً إلى جنب مع أكثر من 300 نموذج AI (LLMs، صورة، فيديو، صوت) من خلال API موحد واحد. تكامل واحد لجميع احتياجات AI التوليدية الخاصة بك مع مصادقة متسقة.

أسعار تنافسية

وفّر حتى 70% مقارنة بـ AWS مع تسعير شفاف بالدفع حسب الاستخدام. بدون رسوم مخفية، بدون التزامات—قم بالتوسع من نموذج أولي إلى إنتاج دون كسر الميزانية.

أمان معتمد SOC I & II

مقاطع الفيديو المرجعية والمحتوى المُنشأ محمية بشهادات SOC I & II وامتثال HIPAA. أمان على مستوى المؤسسات مع نقل وتخزين مشفر.

SLA بنسبة 99.9% وقت تشغيل

موثوقية على مستوى المؤسسات مع ضمان وقت تشغيل 99.9%. توليد الفيديو متعدد اللقطات Wan 2.6 الخاص بك متاح دائماً للحملات الإنتاجية وسير عمل المحتوى الحرج.

تكامل سهل

تكامل كامل في دقائق مع REST API و SDK متعدد اللغات (Python، Node.js، Go). تبديل سلس بين أوضاع T2V و I2V و R2V مع بنية نقطة نهاية موحدة.

99.9%
وقت التشغيل
70%
تكلفة أقل مقابل AWS
300+
نماذج Gen AI
24/7
دعم احترافي

المواصفات التقنية

Architecture
محول متقدم مع فهم متعدد الوسائط
Resolution
1080p (Full HD)
Frame Rate
24 FPS
Duration
5-15 ثانية (يعتمد على الوضع)
Aspect Ratios
16:9، 9:16، 1:1
Generation Modes
T2V، I2V، R2V
Audio
مزامنة أصلية مع مزامنة الشفاه
Commercial Rights
استخدام تجاري كامل مشمول

تجربة توليد الفيديو متعدد اللقطات الاحترافي

انضم إلى منشئي المحتوى والمسوقين وصانعي الأفلام في جميع أنحاء العالم الذين يقومون بثورة في إنتاج الفيديو بقدرات Wan 2.6 الرائدة في السرد متعدد اللقطات واتساق الشخصيات.

ابدأ من أكثر من 300 نموذج

حصرياً على Atlas Cloud