
قم ببناء خطوط إنتاج الفيديو على Shengshu API: يقوم Vidu Q3 بإنشاء مقاطع سينمائية مدتها 16 ثانية مع صوت أصلي ولقطات كاميرا ذكية من استدعاء واحد.
أنشئ مقاطع فيديو سينمائية عالية الدقة من النصوص والصور باستخدام أحدث نماذج الذكاء الاصطناعي لتوليد الفيديو على Atlas Cloud.
Compare standard vs. our pricing across every ShengShu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Vidu Q3-Mix Reference to Video | $0.125 | Start from$0.106/s video | -15% | View |
| Vidu Q3 Reference to Video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Pro Start-end-to-video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Turbo Image-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Start-end-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Text-to-video | $0.04 | Start from$0.034/s video | -15% | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
تجعل مقاطع Vidu Q3 التي تبلغ مدتها 16 ثانية، والصوت الأصلي، والاتساق متعدد المراجع، هذا النموذج عمليًا لسير العمل الذي كان يتطلب في السابق فريق إنتاج. تستخدم الفرق مستويات Q3 المختلفة للانتقال من التكرار السريع إلى الأصول النهائية دون تبديل مزودي الخدمة.
تستخدم الاستوديوهات والمبدعون المستقلون Vidu Q3-Mix لإنشاء محتوى رسوم متحركة متعدد الحلقات حيث تبدو الشخصيات متطابقة في كل مشهد. من خلال تحميل أوراق مرجعية للشخصيات، يرث كل مقطع جديد نفس ميزات الوجه والأزياء والأسلوب المرئي دون الحاجة إلى عمل يدوي للحفاظ على الاتساق إطارًا تلو الآخر. عرضت Shengshu سير العمل هذا في SXSW 2026 كأول حل AI لإنتاج مسلسلات الرسوم المتحركة.
تقوم فرق التسويق بتحميل الصور المرجعية لشخصية العلامة التجارية مرة واحدة وتستخدم Vidu Q3 Reference-to-Video لإنشاء العشرات من المقاطع القصيرة لـ TikTok و Reels و YouTube Shorts. تظل الشخصية متطابقة بصريًا عبر كل المخرجات، مما يزيل عنق زجاجة التصميم المتمثل في توجيه واعتماد كل أصل على حدة. بتكلفة 0.042 دولار أمريكي في الثانية على Atlas Cloud، تبلغ تكلفة الدفعة الكاملة من المقاطع التي تبلغ مدتها 10 ثوانٍ أقل من دولار واحد لكل منها.
توفر فرق التجارة الإلكترونية صورًا للمنتج من زوايا متعددة كمدخلات مرجعية وتولد مقاطع تسويقية سينمائية تظهر المنتج أثناء حركته مع صوت محيطي أصلي. تصل المخرجات بصوت متزامن في نفس الاستدعاء، وتكون جاهزة للإعلانات وصفحات المنتجات دون الحاجة إلى تصوير فيديو أو تحرير صوتي. يتيح التحكم في إطار البداية والنهاية للفرق توجيه كيفية الكشف عن المنتج بدقة عبر كل مقطع.
يستخدم المخرجون التحكم في الكاميرا الخاص بـ Vidu Q3-Pro لإنشاء مقاطع عرض مسبق بحركات محددة — مثل التقريب نحو الهدف، والمسح الشامل لموقع التصوير، ولقطات التتبع التي تلاحق الشخصية. إن المخرجات الأصلية ومدتها 16 ثانية تعني أنه يمكن عمل عرض مسبق لمشهد قصير كامل في استدعاء واحد. وهذا يحل محل عمل لوحة القصة في المرحلة المبكرة بمواد مرجعية دقيقة الحركة للممثلين وطاقم العمل.
تستخدم فرق التطوير Vidu Q3-Turbo لتشغيل مسارات التوليد المجمعة بتكلفة 0.034 دولار في الثانية، مما ينتج عشرات المقاطع القصيرة من مدخلات النص أو الصور في الساعة. التكلفة المنخفضة في الثانية تجعل من العملي توليد واختبار العديد من المتغيرات الإبداعية قبل تحديد أي منها سيتم توسيع نطاقه باستخدام Q3-Pro. يعمل كلا النموذجين تحت نفس مفتاح API الخاص بـ Atlas Cloud مع تغيير معلمة واحدة فقط بين المستويات.
تستخدم هيئات السياحة ومنصات السفر ميزة تحويل النص إلى فيديو من Vidu Q3-Pro لإنشاء مقاطع فيديو ذات طابع مميز للوجهات مع صوت محيطي طبيعي من خلال مطالبات نصية وصفية. يؤدي الوصف الكتابي لمشهد طبيعي أو مَعلم أو بيئة ثقافية إلى إنتاج مقطع سينمائي مدته 16 ثانية مع صوت مطابق في طلب استدعاء واحد. يوفر هذا بديلاً فعالاً من حيث التكلفة للتصوير في المواقع لإنشاء محتوى يعزز نية الحجز.
ينشئ Vidu Q3 ما يصل إلى 16 ثانية من الفيديو المستمر في استدعاء API واحد بدقة 1080p و24fps. تُعد هذه أطول نافذة إنشاء بمسار واحد بين نماذج الفيديو الرائدة في فئتها. يمكن تكوين مدة المقطع لكل استدعاء ضمن هذا الحد الأقصى.
نعم. يُنتج Vidu Q3 الحوار والمؤثرات الصوتية والموسيقى الخلفية ومزامنة الشفاه بالتزامن مع إطارات الفيديو في تمريرة استدلال واحدة. لا توجد مرحلة دبلجة في مرحلة ما بعد الإنتاج أو خطوة محاذاة يدوية للصوت. تتم مزامنة توقيت الصوت والحركة على الشاشة تلقائياً.
يمكنك وصف حركة الكاميرا مباشرة في الموجه النصي (text prompt) — مثل الاقتراب (push-ins)، والتحريك الأفقي (pans)، ولقطات التتبع (tracking shots) — وسينفذها النموذج بدءًا من الإطار الأول. لا يتطلب الأمر أي معلمات أو طبقات تحكم منفصلة. ينطبق هذا على كل من نقاط نهاية (endpoints) تحويل النص إلى فيديو وتحويل الصورة إلى فيديو على Atlas Cloud.
يقدم Vidu Q3-Pro مخرجات بجودة سينمائية مع حركة سلسة وتفاصيل غنية، بسعر 0.042 دولار لكل ثانية على Atlas Cloud. بينما يقوم Vidu Q3-Turbo بالتوليد بسرعة أعلى بتكلفة أقل تبلغ 0.034 دولار لكل ثانية، وهو مناسب للمسودات والتكرار السريع. يشترك كلاهما في نفس دقة المخرجات 1080p ودعم الصوت الأصلي.
تقبل نقطة نهاية Reference-to-Video في Vidu Q3 ما بين 1 إلى 4 صور مرجعية لكل استدعاء. يمكنك الجمع بين الموضوعات والبيئات والأزياء والأنماط المرئية من صور مختلفة في عملية توليد واحدة. هذه هي الطريقة الأساسية للحفاظ على اتساق الشخصية والمشهد عبر مقاطع متعددة.
يُعد Vidu Q3-Mix النموذج المرجعي من المستوى الأعلى في تشكيلة Vidu Q3، ويبلغ سعره 0.106 دولار لكل ثانية على Atlas Cloud. فهو يوفر أقوى اتساق متعدد الموضوعات عند دمج صور مرجعية متعددة في عملية توليد واحدة. تم تصميمه لمسارات العمل مثل إنتاج مسلسلات الرسوم المتحركة والمحتوى ذي العلامة التجارية حيث يجب أن تظل هوية الشخصية متطابقة بصريًا عبر العديد من المقاطع.
نعم. يحتوي كل من Vidu Q3-Pro و Q3-Turbo على نقطة نهاية Start-end-to-video على Atlas Cloud. تقوم بتوفير صورة الإطار الأولي ووصف الحركة المطلوبة أو الحالة النهائية، ويقوم النموذج بإنشاء الانتقال. يوفر هذا تحكماً إخراجياً دقيقاً في كيفية بداية ونهاية كل مشهد.
يبدأ سعر Vidu Q3-Turbo من 0.034 دولار في الثانية. يبلغ سعر Vidu Q3-Pro ونقطة نهاية (endpoint) Reference-to-Video 0.042 دولار في الثانية. أما Vidu Q3-Mix، وهو النموذج المرجعي ذو الاتساق الأعلى، فيبلغ سعره 0.106 دولار في الثانية. يتم تسعير جميع المستويات بنسبة 15% أقل من أسعار واجهة برمجة تطبيقات (API) القياسية لـ Shengshu وهي متاحة بنظام الدفع حسب الاستخدام (pay-as-you-go).
Join the Discord community for the latest model updates, prompts, and support.