ShengShu Models on AtlasCloud | Vidu

قم ببناء خطوط إنتاج الفيديو على Shengshu API: يقوم Vidu Q3 بإنشاء مقاطع سينمائية مدتها 16 ثانية مع صوت أصلي ولقطات كاميرا ذكية من استدعاء واحد.

AI Video Models by ShengShu

أنشئ مقاطع فيديو سينمائية عالية الدقة من النصوص والصور باستخدام أحدث نماذج الذكاء الاصطناعي لتوليد الفيديو على Atlas Cloud.

Vidu

واجهة برمجة تطبيقات Vidu توفر للمطورين إمكانية الوصول إلى نماذج الفيديو من Shengshu AI وجامعة تسينغهوا، المبنية على بنية U-ViT التي توحد تصميم Diffusion و Transformer. أدخل من صورة إلى أربع صور مرجعية وتحافظ Vidu على تناسق الموضوعات عبر اللقطات، مع التبديل الذكي للكاميرا والحركة السلسة والسينمائية. تضيف Atlas Cloud إمكانية الوصول إلى النماذج من اليوم الأول ومفتاح واحد متوافق مع OpenAI لجميع المنتجات. ابدأ البناء اليوم.

25 نموذجاستكشف Vidu

ShengShu Models API Pricing Details

Compare standard vs. our pricing across every ShengShu model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Vidu Q3-Mix Reference to Video	$0.125	Start from$0.106/s video	-15%	View
Vidu Q3 Reference to Video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Pro Start-end-to-video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Turbo Image-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Start-end-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Text-to-video	$0.04	Start from$0.034/s video	-15%	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

حالات استخدام واجهة برمجة تطبيقات ShengShu التي يمكنك تطويرها على Atlas Cloud

تجعل مقاطع Vidu Q3 التي تبلغ مدتها 16 ثانية، والصوت الأصلي، والاتساق متعدد المراجع، هذا النموذج عمليًا لسير العمل الذي كان يتطلب في السابق فريق إنتاج. تستخدم الفرق مستويات Q3 المختلفة للانتقال من التكرار السريع إلى الأصول النهائية دون تبديل مزودي الخدمة.

سلسلة رسوم متحركة بشخصيات متسقة

تستخدم الاستوديوهات والمبدعون المستقلون Vidu Q3-Mix لإنشاء محتوى رسوم متحركة متعدد الحلقات حيث تبدو الشخصيات متطابقة في كل مشهد. من خلال تحميل أوراق مرجعية للشخصيات، يرث كل مقطع جديد نفس ميزات الوجه والأزياء والأسلوب المرئي دون الحاجة إلى عمل يدوي للحفاظ على الاتساق إطارًا تلو الآخر. عرضت Shengshu سير العمل هذا في SXSW 2026 كأول حل AI لإنتاج مسلسلات الرسوم المتحركة.

محتوى الصور الرمزية للعلامة التجارية والتمائم على نطاق واسع

تقوم فرق التسويق بتحميل الصور المرجعية لشخصية العلامة التجارية مرة واحدة وتستخدم Vidu Q3 Reference-to-Video لإنشاء العشرات من المقاطع القصيرة لـ TikTok و Reels و YouTube Shorts. تظل الشخصية متطابقة بصريًا عبر كل المخرجات، مما يزيل عنق زجاجة التصميم المتمثل في توجيه واعتماد كل أصل على حدة. بتكلفة 0.042 دولار أمريكي في الثانية على Atlas Cloud، تبلغ تكلفة الدفعة الكاملة من المقاطع التي تبلغ مدتها 10 ثوانٍ أقل من دولار واحد لكل منها.

فيديو تسويق المنتج متعدد الزوايا

توفر فرق التجارة الإلكترونية صورًا للمنتج من زوايا متعددة كمدخلات مرجعية وتولد مقاطع تسويقية سينمائية تظهر المنتج أثناء حركته مع صوت محيطي أصلي. تصل المخرجات بصوت متزامن في نفس الاستدعاء، وتكون جاهزة للإعلانات وصفحات المنتجات دون الحاجة إلى تصوير فيديو أو تحرير صوتي. يتيح التحكم في إطار البداية والنهاية للفرق توجيه كيفية الكشف عن المنتج بدقة عبر كل مقطع.

توليد المشاهد الموجهة لمرحلة ما قبل الإنتاج السينمائي

يستخدم المخرجون التحكم في الكاميرا الخاص بـ Vidu Q3-Pro لإنشاء مقاطع عرض مسبق بحركات محددة — مثل التقريب نحو الهدف، والمسح الشامل لموقع التصوير، ولقطات التتبع التي تلاحق الشخصية. إن المخرجات الأصلية ومدتها 16 ثانية تعني أنه يمكن عمل عرض مسبق لمشهد قصير كامل في استدعاء واحد. وهذا يحل محل عمل لوحة القصة في المرحلة المبكرة بمواد مرجعية دقيقة الحركة للممثلين وطاقم العمل.

مسار المحتوى الاجتماعي عالي الحجم

تستخدم فرق التطوير Vidu Q3-Turbo لتشغيل مسارات التوليد المجمعة بتكلفة 0.034 دولار في الثانية، مما ينتج عشرات المقاطع القصيرة من مدخلات النص أو الصور في الساعة. التكلفة المنخفضة في الثانية تجعل من العملي توليد واختبار العديد من المتغيرات الإبداعية قبل تحديد أي منها سيتم توسيع نطاقه باستخدام Q3-Pro. يعمل كلا النموذجين تحت نفس مفتاح API الخاص بـ Atlas Cloud مع تغيير معلمة واحدة فقط بين المستويات.

السياحة الثقافية ومحتوى الوجهة

تستخدم هيئات السياحة ومنصات السفر ميزة تحويل النص إلى فيديو من Vidu Q3-Pro لإنشاء مقاطع فيديو ذات طابع مميز للوجهات مع صوت محيطي طبيعي من خلال مطالبات نصية وصفية. يؤدي الوصف الكتابي لمشهد طبيعي أو مَعلم أو بيئة ثقافية إلى إنتاج مقطع سينمائي مدته 16 ثانية مع صوت مطابق في طلب استدعاء واحد. يوفر هذا بديلاً فعالاً من حيث التكلفة للتصوير في المواقع لإنشاء محتوى يعزز نية الحجز.

حوّل رؤية مؤسستك إلى واقع مع Atlas Cloud AI.

تواصل مع المبيعات

الأسئلة الشائعة حول نماذج ShengShu

ينشئ Vidu Q3 ما يصل إلى 16 ثانية من الفيديو المستمر في استدعاء API واحد بدقة 1080p و24fps. تُعد هذه أطول نافذة إنشاء بمسار واحد بين نماذج الفيديو الرائدة في فئتها. يمكن تكوين مدة المقطع لكل استدعاء ضمن هذا الحد الأقصى.

نعم. يُنتج Vidu Q3 الحوار والمؤثرات الصوتية والموسيقى الخلفية ومزامنة الشفاه بالتزامن مع إطارات الفيديو في تمريرة استدلال واحدة. لا توجد مرحلة دبلجة في مرحلة ما بعد الإنتاج أو خطوة محاذاة يدوية للصوت. تتم مزامنة توقيت الصوت والحركة على الشاشة تلقائياً.

يمكنك وصف حركة الكاميرا مباشرة في الموجه النصي (text prompt) — مثل الاقتراب (push-ins)، والتحريك الأفقي (pans)، ولقطات التتبع (tracking shots) — وسينفذها النموذج بدءًا من الإطار الأول. لا يتطلب الأمر أي معلمات أو طبقات تحكم منفصلة. ينطبق هذا على كل من نقاط نهاية (endpoints) تحويل النص إلى فيديو وتحويل الصورة إلى فيديو على Atlas Cloud.

يقدم Vidu Q3-Pro مخرجات بجودة سينمائية مع حركة سلسة وتفاصيل غنية، بسعر 0.042 دولار لكل ثانية على Atlas Cloud. بينما يقوم Vidu Q3-Turbo بالتوليد بسرعة أعلى بتكلفة أقل تبلغ 0.034 دولار لكل ثانية، وهو مناسب للمسودات والتكرار السريع. يشترك كلاهما في نفس دقة المخرجات 1080p ودعم الصوت الأصلي.

تقبل نقطة نهاية Reference-to-Video في Vidu Q3 ما بين 1 إلى 4 صور مرجعية لكل استدعاء. يمكنك الجمع بين الموضوعات والبيئات والأزياء والأنماط المرئية من صور مختلفة في عملية توليد واحدة. هذه هي الطريقة الأساسية للحفاظ على اتساق الشخصية والمشهد عبر مقاطع متعددة.

يُعد Vidu Q3-Mix النموذج المرجعي من المستوى الأعلى في تشكيلة Vidu Q3، ويبلغ سعره 0.106 دولار لكل ثانية على Atlas Cloud. فهو يوفر أقوى اتساق متعدد الموضوعات عند دمج صور مرجعية متعددة في عملية توليد واحدة. تم تصميمه لمسارات العمل مثل إنتاج مسلسلات الرسوم المتحركة والمحتوى ذي العلامة التجارية حيث يجب أن تظل هوية الشخصية متطابقة بصريًا عبر العديد من المقاطع.

نعم. يحتوي كل من Vidu Q3-Pro و Q3-Turbo على نقطة نهاية Start-end-to-video على Atlas Cloud. تقوم بتوفير صورة الإطار الأولي ووصف الحركة المطلوبة أو الحالة النهائية، ويقوم النموذج بإنشاء الانتقال. يوفر هذا تحكماً إخراجياً دقيقاً في كيفية بداية ونهاية كل مشهد.

يبدأ سعر Vidu Q3-Turbo من 0.034 دولار في الثانية. يبلغ سعر Vidu Q3-Pro ونقطة نهاية (endpoint) Reference-to-Video 0.042 دولار في الثانية. أما Vidu Q3-Mix، وهو النموذج المرجعي ذو الاتساق الأعلى، فيبلغ سعره 0.106 دولار في الثانية. يتم تسعير جميع المستويات بنسبة 15% أقل من أسعار واجهة برمجة تطبيقات (API) القياسية لـ Shengshu وهي متاحة بنظام الدفع حسب الاستخدام (pay-as-you-go).

استكشف المزيد من العائلات

Seedance 2.0

تمنحك واجهة برمجة تطبيقات Seedance 2.0 وصولاً إنتاجيًا إلى نموذج الفيديو متعدد الوسائط من ByteDance — إدخالات رباعية الوسائط (نص، صورة، فيديو، صوت) ونظام "Universal Reference" الرائد في الصناعة والذي يثبت التكوين وحركة الكاميرا وإجراءات الشخصيات عبر اللقطات. قم بدمج تحكم على مستوى المخرج من خلال استدعاء API واحد، بسعر ثابت قدره 0.09 دولار/ثانية، ومفتاح فوري، وبدون قائمة انتظار — مدعومًا بوقت تشغيل وامتثال على مستوى المؤسسات. Seedance 2.0 Native 4K متاح الآن!

عرض العائلة

Grok Imagine

توفر Grok Imagine API للمطورين إمكانية إنشاء الصور ومقاطع الفيديو والصوت من xAI في حزمة واحدة. وتنتج صورًا بدقة تصل إلى 2K مع عرض نص متعدد اللغات، بالإضافة إلى مقاطع فيديو تصل مدتها إلى 15 ثانية مع صوت أصلي متزامن وتحرير قائم على المراجع. على Atlas Cloud، يقوم مفتاح واحد بتشغيل كل وضع من أوضاع Grok Imagine، لذا يمكنك التنقل بين الصور والفيديو والصوت دون إعدادات منفصلة، بدءًا من 0.02 دولار لكل صورة و0.05 دولار لكل ثانية.

عرض العائلة

Gemini Omni Flash

يجلب Gemini Omni API إلى بنيتك التقنية نموذج التوليد والتحرير متعدد الوسائط للفيديو من Google DeepMind، الذي أُعلن عنه في Google I/O 2026. يدمج Gemini Omni محرك الاستدلال في Gemini مع الوسائط التوليدية، ويقبل أي مزيج من النصوص والصور والفيديو والصوت لإنتاج مخرجات متسقة ومستندة إلى المعرفة. حسّن النتائج عبر محادثة طبيعية: استبدل العناصر، وأعد كتابة المشاهد، وغيّر الأنماط، مع بقاء الفيزياء والشخصيات والاستمرارية سليمة دون أي خلل. توفر Atlas Cloud تشكيلة Gemini Omni Flash الكاملة — تحويل النص إلى فيديو، وتحويل الصورة إلى فيديو مع ما يصل إلى 7 صور مرجعية، وتحويل المرجع إلى فيديو — عبر واجهة API موحدة بتسعير شفاف لكل ثانية يبدأ من $0.112 ومن دون اشتراك. ابدأ البناء اليوم.

عرض العائلة

GPT Image 2

توفر واجهة برمجة تطبيقات GPT Image 2 للمطورين إمكانية الوصول إلى أحدث نموذج صور من OpenAI، وهو خليفة GPT Image 1.5. يقوم النموذج بإنشاء الصور وتعديلها مع عرض دقيق للنصوص عبر الحروف اللاتينية ونصوص CJK، بالإضافة إلى تكوين قوي للملصقات والنماذج المبدئية والرسوم البيانية (الإنفوجرافيك). على Atlas Cloud، يمكنك الوصول إليه من خلال واجهة برمجة تطبيقات موحدة بجانب أكثر من 300 نموذج، مع أرصدة مجانية، ووقت تشغيل بنسبة 99.99%، وبدون الحاجة إلى التحقق من مؤسسة OpenAI.

عرض العائلة

Google

تتوفر أقوى النماذج الإبداعية من Google بالكامل على Atlas Cloud. يقدم Veo 3.1 توليد فيديو سينمائي، ويدعم Nano Banana 2 إنشاء صور عالية الدقة، ويجلب Gemini ذكاءً متعدد الوسائط لكل سير عمل. يمكنك الوصول إلى مجموعة نماذج Google الكاملة من خلال مفتاح API key واحد مع توفر Day-0 وتسعير الدفع حسب الاستخدام (pay-as-you-go).

عرض العائلة

Seedance 2.0 Mini

يجلب Seedance 2.0 Mini إنشاء مقاطع الفيديو متعددة الوسائط من ByteDance إلى مسارات العمل حيث تعتبر السرعة والتكلفة الأكثر أهمية. إنه يوفر القدرات الأساسية لـ Seedance 2.0 ببصمة أخف — إنشاء أسرع، وتكلفة أقل لكل مقطع فيديو، ونفس تكامل API الذي تستخدمه بالفعل. بالنسبة للفرق التي تدير مسارات عمل ذات حجم كبير أو تقوم بالنماذج الأولية على نطاق واسع، فإن Mini هو الخيار الافتراضي العملي.

عرض العائلة

ByteDance

من إنشاء مقاطع الفيديو السينمائية إلى توليد الصور عالية الدقة، أصبحت أقوى نماذج ByteDance متاحة الآن على Atlas Cloud. يمكنك تشغيل Seedance و Seedream على نطاق واسع بأقل أسعار للاستدلال وبدون أي أعباء إضافية للبنية التحتية.

عرض العائلة

Alibaba

تجمع Atlas Cloud مجموعة نماذج Alibaba الكاملة ضمن API واحد: Qwen لمهام اللغة والصورة، و Wan لإنشاء مقاطع الفيديو بدقة تصل إلى 1080p. يمكنك الوصول إلى كل نموذج بنظام الدفع حسب الاستخدام (pay-as-you-go) دون أي اشتراكات. تتوفر Alibaba API عبر عنوان URL أساسي واحد باستخدام عميلك الحالي المتوافق مع OpenAI.

عرض العائلة

OpenAI

تمنحك Atlas Cloud إمكانية الوصول إلى مجموعة API الكاملة من OpenAI، بدءًا من GPT Image 2 لتوليد الصور وحتى Sora 2 للفيديو. يتوفر كل نموذج بنظام الدفع حسب الاستخدام بدون أي التزام شهري. يمكنك الربط بسهولة عن طريق تبديل عنوان URL الأساسي باستخدام الـ API المتوافق مع OpenAI.

عرض العائلة

xAI

قم ببناء مسارات عمل كاملة للصور والفيديو باستخدام xAI API على Atlas Cloud. قم بالتوليد بدقة 2K، والتحرير باستخدام صور مرجعية، وتحريك الصور إلى مقاطع متزامنة مع الصوت.

عرض العائلة

Kwaivgi

واجهة برمجة تطبيقات Kwaivgi (API) بسعر أقل بنسبة 15% من السعر القياسي. توفر Atlas Cloud وصولاً من اليوم الأول (Day-0) إلى إصدارات Kling الجديدة مع تسعير الدفع حسب الاستخدام وبدون حدود لعدد المقاعد. حساب واحد، مفتاح واحد، وكل نماذج Kling من المستوى القياسي إلى المستوى الرئيسي (master).

عرض العائلة

Seedream 5.0 Pro

يوفر واجهة برمجة التطبيقات Seedream 5.0 Pro API للمطورين نموذج تحرير الصور القابل للتحكم من ByteDance على Atlas Cloud. وهو يضع التعديلات بدقة باستخدام نقاط الإرساء والإحداثيات، ويفصل الصور إلى طبقات قابلة للتحرير، ويدمج مراجع متعددة، ويطابق الألوان والمواد الدقيقة، مع نص متعدد اللغات بدقة 2K و 3K. على Atlas Cloud، يمكنك الوصول إليه من خلال مفتاح واحد!

عرض العائلة