
Shengshu API पर वीडियो उत्पादन पाइपलाइन बनाएं: Vidu Q3 एक ही कॉल से मूल ऑडियो और स्मार्ट कैमरा कट के साथ 16-सेकंड की सिनेमाई क्लिप बनाता है।
Atlas Cloud पर नवीनतम AI वीडियो जनरेशन मॉडल के साथ टेक्स्ट और इमेज से सिनेमाई, उच्च-गुणवत्ता वाले वीडियो बनाएं।
Compare standard vs. our pricing across every ShengShu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Vidu Q3-Mix Reference to Video | $0.125 | Start from$0.106/s video | -15% | View |
| Vidu Q3 Reference to Video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Pro Start-end-to-video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Turbo Image-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Start-end-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Text-to-video | $0.04 | Start from$0.034/s video | -15% | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Vidu Q3 के 16-सेकंड के क्लिप, नेटिव ऑडियो और मल्टी-रेफरेंस कंसिस्टेंसी इसे उन वर्कफ़्लो के लिए व्यावहारिक बनाते हैं जिनके लिए पहले एक प्रोडक्शन टीम की आवश्यकता होती थी। टीमें बिना प्रदाता बदले तेज़ इटरेशन से तैयार एसेट्स तक जाने के लिए विभिन्न Q3 टियर्स का उपयोग करती हैं।
स्टूडियो और इंडी क्रिएटर्स Vidu Q3-Mix का उपयोग मल्टी-एपिसोड एनिमेटेड कंटेंट जेनरेट करने के लिए करते हैं, जहाँ पात्र हर दृश्य में एक जैसे दिखते हैं। कैरेक्टर रेफरेंस शीट अपलोड करके, प्रत्येक नया क्लिप बिना मैन्युअल फ्रेम-बाय-फ्रेम कंसिस्टेंसी कार्य के समान चेहरे की विशेषताओं, पोशाक और दृश्य शैली को प्राप्त कर लेता है। Shengshu ने SXSW 2026 में इस वर्कफ़्लो को एनिमेटेड सीरीज़ प्रोडक्शन के लिए पहले AI समाधान के रूप में प्रदर्शित किया।
मार्केटिंग टीमें एक बार ब्रांड कैरेक्टर की संदर्भ छवियां अपलोड करती हैं और TikTok, Reels और YouTube Shorts के लिए दर्जनों शॉर्ट-फॉर्म क्लिप उत्पन्न करने के लिए Vidu Q3 Reference-to-Video का उपयोग करती हैं। कैरेक्टर हर आउटपुट में विज़ुअली समान रहता है, जिससे प्रत्येक एसेट को व्यक्तिगत रूप से ब्रीफिंग और अनुमोदन करने की डिज़ाइन बाधा दूर हो जाती है। Atlas Cloud पर $0.042 प्रति सेकंड की दर से, 10-सेकंड की क्लिप के एक पूरे बैच में से प्रत्येक की कीमत एक डॉलर से भी कम होती है।
ई-कॉमर्स टीमें संदर्भ इनपुट के रूप में कई कोणों से उत्पाद की तस्वीरें प्रदान करती हैं और सिनेमैटिक मार्केटिंग क्लिप तैयार करती हैं जो मूल परिवेशी ऑडियो के साथ उत्पाद को गति में दिखाते हैं। आउटपुट उसी कॉल में सिंक्रनाइज़ ध्वनि के साथ आता है, जो वीडियो शूट या ऑडियो संपादन के बिना विज्ञापनों और उत्पाद पृष्ठों के लिए तैयार होता है। स्टार्ट-एंड फ्रेम नियंत्रण टीमों को सटीक रूप से निर्देशित करने देता है कि प्रत्येक क्लिप में उत्पाद को कैसे प्रकट किया जाए।
निर्देशक Vidu Q3-Pro के कैमरा कंट्रोल का उपयोग निर्दिष्ट गतिविधियों के साथ प्री-विज़ुअलाइज़ेशन क्लिप बनाने के लिए करते हैं — किसी विषय पर पुश-इन, सेट के आर-पार पैन, और किसी पात्र के पीछे ट्रैकिंग शॉट। नेटिव 16-सेकंड आउटपुट का अर्थ है कि एक पूरी छोटी फिल्म का दृश्य एक ही कॉल में प्री-विज़ुअलाइज़ किया जा सकता है। यह कलाकारों और क्रू के लिए गति-सटीक संदर्भ सामग्री के साथ शुरुआती चरण के स्टोरीबोर्ड काम को बदल देता है।
विकास टीमें Vidu Q3-Turbo का उपयोग $0.034 प्रति सेकंड की दर से बैच जनरेशन पाइपलाइन चलाने के लिए करती हैं, जिससे प्रति घंटे टेक्स्ट या इमेज इनपुट से दर्जनों छोटी क्लिप तैयार होती हैं। प्रति-सेकंड कम लागत Q3-Pro के साथ स्केल करने के लिए चयन करने से पहले कई रचनात्मक वेरिएंट तैयार करने और परीक्षण करने को व्यावहारिक बनाती है। दोनों मॉडल एक ही Atlas Cloud API कुंजी के तहत चलते हैं, जिसमें स्तरों के बीच केवल एक पैरामीटर बदलना होता है।
पर्यटन बोर्ड और ट्रैवल प्लेटफॉर्म विवरणात्मक टेक्स्ट प्रॉम्प्ट से प्राकृतिक परिवेशीय ध्वनि के साथ वायुमंडलीय गंतव्य क्लिप उत्पन्न करने के लिए Vidu Q3-Pro टेक्स्ट-टू-वीडियो का उपयोग करते हैं। किसी परिदृश्य, ऐतिहासिक स्थल या सांस्कृतिक सेटिंग का लिखित दृश्य विवरण एक ही कॉल में मिलान वाले ऑडियो के साथ 16-सेकंड का सिनेमाई क्लिप तैयार करता है। यह बुकिंग की मंशा को बढ़ाने वाली सामग्री के लिए लोकेशन शूट का एक लागत-प्रभावी विकल्प प्रदान करता है।
Vidu Q3 एक सिंगल API कॉल में 1080p और 24fps पर 16 सेकंड तक का निरंतर वीडियो जनरेट करता है। यह अपने स्तर के अग्रणी वीडियो मॉडल के बीच सबसे लंबी सिंगल-पास जनरेशन विंडो है। इस अधिकतम सीमा के भीतर प्रति कॉल क्लिप की अवधि कॉन्फ़िगर की जा सकती है।
हाँ। Vidu Q3 एक ही इन्फरेंस पास में वीडियो फ्रेम के साथ-साथ संवाद, ध्वनि प्रभाव, पृष्ठभूमि संगीत और लिप-सिंक एक साथ उत्पन्न करता है। इसमें कोई पोस्ट-प्रोडक्शन डबिंग या मैनुअल ऑडियो अलाइनमेंट चरण नहीं है। ऑडियो टाइमिंग और ऑन-स्क्रीन एक्शन स्वचालित रूप से सिंक हो जाते हैं।
आप सीधे टेक्स्ट प्रॉम्प्ट में कैमरा मूवमेंट — पुश-इन, पैन, ट्रैकिंग शॉट्स — का वर्णन कर सकते हैं, और मॉडल उन्हें पहले फ्रेम से ही निष्पादित करता है। इसके लिए किसी अलग पैरामीटर या कंट्रोल लेयर की आवश्यकता नहीं होती है। यह Atlas Cloud पर टेक्स्ट-टू-वीडियो (text-to-video) और इमेज-टू-वीडियो (image-to-video) दोनों एंडपॉइंट्स पर लागू होता है।
Vidu Q3-Pro एटलस क्लाउड (Atlas Cloud) पर प्रति सेकंड $0.042 की कीमत पर सुचारू मोशन और समृद्ध विवरण के साथ सिनेमाई-ग्रेड आउटपुट प्रदान करता है। Vidu Q3-Turbo $0.034 की कम प्रति-सेकंड लागत के साथ उच्च गति पर जनरेट करता है, जो ड्राफ्ट और तीव्र पुनरावृत्ति के लिए उपयुक्त है। दोनों में समान 1080p आउटपुट रिज़ॉल्यूशन और नेटिव ऑडियो सपोर्ट है।
Vidu Q3 का Reference-to-Video एंडपॉइंट प्रति कॉल 1 से 4 संदर्भ छवियों को स्वीकार करता है। आप एक ही जनरेशन में विभिन्न छवियों से विषयों, वातावरण, वेशभूषा और दृश्य शैलियों को जोड़ सकते हैं। यह कई क्लिप्स में चरित्र और दृश्य स्थिरता बनाए रखने का प्राथमिक तरीका है।
Vidu Q3-Mix, Vidu Q3 श्रृंखला में सर्वोच्च-स्तर का संदर्भ मॉडल है, जिसकी कीमत Atlas Cloud पर $0.106 प्रति सेकंड है। एक ही जनरेशन में कई संदर्भ छवियों को मिलाते समय यह सबसे सुदृढ़ बहु-विषय स्थिरता प्रदान करता है। इसे एनिमेटेड श्रृंखला उत्पादन और ब्रांडेड सामग्री जैसे वर्कफ़्लो के लिए डिज़ाइन किया गया है जहाँ कई क्लिप्स में चरित्र की पहचान दृश्य रूप से समान रहनी चाहिए।
हाँ। Vidu Q3-Pro और Q3-Turbo दोनों में Atlas Cloud पर एक Start-end-to-video एंडपॉइंट है। आप एक प्रारंभिक फ़्रेम छवि प्रदान करते हैं और वांछित गति या अंतिम स्थिति का वर्णन करते हैं, और मॉडल ट्रांज़िशन उत्पन्न करता है। यह प्रत्येक दृश्य के खुलने और बंद होने के तरीके पर सटीक निर्देशकीय नियंत्रण प्रदान करता है।
Vidu Q3-Turbo की शुरुआत $0.034 प्रति सेकंड से होती है। Vidu Q3-Pro और Reference-to-Video एंडपॉइंट की कीमत $0.042 प्रति सेकंड है। Vidu Q3-Mix, जो सबसे उच्च-स्थिरता वाला संदर्भ मॉडल है, $0.106 प्रति सेकंड है। सभी टियर्स की कीमत मानक Shengshu API दरों से 15% कम है और ये पे-ऐज़-यू-गो (उपयोग के आधार पर भुगतान) आधार पर उपलब्ध हैं।
Join the Discord community for the latest model updates, prompts, and support.