ShengShu Models on AtlasCloud | Vidu

Shengshu API पर वीडियो उत्पादन पाइपलाइन बनाएं: Vidu Q3 एक ही कॉल से मूल ऑडियो और स्मार्ट कैमरा कट के साथ 16-सेकंड की सिनेमाई क्लिप बनाता है।

AI Video Models by ShengShu

Atlas Cloud पर नवीनतम AI वीडियो जनरेशन मॉडल के साथ टेक्स्ट और इमेज से सिनेमाई, उच्च-गुणवत्ता वाले वीडियो बनाएं।

Vidu

Vidu API डेवलपर्स को Shengshu AI और Tsinghua University के वीडियो मॉडल्स तक पहुंच देता है, जो U-ViT आर्किटेक्चर पर बनाया गया है जो Diffusion और Transformer डिज़ाइन को एकीकृत करता है। एक से चार संदर्भ छवियों को दर्ज करें और Vidu शॉट्स के बीच विषयों की स्थिरता बनाए रखता है, बुद्धिमान कैमरा स्विचिंग और चिकनी, सिनेमाई गति के साथ। Atlas Cloud पूरी लाइनअप के लिए Day-0 मॉडल एक्सेस और एक OpenAI-संगत कुंजी जोड़ता है। आज ही निर्माण शुरू करें।

25 मॉडलVidu एक्सप्लोर करें

ShengShu Models API Pricing Details

Compare standard vs. our pricing across every ShengShu model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Vidu Q3-Mix Reference to Video	$0.125	Start from$0.106/s video	-15%	View
Vidu Q3 Reference to Video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Pro Start-end-to-video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Turbo Image-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Start-end-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Text-to-video	$0.04	Start from$0.034/s video	-15%	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Atlas Cloud पर विकसित किए जा सकने वाले ShengShu API के उपयोग मामले

Vidu Q3 के 16-सेकंड के क्लिप, नेटिव ऑडियो और मल्टी-रेफरेंस कंसिस्टेंसी इसे उन वर्कफ़्लो के लिए व्यावहारिक बनाते हैं जिनके लिए पहले एक प्रोडक्शन टीम की आवश्यकता होती थी। टीमें बिना प्रदाता बदले तेज़ इटरेशन से तैयार एसेट्स तक जाने के लिए विभिन्न Q3 टियर्स का उपयोग करती हैं।

सुसंगत पात्रों के साथ एनिमेटेड सीरीज़

स्टूडियो और इंडी क्रिएटर्स Vidu Q3-Mix का उपयोग मल्टी-एपिसोड एनिमेटेड कंटेंट जेनरेट करने के लिए करते हैं, जहाँ पात्र हर दृश्य में एक जैसे दिखते हैं। कैरेक्टर रेफरेंस शीट अपलोड करके, प्रत्येक नया क्लिप बिना मैन्युअल फ्रेम-बाय-फ्रेम कंसिस्टेंसी कार्य के समान चेहरे की विशेषताओं, पोशाक और दृश्य शैली को प्राप्त कर लेता है। Shengshu ने SXSW 2026 में इस वर्कफ़्लो को एनिमेटेड सीरीज़ प्रोडक्शन के लिए पहले AI समाधान के रूप में प्रदर्शित किया।

बड़े पैमाने पर ब्रांड अवतार और शुभंकर सामग्री

मार्केटिंग टीमें एक बार ब्रांड कैरेक्टर की संदर्भ छवियां अपलोड करती हैं और TikTok, Reels और YouTube Shorts के लिए दर्जनों शॉर्ट-फॉर्म क्लिप उत्पन्न करने के लिए Vidu Q3 Reference-to-Video का उपयोग करती हैं। कैरेक्टर हर आउटपुट में विज़ुअली समान रहता है, जिससे प्रत्येक एसेट को व्यक्तिगत रूप से ब्रीफिंग और अनुमोदन करने की डिज़ाइन बाधा दूर हो जाती है। Atlas Cloud पर $0.042 प्रति सेकंड की दर से, 10-सेकंड की क्लिप के एक पूरे बैच में से प्रत्येक की कीमत एक डॉलर से भी कम होती है।

बहु-कोण उत्पाद विपणन वीडियो

ई-कॉमर्स टीमें संदर्भ इनपुट के रूप में कई कोणों से उत्पाद की तस्वीरें प्रदान करती हैं और सिनेमैटिक मार्केटिंग क्लिप तैयार करती हैं जो मूल परिवेशी ऑडियो के साथ उत्पाद को गति में दिखाते हैं। आउटपुट उसी कॉल में सिंक्रनाइज़ ध्वनि के साथ आता है, जो वीडियो शूट या ऑडियो संपादन के बिना विज्ञापनों और उत्पाद पृष्ठों के लिए तैयार होता है। स्टार्ट-एंड फ्रेम नियंत्रण टीमों को सटीक रूप से निर्देशित करने देता है कि प्रत्येक क्लिप में उत्पाद को कैसे प्रकट किया जाए।

फ़िल्म प्री-प्रोडक्शन के लिए निर्देशित दृश्य निर्माण

निर्देशक Vidu Q3-Pro के कैमरा कंट्रोल का उपयोग निर्दिष्ट गतिविधियों के साथ प्री-विज़ुअलाइज़ेशन क्लिप बनाने के लिए करते हैं — किसी विषय पर पुश-इन, सेट के आर-पार पैन, और किसी पात्र के पीछे ट्रैकिंग शॉट। नेटिव 16-सेकंड आउटपुट का अर्थ है कि एक पूरी छोटी फिल्म का दृश्य एक ही कॉल में प्री-विज़ुअलाइज़ किया जा सकता है। यह कलाकारों और क्रू के लिए गति-सटीक संदर्भ सामग्री के साथ शुरुआती चरण के स्टोरीबोर्ड काम को बदल देता है।

उच्च-मात्रा सोशल कंटेंट पाइपलाइन

विकास टीमें Vidu Q3-Turbo का उपयोग $0.034 प्रति सेकंड की दर से बैच जनरेशन पाइपलाइन चलाने के लिए करती हैं, जिससे प्रति घंटे टेक्स्ट या इमेज इनपुट से दर्जनों छोटी क्लिप तैयार होती हैं। प्रति-सेकंड कम लागत Q3-Pro के साथ स्केल करने के लिए चयन करने से पहले कई रचनात्मक वेरिएंट तैयार करने और परीक्षण करने को व्यावहारिक बनाती है। दोनों मॉडल एक ही Atlas Cloud API कुंजी के तहत चलते हैं, जिसमें स्तरों के बीच केवल एक पैरामीटर बदलना होता है।

सांस्कृतिक पर्यटन और गंतव्य सामग्री

पर्यटन बोर्ड और ट्रैवल प्लेटफॉर्म विवरणात्मक टेक्स्ट प्रॉम्प्ट से प्राकृतिक परिवेशीय ध्वनि के साथ वायुमंडलीय गंतव्य क्लिप उत्पन्न करने के लिए Vidu Q3-Pro टेक्स्ट-टू-वीडियो का उपयोग करते हैं। किसी परिदृश्य, ऐतिहासिक स्थल या सांस्कृतिक सेटिंग का लिखित दृश्य विवरण एक ही कॉल में मिलान वाले ऑडियो के साथ 16-सेकंड का सिनेमाई क्लिप तैयार करता है। यह बुकिंग की मंशा को बढ़ाने वाली सामग्री के लिए लोकेशन शूट का एक लागत-प्रभावी विकल्प प्रदान करता है।

Atlas Cloud AI के साथ अपनी एंटरप्राइज़ विज़न को हकीकत में बदलें।

सेल्स से संपर्क करें

ShengShu मॉडल्स के बारे में अक्सर पूछे जाने वाले प्रश्न

Vidu Q3 एक सिंगल API कॉल में 1080p और 24fps पर 16 सेकंड तक का निरंतर वीडियो जनरेट करता है। यह अपने स्तर के अग्रणी वीडियो मॉडल के बीच सबसे लंबी सिंगल-पास जनरेशन विंडो है। इस अधिकतम सीमा के भीतर प्रति कॉल क्लिप की अवधि कॉन्फ़िगर की जा सकती है।

हाँ। Vidu Q3 एक ही इन्फरेंस पास में वीडियो फ्रेम के साथ-साथ संवाद, ध्वनि प्रभाव, पृष्ठभूमि संगीत और लिप-सिंक एक साथ उत्पन्न करता है। इसमें कोई पोस्ट-प्रोडक्शन डबिंग या मैनुअल ऑडियो अलाइनमेंट चरण नहीं है। ऑडियो टाइमिंग और ऑन-स्क्रीन एक्शन स्वचालित रूप से सिंक हो जाते हैं।

आप सीधे टेक्स्ट प्रॉम्प्ट में कैमरा मूवमेंट — पुश-इन, पैन, ट्रैकिंग शॉट्स — का वर्णन कर सकते हैं, और मॉडल उन्हें पहले फ्रेम से ही निष्पादित करता है। इसके लिए किसी अलग पैरामीटर या कंट्रोल लेयर की आवश्यकता नहीं होती है। यह Atlas Cloud पर टेक्स्ट-टू-वीडियो (text-to-video) और इमेज-टू-वीडियो (image-to-video) दोनों एंडपॉइंट्स पर लागू होता है।

Vidu Q3-Pro एटलस क्लाउड (Atlas Cloud) पर प्रति सेकंड $0.042 की कीमत पर सुचारू मोशन और समृद्ध विवरण के साथ सिनेमाई-ग्रेड आउटपुट प्रदान करता है। Vidu Q3-Turbo $0.034 की कम प्रति-सेकंड लागत के साथ उच्च गति पर जनरेट करता है, जो ड्राफ्ट और तीव्र पुनरावृत्ति के लिए उपयुक्त है। दोनों में समान 1080p आउटपुट रिज़ॉल्यूशन और नेटिव ऑडियो सपोर्ट है।

Vidu Q3 का Reference-to-Video एंडपॉइंट प्रति कॉल 1 से 4 संदर्भ छवियों को स्वीकार करता है। आप एक ही जनरेशन में विभिन्न छवियों से विषयों, वातावरण, वेशभूषा और दृश्य शैलियों को जोड़ सकते हैं। यह कई क्लिप्स में चरित्र और दृश्य स्थिरता बनाए रखने का प्राथमिक तरीका है।

Vidu Q3-Mix, Vidu Q3 श्रृंखला में सर्वोच्च-स्तर का संदर्भ मॉडल है, जिसकी कीमत Atlas Cloud पर $0.106 प्रति सेकंड है। एक ही जनरेशन में कई संदर्भ छवियों को मिलाते समय यह सबसे सुदृढ़ बहु-विषय स्थिरता प्रदान करता है। इसे एनिमेटेड श्रृंखला उत्पादन और ब्रांडेड सामग्री जैसे वर्कफ़्लो के लिए डिज़ाइन किया गया है जहाँ कई क्लिप्स में चरित्र की पहचान दृश्य रूप से समान रहनी चाहिए।

हाँ। Vidu Q3-Pro और Q3-Turbo दोनों में Atlas Cloud पर एक Start-end-to-video एंडपॉइंट है। आप एक प्रारंभिक फ़्रेम छवि प्रदान करते हैं और वांछित गति या अंतिम स्थिति का वर्णन करते हैं, और मॉडल ट्रांज़िशन उत्पन्न करता है। यह प्रत्येक दृश्य के खुलने और बंद होने के तरीके पर सटीक निर्देशकीय नियंत्रण प्रदान करता है।

Vidu Q3-Turbo की शुरुआत $0.034 प्रति सेकंड से होती है। Vidu Q3-Pro और Reference-to-Video एंडपॉइंट की कीमत $0.042 प्रति सेकंड है। Vidu Q3-Mix, जो सबसे उच्च-स्थिरता वाला संदर्भ मॉडल है, $0.106 प्रति सेकंड है। सभी टियर्स की कीमत मानक Shengshu API दरों से 15% कम है और ये पे-ऐज़-यू-गो (उपयोग के आधार पर भुगतान) आधार पर उपलब्ध हैं।

अधिक सीरीज़ एक्सप्लोर करें

Seedance 2.0

Seedance 2.0 API आपको ByteDance के मल्टीमॉडल वीडियो मॉडल तक प्रोडक्शन एक्सेस देता है — क्वाड-मॉडल इनपुट्स (टेक्स्ट, इमेज, वीडियो, ऑडियो) और एक उद्योग-अग्रणी "Universal Reference" सिस्टम जो शॉट्स के बीच कंपोजिशन, कैमरा मूवमेंट और कैरेक्टर एक्शन्स को लॉक करता है। एक API कॉल के साथ डायरेक्टर-लेवल कंट्रोल को इंटीग्रेट करें, $0.09/s की फ्लैट दर, इंस्टेंट की और बिना किसी वेटलिस्ट के — जिसे एंटरप्राइज़-ग्रेड अपटाइम और कंप्लायंस का समर्थन प्राप्त है। Seedance 2.0 Native 4K अब लाइव है!

सीरीज़ देखें

Grok Imagine

Grok Imagine API डेवलपर्स को एक ही सूट में xAI की इमेज, वीडियो और ऑडियो जेनरेशन प्रदान करता है। यह बहुभाषी टेक्स्ट रेंडरिंग के साथ 2K तक की इमेज, और नेटिव, सिंक्रनाइज़ ऑडियो और संदर्भ-आधारित संपादन के साथ 15 सेकंड तक के वीडियो बनाता है। Atlas Cloud पर, एक ही कुंजी (key) हर Grok Imagine मोड को चलाती है, जिससे आप अलग-अलग सेटअप के बिना इमेज, वीडियो और ऑडियो के बीच स्विच कर सकते हैं, जिसकी कीमत $0.02 प्रति इमेज और $0.05 प्रति सेकंड से शुरू होती है।

सीरीज़ देखें

Gemini Omni Flash

Gemini Omni API, Google I/O 2026 में पेश किए गए Google DeepMind के मल्टीमोडल वीडियो जेनरेशन और एडिटिंग मॉडल को आपके स्टैक तक लाता है। Gemini Omni, Gemini के रीज़निंग इंजन को जेनरेटिव मीडिया के साथ जोड़ता है और टेक्स्ट, इमेज, वीडियो तथा ऑडियो के किसी भी संयोजन को स्वीकार कर सुसंगत, ज्ञान-आधारित आउटपुट तैयार करता है। स्वाभाविक बातचीत के ज़रिए परिणामों को निखारें — ऑब्जेक्ट बदलें, सीन दोबारा लिखें और स्टाइल बदलें, जबकि फ़िज़िक्स, किरदार और निरंतरता ज्यों की त्यों बनी रहती है। Atlas Cloud पूरी Gemini Omni Flash सीरीज़ — टेक्स्ट-टू-वीडियो, 7 रेफ़रेंस इमेज तक के साथ इमेज-टू-वीडियो, और रेफ़रेंस-टू-वीडियो — एक एकीकृत API के माध्यम से उपलब्ध कराता है, जिसमें $0.112 से शुरू होने वाली पारदर्शी प्रति-सेकंड कीमत है और कोई सब्सक्रिप्शन नहीं। आज ही बनाना शुरू करें।

सीरीज़ देखें

GPT Image 2

GPT Image 2 API डेवलपर्स को OpenAI के नवीनतम इमेज मॉडल तक पहुंच प्रदान करता है, जो GPT Image 1.5 का उत्तराधिकारी है। यह लैटिन और CJK लिपियों में सटीक टेक्स्ट रेंडरिंग के साथ चित्र बनाता और संपादित करता है, साथ ही पोस्टर, मॉकअप और इन्फोग्राफिक्स के लिए मजबूत संयोजन (कंपोजिशन) प्रदान करता है। Atlas Cloud पर आप इसे 300+ मॉडलों के साथ एक एकीकृत API के माध्यम से एक्सेस कर सकते हैं, जिसमें मुफ्त क्रेडिट, 99.99% अपटाइम और OpenAI संगठन सत्यापन की कोई आवश्यकता नहीं है।

सीरीज़ देखें

Google

Google के सबसे शक्तिशाली क्रिएटिव मॉडल अब Atlas Cloud पर उपलब्ध हैं। Veo 3.1 सिनेमैटिक वीडियो जनरेशन प्रदान करता है, Nano Banana 2 हाई-फिडेलिटी इमेज क्रिएशन को शक्ति देता है, और Gemini हर वर्कफ़्लो में मल्टीमॉडल इंटेलिजेंस लाता है। Day-0 उपलब्धता और पे-एज़-यू-गो (pay-as-you-go) प्राइसिंग के साथ एक ही API key के माध्यम से संपूर्ण Google मॉडल सूट तक पहुंचें।

सीरीज़ देखें

Seedance 2.0 Mini

Seedance 2.0 Mini, ByteDance के मल्टीमोडल वीडियो जनरेशन को उन वर्कफ़्लो में लाता है जहाँ गति और लागत सबसे अधिक मायने रखते हैं। यह एक हल्के फुटप्रिंट पर Seedance 2.0 की मुख्य क्षमताएँ प्रदान करता है — तेज़ जनरेशन, प्रति वीडियो कम लागत, और वही API एकीकरण जिसका आप पहले से उपयोग करते हैं। उच्च-मात्रा वाले पाइपलाइन चलाने या बड़े पैमाने पर प्रोटोटाइपिंग करने वाली टीमों के लिए, Mini व्यावहारिक डिफ़ॉल्ट विकल्प है।

सीरीज़ देखें

ByteDance

सिनेमैटिक वीडियो जनरेशन से लेकर हाई-फिडेलिटी इमेज क्रिएशन तक, ByteDance के सबसे शक्तिशाली मॉडल Atlas Cloud पर लाइव हैं। सबसे कम इन्फ्रेंस प्राइसिंग और शून्य इन्फ्रास्ट्रक्चर ओवरहेड के साथ बड़े पैमाने पर Seedance और Seedream को रन करें।

सीरीज़ देखें

Alibaba

Atlas Cloud एक ही API के तहत Alibaba के पूरे मॉडल लाइनअप को एक साथ लाता है: भाषा और छवि कार्यों के लिए Qwen, और 1080p तक के वीडियो निर्माण के लिए Wan। बिना किसी सब्सक्रिप्शन के पे-एज़-यू-गो (pay-as-you-go) के आधार पर प्रत्येक मॉडल तक पहुँच प्राप्त करें। Alibaba API आपके मौजूदा OpenAI-संगत क्लाइंट का उपयोग करके एकल बेस URL के माध्यम से उपलब्ध है।

सीरीज़ देखें

OpenAI

Atlas Cloud आपको पूर्ण OpenAI API लाइनअप तक पहुंच प्रदान करता है, छवि निर्माण के लिए GPT Image 2 से लेकर वीडियो के लिए Sora 2 तक। हर मॉडल बिना किसी मासिक प्रतिबद्धता के 'पे-ऐज़-यू-गो' (pay-as-you-go) आधार पर उपलब्ध है। OpenAI-संगत API का उपयोग करके एकल बेस URL स्वैप के साथ प्लग इन करें।

सीरीज़ देखें

xAI

Atlas Cloud पर xAI API का उपयोग करके संपूर्ण इमेज और वीडियो पाइपलाइन बनाएं। 2K रिज़ॉल्यूशन पर जनरेट करें, संदर्भ छवियों के साथ संपादित करें, और छवियों को ऑडियो-सिंक किए गए क्लिप में एनिमेट करें।

सीरीज़ देखें

Kwaivgi

Kwaivgi API मानक मूल्य निर्धारण से 15% कम पर। Atlas Cloud नए Kling रिलीज़ के लिए पे-एज़-यू-गो (उपयोग के अनुसार भुगतान) मूल्य निर्धारण और बिना किसी सीट सीमा के डे-0 (Day-0) एक्सेस प्रदान करता है। एक खाता, एक कुंजी, मानक से लेकर मास्टर टियर तक हर Kling मॉडल।

सीरीज़ देखें

Seedream 5.0 Pro

Seedream 5.0 Pro API डेवलपर्स को Atlas Cloud पर ByteDance का नियंत्रणीय छवि संपादन मॉडल प्रदान करता है। यह एंकर और निर्देशांकों के साथ संपादनों को सटीक रूप से रखता है, छवियों को संपादन योग्य परतों में अलग करता है, कई संदर्भों को मिलाता है, और 2K और 3K पर बहुभाषी पाठ के साथ सटीक रंगों और सामग्रियों का मिलान करता है। Atlas Cloud पर आप एक कुंजी के माध्यम से इस तक पहुँच सकते हैं!

सीरीज़ देखें