ShengShu Models on AtlasCloud | Vidu

Buduj potoki produkcji wideo na Shengshu API: Vidu Q3 generuje 16-sekundowe klipy kinowe z natywnym dźwiękiem i inteligentnymi cięciami kamery za pomocą jednego wywołania.

AI Video Models by ShengShu

Twórz filmowe, wysokiej jakości materiały wideo z tekstu i obrazów dzięki najnowszym modelom AI do generowania wideo w Atlas Cloud.

Zobacz wszystkie modele

obraz-do-wideo

tekst-do-wideo

LLM

Vidu

API Vidu daje deweloperom dostęp do modeli wideo z Shengshu AI i Uniwersytetu Tsinghua, zbudowany na architekturze U-ViT, która łączy projektowanie Diffusion i Transformer. Wpisz od jednego do czterech obrazów referencyjnych, a Vidu utrzymuje spójność podmiotów w ujęciach, z inteligentnym przełączaniem kamery i płynnym, kinematycznym ruchem. Atlas Cloud dodaje dostęp do modeli Day-0 i jeden klucz kompatybilny z OpenAI dla całej oferty. Zacznij budować dzisiaj.

25 modeliPoznaj Vidu

ShengShu Models API Pricing Details

Compare standard vs. our pricing across every ShengShu model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Vidu Q3-Mix Reference to Video	$0.125	Start from$0.106/s video	-15%	View
Vidu Q3 Reference to Video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Pro Start-end-to-video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Turbo Image-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Start-end-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Text-to-video	$0.04	Start from$0.034/s video	-15%	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Przypadki użycia API ShengShu, które można zbudować w Atlas Cloud

16-sekundowe klipy, natywny dźwięk i spójność wielu referencji w Vidu Q3 sprawiają, że jest to praktyczne rozwiązanie dla przepływów pracy, które wcześniej wymagały zespołu produkcyjnego. Zespoły korzystają z różnych poziomów Q3, aby przejść od szybkiej iteracji do gotowych zasobów bez konieczności zmiany dostawcy.

Serial Animowany ze Spójnymi Postaciami

Studia i niezależni twórcy używają Vidu Q3-Mix do generowania wieloodcinkowych treści animowanych, w których postacie wyglądają identycznie w każdej scenie. Dzięki przesłaniu arkuszy referencyjnych postaci, każdy nowy klip dziedziczy te same rysy twarzy, kostiumy i styl wizualny bez konieczności ręcznego dbania o spójność klatka po klatce. Firma Shengshu zaprezentowała ten przepływ pracy na targach SXSW 2026 jako pierwsze rozwiązanie AI do produkcji seriali animowanych.

Treści z awatarami marki i maskotkami na dużą skalę

Zespoły marketingowe przesyłają obrazy referencyjne postaci marki tylko raz i używają Vidu Q3 Reference-to-Video do generowania dziesiątek krótkich klipów na TikTok, Reels i YouTube Shorts. Postać pozostaje wizualnie identyczna w każdym wygenerowanym pliku, co eliminuje wąskie gardło projektowe związane z indywidualnym omawianiem i zatwierdzaniem każdego zasobu. Przy cenie 0,042 USD za sekundę w Atlas Cloud, każda z 10-sekundowych sekwencji w pełnej partii klipów kosztuje mniej niż dolara.

Wideo marketingowe produktu z wielu perspektyw

Zespoły e-commerce dostarczają zdjęcia produktów z wielu kątów jako dane referencyjne i generują kinowe klipy marketingowe, które pokazują produkt w ruchu z natywnym dźwiękiem otoczenia. Wynik jest dostarczany ze zsynchronizowanym dźwiękiem w tym samym wywołaniu, gotowy do reklam i stron produktów bez nagrywania wideo ani edycji dźwięku. Kontrola klatki początkowej i końcowej pozwala zespołom precyzyjnie kierować tym, jak produkt jest ujawniany w każdym klipie.

Ukierunkowane Generowanie Scen dla Preprodukcji Filmowej

Reżyserzy używają sterowania kamerą w Vidu Q3-Pro do generowania klipów prewizualizacyjnych z określonymi ruchami — najazdy na obiekt, panoramy po planie, ujęcia śledzące postać. Natywny, 16-sekundowy czas wyjściowy oznacza, że w jednym wywołaniu można prewizualizować całą krótką scenę. Zastępuje to wczesne etapy pracy nad scenopisem obrazkowym materiałami referencyjnymi o precyzyjnym ruchu dla obsady i ekipy.

Potok treści społecznościowych o dużym wolumenie

Zespoły programistyczne używają Vidu Q3-Turbo do uruchamiania potoków generowania wsadowego w cenie 0,034 USD za sekundę, produkując dziesiątki krótkich klipów z danych wprowadzanych w postaci tekstu lub obrazu na godzinę. Niższy koszt za sekundę sprawia, że praktyczne staje się generowanie i testowanie wielu kreatywnych wariantów przed wyborem tych, które zostaną przeskalowane za pomocą Q3-Pro. Oba modele działają pod tym samym kluczem API Atlas Cloud z pojedynczą zmianą parametru między poziomami.

Turystyka Kulturowa i Treści o Destynacjach

Rady turystyczne i platformy podróżnicze wykorzystują funkcję zamiany tekstu na wideo Vidu Q3-Pro do generowania nastrojowych klipów z miejsc docelowych z naturalnym dźwiękiem otoczenia na podstawie opisowych podpowiedzi tekstowych. Pisemny opis sceny krajobrazu, punktu orientacyjnego lub środowiska kulturowego pozwala uzyskać 16-sekundowy klip kinowy z dopasowanym dźwiękiem w jednym wywołaniu. Stanowi to opłacalną alternatywę dla sesji zdjęciowych w plenerze dla treści, które napędzają intencję rezerwacji.

Zamień wizję swojej firmy w rzeczywistość dzięki Atlas Cloud AI.

Skontaktuj się ze sprzedażą

Często zadawane pytania dotyczące modeli ShengShu

Vidu Q3 generuje do 16 sekund ciągłego wideo w jednym wywołaniu API w rozdzielczości 1080p i 24fps. Jest to najdłuższe okno generowania jednoprzebiegowego (single-pass) wśród wiodących modeli wideo w swojej klasie. Długość klipu można konfigurować dla każdego wywołania w ramach tego maksimum.

Tak. Vidu Q3 generuje dialogi, efekty dźwiękowe, muzykę w tle i synchronizację ruchu warg jednocześnie z klatkami wideo w jednym przejściu inferencji. Nie ma etapu dubbingu w postprodukcji ani ręcznego dopasowywania dźwięku. Synchronizacja czasowa dźwięku z akcją na ekranie odbywa się automatycznie.

Ruch kamery — najazdy (push-ins), panoramy (pans), ujęcia śledzące (tracking shots) — można opisać bezpośrednio w prompcie tekstowym, a model wykona je już od pierwszej klatki. Nie są wymagane żadne oddzielne parametry ani warstwy kontrolne. Dotyczy to zarówno endpointów text-to-video, jak i image-to-video w chmurze Atlas Cloud.

Vidu Q3-Pro zapewnia generowanie materiałów o kinowej jakości z płynnym ruchem i bogactwem szczegółów w cenie 0,042 USD za sekundę w Atlas Cloud. Vidu Q3-Turbo generuje z wyższą prędkością przy niższym koszcie wynoszącym 0,034 USD za sekundę, co idealnie sprawdza się w przypadku wersji roboczych i szybkiej iteracji. Oba modele oferują taką samą rozdzielczość wyjściową 1080p oraz natywną obsługę dźwięku.

Punkt końcowy Reference-to-Video Vidu Q3 akceptuje od 1 do 4 obrazów referencyjnych na wywołanie. W jednej generacji można łączyć obiekty, środowiska, kostiumy i style wizualne z różnych obrazów. Jest to podstawowy sposób na zachowanie spójności postaci i scen w wielu klipach.

Vidu Q3-Mix to najwyższej klasy model referencyjny z linii Vidu Q3, dostępny w cenie 0,106 USD za sekundę w Atlas Cloud. Zapewnia on najsilniejszą spójność wielu obiektów podczas łączenia kilku obrazów referencyjnych w jednej generacji. Został zaprojektowany z myślą o przepływach pracy, takich jak produkcja seriali animowanych i treści promujących markę, gdzie tożsamość postaci musi pozostać wizualnie identyczna w wielu klipach.

Tak. Zarówno Vidu Q3-Pro, jak i Q3-Turbo posiadają endpoint Start-end-to-video w Atlas Cloud. Dostarczasz obraz klatki początkowej i opisujesz pożądany ruch lub stan końcowy, a model generuje przejście. Zapewnia to precyzyjną kontrolę reżyserską nad tym, jak każda scena się rozpoczyna i kończy.

Ceny Vidu Q3-Turbo zaczynają się od 0,034 USD za sekundę. Vidu Q3-Pro i endpoint Reference-to-Video kosztują 0,042 USD za sekundę. Vidu Q3-Mix, model referencyjny o najwyższej spójności, kosztuje 0,106 USD za sekundę. Wszystkie poziomy są wycenione o 15% poniżej standardowych stawek Shengshu API i są dostępne w modelu pay-as-you-go (płatność zgodnie z rzeczywistym użyciem).

Poznaj Więcej Rodzin

Seedance 2.0

API Seedance 2.0 zapewnia produkcyjny dostęp do multimodalnego modelu wideo ByteDance — czteromodalne dane wejściowe (tekst, obraz, wideo, dźwięk) oraz wiodący w branży system „Universal Reference”, który blokuje kompozycję, ruchy kamery i działania postaci w różnych ujęciach. Zintegruj kontrolę na poziomie reżysera za pomocą jednego wywołania API, stałej stawki 0,09 USD/s, natychmiastowego klucza i braku listy oczekujących — wszystko to przy wsparciu czasu sprawności i zgodności klasy korporacyjnej. Seedance 2.0 Native 4K jest już dostępne!

Zobacz Rodzinę

Grok Imagine

Grok Imagine API zapewnia programistom możliwość generowania obrazów, wideo i dźwięku od xAI w jednym pakiecie. Tworzy obrazy w rozdzielczości do 2K z wielojęzycznym renderowaniem tekstu, a także filmy do 15 sekund z natywnym, zsynchronizowanym dźwiękiem i edycją opartą na referencjach. W Atlas Cloud jeden klucz uruchamia każdy tryb Grok Imagine, dzięki czemu można przełączać się między obrazem, wideo i dźwiękiem bez osobnych konfiguracji, już od 0,02 USD za obraz i 0,05 USD za sekundę.

Zobacz Rodzinę

Gemini Omni Flash

Gemini Omni API wprowadza do Twojego stacku multimodalny model generowania i edycji wideo od Google DeepMind, zaprezentowany na Google I/O 2026. Gemini Omni łączy silnik rozumowania Gemini z mediami generatywnymi, przyjmując dowolną kombinację tekstu, obrazów, wideo i dźwięku, aby tworzyć spójne, oparte na wiedzy wyniki. Dopracowuj rezultaty w naturalnej rozmowie — podmieniaj obiekty, przepisuj sceny i zmieniaj style, podczas gdy fizyka, postacie i ciągłość pozostają nienaruszone. Atlas Cloud udostępnia pełną gamę Gemini Omni Flash — tekst na wideo, obraz na wideo z maksymalnie 7 obrazami referencyjnymi oraz referencję na wideo — poprzez jedno ujednolicone API z przejrzystym rozliczaniem za sekundę już od $0.112 i bez subskrypcji. Zacznij tworzyć już dziś.

Zobacz Rodzinę

GPT Image 2

API GPT Image 2 daje programistom dostęp do najnowszego modelu obrazów firmy OpenAI, następcy GPT Image 1.5. Generuje i edytuje on obrazy z dokładnym renderowaniem tekstu w skryptach łacińskich i CJK, a także zapewnia silną kompozycję dla plakatów, makiet i infografik. W Atlas Cloud można uzyskać do niego dostęp za pośrednictwem jednego zunifikowanego API wraz z ponad 300 modelami, z darmowymi kredytami, gwarantowanym czasem pracy (uptime) na poziomie 99,99% i bez wymogu weryfikacji organizacji OpenAI.

Zobacz Rodzinę

Google

Najpotężniejsze modele kreatywne Google są w pełni dostępne na platformie Atlas Cloud. Veo 3.1 zapewnia kinową generację wideo, Nano Banana 2 umożliwia tworzenie obrazów o wysokiej wierności, a Gemini wprowadza wielomodalną inteligencję do każdego przepływu pracy. Uzyskaj dostęp do pełnego pakietu modeli Google za pomocą jednego klucza API key z dostępnością Day-0 i cennikiem pay-as-you-go.

Zobacz Rodzinę

Seedance 2.0 Mini

Seedance 2.0 Mini wprowadza multimodalne generowanie wideo firmy ByteDance do przepływów pracy, w których szybkość i koszty mają największe znaczenie. Zapewnia podstawowe możliwości Seedance 2.0 przy mniejszym zużyciu zasobów — szybsze generowanie, niższy koszt na wideo i tę samą integrację API, z której już korzystasz. Dla zespołów obsługujących potoki o dużej objętości lub tworzących prototypy na dużą skalę, Mini jest praktycznym wyborem domyślnym.

Zobacz Rodzinę

ByteDance

Od generowania kinowych filmów po tworzenie obrazów o wysokiej wierności, najpotężniejsze modele ByteDance są dostępne w Atlas Cloud. Uruchamiaj Seedance i Seedream na dużą skalę z najniższymi cenami wnioskowania i zerowymi kosztami ogólnymi infrastruktury.

Zobacz Rodzinę

Alibaba

Atlas Cloud łączy pełną gamę modeli Alibaba w ramach jednego API: Qwen do zadań związanych z językiem i obrazem oraz Wan do generowania wideo w rozdzielczości do 1080p. Uzyskaj dostęp do każdego modelu w modelu płatności zgodnie z rzeczywistym użyciem (pay-as-you-go) bez subskrypcji. Alibaba API jest dostępne poprzez pojedynczy bazowy adres URL (base URL) przy użyciu istniejącego klienta kompatybilnego z OpenAI.

Zobacz Rodzinę

OpenAI

Atlas Cloud zapewnia dostęp do pełnej linii API OpenAI, od GPT Image 2 do generowania obrazów po Sora 2 do wideo. Każdy model jest dostępny w modelu płatności za użycie (pay-as-you-go) bez miesięcznych zobowiązań. Zintegruj się za pomocą jednej zmiany bazowego adresu URL, korzystając z API kompatybilnego z OpenAI.

Zobacz Rodzinę

xAI

Zbuduj kompletne potoki przetwarzania obrazów i wideo za pomocą xAI API w Atlas Cloud. Generuj w rozdzielczości 2K, edytuj za pomocą obrazów referencyjnych i animuj obrazy w klipy zsynchronizowane z dźwiękiem.

Zobacz Rodzinę

Kwaivgi

API Kwaivgi o 15% poniżej standardowej ceny. Atlas Cloud zapewnia dostęp od pierwszego dnia (Day-0) do nowych wydań Kling z modelem płatności zgodnie z użyciem (pay-as-you-go) i bez limitów stanowisk. Jedno konto, jeden klucz, każdy model Kling od poziomu standardowego po poziom master.

Zobacz Rodzinę

Seedream 5.0 Pro

Seedream 5.0 Pro API udostępnia programistom sterowalny model edycji obrazów firmy ByteDance w Atlas Cloud. Precyzyjnie rozmieszcza edycje za pomocą kotwic i współrzędnych, dzieli obrazy na edytowalne warstwy, łączy wiele odniesień oraz dopasowuje dokładne kolory i materiały, z wielojęzycznym tekstem w rozdzielczościach 2K i 3K. W Atlas Cloud można uzyskać do niego dostęp za pomocą jednego klucza!

Zobacz Rodzinę