ShengShu Models on AtlasCloud | Vidu

Bauen Sie Videoproduktions-Pipelines auf der Shengshu API auf: Vidu Q3 generiert mit einem einzigen Aufruf 16-sekündige filmische Clips mit nativem Audio und intelligenten Kameraschnitten.

AI Video Models by ShengShu

Erzeugen Sie mit den neuesten KI-Modellen zur Videogenerierung auf Atlas Cloud kinoreife, hochdetaillierte Videos aus Text und Bildern.

Vidu

Die Vidu API ermöglicht Entwicklern den Zugriff auf Video-Modelle von Shengshu AI und der Tsinghua University, basierend auf der U-ViT-Architektur, die Diffusion und Transformer vereinigt. Geben Sie ein bis vier Referenzbilder ein, und Vidu hält Objekte über Aufnahmen hinweg konsistent, mit intelligentem Kamerawechsel und sanften, cinematischen Bewegungen. Atlas Cloud bietet sofortigen Modellzugriff und einen OpenAI-kompatiblen Schlüssel für das gesamte Portfolio. Fangen Sie heute an.

25 ModelleErkunden Sie Vidu

ShengShu Models API Pricing Details

Compare standard vs. our pricing across every ShengShu model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Vidu Q3-Mix Reference to Video	$0.125	Start from$0.106/s video	-15%	View
Vidu Q3 Reference to Video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Pro Start-end-to-video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Turbo Image-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Start-end-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Text-to-video	$0.04	Start from$0.034/s video	-15%	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

ShengShu API-Anwendungsfälle, die Sie auf Atlas Cloud entwickeln können

Die 16-Sekunden-Clips, natives Audio und die Multi-Referenz-Konsistenz von Vidu Q3 machen es praktisch für Workflows, die zuvor ein Produktionsteam erforderten. Teams nutzen die verschiedenen Q3-Stufen, um von schnellen Iterationen zu fertigen Assets zu gelangen, ohne den Anbieter wechseln zu müssen.

Animationsserie mit konsistenten Charakteren

Studios und Indie-Ersteller nutzen Vidu Q3-Mix, um animierte Inhalte mit mehreren Episoden zu generieren, bei denen die Charaktere in jeder Szene identisch aussehen. Durch das Hochladen von Charakter-Referenzbögen erbt jeder neue Clip die gleichen Gesichtszüge, Kostüme und den gleichen visuellen Stil ohne manuelle Frame-für-Frame-Konsistenzarbeit. Shengshu demonstrierte diesen Workflow auf der SXSW 2026 als erste AI-Lösung für die Produktion von Animationsserien.

Marken-Avatar- und Maskottchen-Inhalte in großem Maßstab

Marketingteams laden die Referenzbilder eines Markencharakters einmalig hoch und nutzen Vidu Q3 Reference-to-Video, um Dutzende von Kurzclips für TikTok, Reels und YouTube Shorts zu generieren. Der Charakter bleibt in jedem Ergebnis visuell identisch, wodurch der Design-Engpass bei der individuellen Einweisung und Freigabe jedes einzelnen Assets beseitigt wird. Bei 0,042 $ pro Sekunde auf Atlas Cloud kostet eine komplette Charge von 10-Sekunden-Clips jeweils weniger als einen Dollar.

Multi-Winkel-Produktmarketing-Video

E-Commerce-Teams liefern Produktfotos aus verschiedenen Blickwinkeln als Referenzeingaben und generieren kinoreife Marketing-Clips, die das Produkt in Bewegung mit nativem Umgebungs-Audio zeigen. Die Ausgabe erfolgt mit synchronisiertem Ton im selben Aufruf, bereit für Anzeigen und Produktseiten ohne Videodreh oder Audiobearbeitung. Die Start-End-Frame-Steuerung ermöglicht es Teams, präzise zu steuern, wie das Produkt in jedem Clip enthüllt wird.

Gesteuerte Szenengenerierung für die Filmpräproduktion

Regisseure nutzen die Kamerasteuerung von Vidu Q3-Pro, um Pre-Visualisierungs-Clips mit festgelegten Bewegungen zu generieren — Push-ins auf ein Motiv, Schwenks über ein Set, Kamerafahrten, die einem Charakter folgen. Die native 16-Sekunden-Ausgabe bedeutet, dass eine komplette kurze Szene in einem Aufruf vorab visualisiert werden kann. Dies ersetzt die frühe Storyboard-Arbeit durch bewegungsgenaues Referenzmaterial für Besetzung und Crew.

Hochvolumige Social-Content-Pipeline

Entwicklungsteams verwenden Vidu Q3-Turbo, um Batch-Generierungspipelines für 0,034 $ pro Sekunde auszuführen und so stündlich Dutzende von Kurzclips aus Text- oder Bildeingaben zu erstellen. Die geringeren Kosten pro Sekunde machen es praktikabel, viele kreative Varianten zu generieren und zu testen, bevor ausgewählt wird, welche mit Q3-Pro skaliert werden sollen. Beide Modelle laufen unter demselben Atlas Cloud API-Schlüssel mit einer einzigen Parameteränderung zwischen den Stufen.

Kulturtourismus und Destinationsinhalte

Tourismusverbände und Reiseplattformen nutzen die Text-zu-Video-Generierung von Vidu Q3-Pro, um aus deskriptiven Text-Prompts stimmungsvolle Reiseziel-Clips mit natürlichem Umgebungsklang zu erstellen. Eine schriftliche Szenenbeschreibung einer Landschaft, eines Wahrzeichens oder eines kulturellen Schauplatzes erzeugt in einem einzigen Aufruf einen 16-sekündigen kinoreifen Clip mit passendem Audio. Dies bietet eine kostengünstige Alternative zu Dreharbeiten vor Ort für Inhalte, die die Buchungsabsicht fördern.

Verwandeln Sie Ihre Unternehmensvision mit Atlas Cloud AI in Realität.

Vertrieb kontaktieren

Häufig gestellte Fragen zu ShengShu-Modellen

Vidu Q3 generiert in einem einzigen API-Aufruf bis zu 16 Sekunden kontinuierliches Video in 1080p und 24fps. Dies ist das längste Single-Pass-Generierungsfenster unter den führenden Videomodellen seiner Klasse. Die Clip-Dauer ist pro Aufruf innerhalb dieses Maximums konfigurierbar.

Ja. Vidu Q3 erzeugt Dialoge, Soundeffekte, Hintergrundmusik und Lippensynchronisation gleichzeitig mit den Videoframes in einem einzigen Inferenzdurchlauf. Es gibt keinen Schritt für die Postproduktions-Synchronisation oder eine manuelle Audioausrichtung. Audiotiming und Bildschirmaktion werden automatisch synchronisiert.

Sie beschreiben Kamerabewegungen direkt im Text-Prompt – Push-ins, Schwenks (Pans), Tracking-Shots – und das Modell führt diese ab dem ersten Frame aus. Es ist kein separater Parameter oder eine separate Steuerungsebene erforderlich. Dies gilt sowohl für Text-to-Video- als auch für Image-to-Video-Endpoints auf Atlas Cloud.

Vidu Q3-Pro liefert filmreife Ausgaben mit flüssigen Bewegungen und reichhaltigen Details zum Preis von 0,042 $ pro Sekunde in der Atlas Cloud. Vidu Q3-Turbo generiert mit höherer Geschwindigkeit und einem geringeren Preis von 0,034 $ pro Sekunde, ideal für Entwürfe und schnelle Iterationen. Beide teilen sich dieselbe 1080p-Ausgabeauflösung und native Audiounterstützung.

Der Reference-to-Video-Endpunkt von Vidu Q3 akzeptiert zwischen 1 und 4 Referenzbilder pro Aufruf. Sie können Subjekte, Umgebungen, Kostüme und visuelle Stile aus verschiedenen Bildern in einer einzigen Generierung kombinieren. Dies ist die primäre Methode, um die Charakter- und Szenenkonsistenz über mehrere Clips hinweg aufrechtzuerhalten.

Vidu Q3-Mix ist das Referenzmodell der höchsten Stufe in der Vidu Q3-Reihe und kostet 0,106 $ pro Sekunde in der Atlas Cloud. Es bietet die stärkste Multi-Subjekt-Konsistenz, wenn mehrere Referenzbilder in einer einzigen Generierung kombiniert werden. Es wurde für Workflows wie die Produktion von Animationsserien und Marken-Inhalten entwickelt, bei denen die Identität der Charaktere über viele Clips hinweg visuell identisch bleiben muss.

Ja. Sowohl Vidu Q3-Pro als auch Q3-Turbo verfügen über einen Start-end-to-video-Endpoint auf Atlas Cloud. Sie stellen ein Start-Frame-Bild zur Verfügung und beschreiben die gewünschte Bewegung oder den Endzustand, und das Modell generiert den Übergang. Dies ermöglicht eine präzise regieartige Kontrolle darüber, wie jede Szene beginnt und endet.

Vidu Q3-Turbo beginnt bei 0,034 $ pro Sekunde. Vidu Q3-Pro und der Reference-to-Video-Endpoint kosten 0,042 $ pro Sekunde. Vidu Q3-Mix, das Referenzmodell mit der höchsten Konsistenz, liegt bei 0,106 $ pro Sekunde. Alle Stufen werden 15 % unter den Standardraten der Shengshu API bepreist und sind im Pay-as-you-go-Verfahren verfügbar.

Weitere Familien Erkunden

Seedance 2.0

Die Seedance 2.0 API bietet Ihnen Produktionszugriff auf das multimodale Videomodell von ByteDance – quadmodale Eingaben (Text, Bild, Video, Audio) und ein branchenführendes „Universal Reference“-System, das Bildkomposition, Kamerabewegungen und Charakteraktionen über verschiedene Einstellungen hinweg fixiert. Integrieren Sie Kontrolle auf Regisseur-Niveau mit nur einem API-Aufruf, einem Pauschalpreis von 0,09 $/s, sofortigem Key und ohne Warteliste – unterstützt durch branchenübliche Verfügbarkeit und Compliance für Unternehmen. Seedance 2.0 Native 4K ist ab sofort live!

Familie Anzeigen

Grok Imagine

Die Grok Imagine API bietet Entwicklern die Bild-, Video- und Audiogenerierung von xAI in einer einzigen Suite. Sie erzeugt Bilder mit bis zu 2K Auflösung und mehrsprachigem Text-Rendering sowie bis zu 15 Sekunden lange Videos mit nativem, synchronisiertem Audio und referenzbasierter Bearbeitung. Auf Atlas Cloud führt ein einziger Schlüssel jeden Grok Imagine-Modus aus, sodass Sie ohne separate Einrichtung zwischen Bild, Video und Audio wechseln können, ab 0,02 $ pro Bild und 0,05 $ pro Sekunde.

Familie Anzeigen

Gemini Omni Flash

Die Gemini Omni API bringt das multimodale Videogenerierungs- und Bearbeitungsmodell von Google DeepMind, vorgestellt auf der Google I/O 2026, in Ihren Stack. Gemini Omni verbindet die Reasoning-Engine von Gemini mit generativen Medien und akzeptiert beliebige Kombinationen aus Text, Bildern, Video und Audio, um konsistente, wissensbasierte Ergebnisse zu erzeugen. Verfeinern Sie die Resultate im natürlichen Dialog – tauschen Sie Objekte aus, schreiben Sie Szenen um und wechseln Sie den Stil, während Physik, Figuren und Kontinuität erhalten bleiben. Atlas Cloud stellt das komplette Gemini-Omni-Flash-Lineup bereit – Text-to-Video, Image-to-Video mit bis zu 7 Referenzbildern und Reference-to-Video – über eine einheitliche API mit transparenter sekundengenauer Abrechnung ab $0.112 und ohne Abo. Legen Sie noch heute los.

Familie Anzeigen

GPT Image 2

Die GPT Image 2 API bietet Entwicklern Zugang zum neuesten Bildmodell von OpenAI, dem Nachfolger von GPT Image 1.5. Es generiert und bearbeitet Bilder mit präziser Textdarstellung über lateinische und CJK-Schriften hinweg sowie mit starker Komposition für Poster, Mockups und Infografiken. Auf Atlas Cloud erreichen Sie es über eine einzige vereinheitlichte API zusammen mit über 300 Modellen, mit kostenlosen Credits, 99,99 % Verfügbarkeit und ohne erforderliche OpenAI-Organisationsverifizierung.

Familie Anzeigen

Google

Die leistungsstärksten kreativen Modelle von Google sind alle auf Atlas Cloud verfügbar. Veo 3.1 liefert kinoreife Videogenerierung, Nano Banana 2 ermöglicht die Erstellung von High-Fidelity-Bildern und Gemini bringt multimodale Intelligenz in jeden Workflow. Greifen Sie über einen einzigen API key mit Day-0-Verfügbarkeit und Pay-as-you-go-Preisen auf die vollständige Google-Modellsuite zu.

Familie Anzeigen

Seedance 2.0 Mini

Seedance 2.0 Mini bringt die multimodale Videogenerierung von ByteDance in Workflows, bei denen Geschwindigkeit und Kosten am wichtigsten sind. Es bietet die Kernfunktionen von Seedance 2.0 bei geringerem Ressourcenverbrauch – schnellere Generierung, niedrigere Kosten pro Video und dieselbe API-Integration, die Sie bereits nutzen. Für Teams, die hochvolumige Pipelines betreiben oder Prototyping in großem Maßstab durchführen, ist Mini der praktische Standard.

Familie Anzeigen

ByteDance

Von der Generierung kinoreifer Videos bis zur Erstellung von High-Fidelity-Bildern sind die leistungsstärksten Modelle von ByteDance jetzt auf der Atlas Cloud verfügbar. Führen Sie Seedance und Seedream in großem Maßstab zu den niedrigsten Inferenzpreisen und ohne Infrastruktur-Overhead aus.

Familie Anzeigen

Alibaba

Atlas Cloud vereint das gesamte Modell-Lineup von Alibaba unter einer einzigen API: Qwen für Sprach- und Bildaufgaben sowie Wan für die Videogenerierung mit bis zu 1080p. Greifen Sie auf jedes Modell im Pay-as-you-go-Verfahren ohne Abonnements zu. Die Alibaba API ist über eine einzige Base-URL mit Ihrem bestehenden OpenAI-kompatiblen Client verfügbar.

Familie Anzeigen

OpenAI

Atlas Cloud bietet Ihnen Zugriff auf das gesamte Lineup der OpenAI API, von GPT Image 2 für die Bildgenerierung bis hin zu Sora 2 für Videos. Jedes Modell ist als Pay-as-you-go-Service ohne monatliche Verpflichtung verfügbar. Die Integration erfolgt durch den einfachen Austausch einer einzigen Basis-URL über die OpenAI-kompatible API.

Familie Anzeigen

xAI

Erstellen Sie vollständige Bild- und Videopipelines unter Verwendung der xAI API auf Atlas Cloud. Generieren Sie in 2K, bearbeiten Sie mit Referenzbildern und animieren Sie Bilder zu audiosynchronen Clips.

Familie Anzeigen

Kwaivgi

Die Kwaivgi API 15 % unter dem Standardpreis. Atlas Cloud bietet Day-0-Zugriff auf neue Kling-Releases mit nutzungsbasierter Preisgestaltung (Pay-as-you-go) und ohne Platzbeschränkungen. Ein Konto, ein Schlüssel, jedes Kling-Modell von der Standard- bis zur Master-Stufe.

Familie Anzeigen

Seedream 5.0 Pro

Die Seedream 5.0 Pro API bietet Entwicklern das steuerbare Bildbearbeitungsmodell von ByteDance auf Atlas Cloud. Sie platziert Bearbeitungen präzise mit Ankern und Koordinaten, trennt Bilder in bearbeitbare Ebenen, verschmilzt mehrere Referenzen und passt exakte Farben und Materialien an, mit mehrsprachigem Text in 2K und 3K. Auf Atlas Cloud erreichen Sie es über einen einzigen Schlüssel!

Familie Anzeigen