
Bauen Sie Videoproduktions-Pipelines auf der Shengshu API auf: Vidu Q3 generiert mit einem einzigen Aufruf 16-sekündige filmische Clips mit nativem Audio und intelligenten Kameraschnitten.
Erzeugen Sie mit den neuesten KI-Modellen zur Videogenerierung auf Atlas Cloud kinoreife, hochdetaillierte Videos aus Text und Bildern.
Compare standard vs. our pricing across every ShengShu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Vidu Q3-Mix Reference to Video | $0.125 | Start from$0.106/s video | -15% | View |
| Vidu Q3 Reference to Video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Pro Start-end-to-video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Turbo Image-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Start-end-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Text-to-video | $0.04 | Start from$0.034/s video | -15% | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Die 16-Sekunden-Clips, natives Audio und die Multi-Referenz-Konsistenz von Vidu Q3 machen es praktisch für Workflows, die zuvor ein Produktionsteam erforderten. Teams nutzen die verschiedenen Q3-Stufen, um von schnellen Iterationen zu fertigen Assets zu gelangen, ohne den Anbieter wechseln zu müssen.
Studios und Indie-Ersteller nutzen Vidu Q3-Mix, um animierte Inhalte mit mehreren Episoden zu generieren, bei denen die Charaktere in jeder Szene identisch aussehen. Durch das Hochladen von Charakter-Referenzbögen erbt jeder neue Clip die gleichen Gesichtszüge, Kostüme und den gleichen visuellen Stil ohne manuelle Frame-für-Frame-Konsistenzarbeit. Shengshu demonstrierte diesen Workflow auf der SXSW 2026 als erste AI-Lösung für die Produktion von Animationsserien.
Marketingteams laden die Referenzbilder eines Markencharakters einmalig hoch und nutzen Vidu Q3 Reference-to-Video, um Dutzende von Kurzclips für TikTok, Reels und YouTube Shorts zu generieren. Der Charakter bleibt in jedem Ergebnis visuell identisch, wodurch der Design-Engpass bei der individuellen Einweisung und Freigabe jedes einzelnen Assets beseitigt wird. Bei 0,042 $ pro Sekunde auf Atlas Cloud kostet eine komplette Charge von 10-Sekunden-Clips jeweils weniger als einen Dollar.
E-Commerce-Teams liefern Produktfotos aus verschiedenen Blickwinkeln als Referenzeingaben und generieren kinoreife Marketing-Clips, die das Produkt in Bewegung mit nativem Umgebungs-Audio zeigen. Die Ausgabe erfolgt mit synchronisiertem Ton im selben Aufruf, bereit für Anzeigen und Produktseiten ohne Videodreh oder Audiobearbeitung. Die Start-End-Frame-Steuerung ermöglicht es Teams, präzise zu steuern, wie das Produkt in jedem Clip enthüllt wird.
Regisseure nutzen die Kamerasteuerung von Vidu Q3-Pro, um Pre-Visualisierungs-Clips mit festgelegten Bewegungen zu generieren — Push-ins auf ein Motiv, Schwenks über ein Set, Kamerafahrten, die einem Charakter folgen. Die native 16-Sekunden-Ausgabe bedeutet, dass eine komplette kurze Szene in einem Aufruf vorab visualisiert werden kann. Dies ersetzt die frühe Storyboard-Arbeit durch bewegungsgenaues Referenzmaterial für Besetzung und Crew.
Entwicklungsteams verwenden Vidu Q3-Turbo, um Batch-Generierungspipelines für 0,034 $ pro Sekunde auszuführen und so stündlich Dutzende von Kurzclips aus Text- oder Bildeingaben zu erstellen. Die geringeren Kosten pro Sekunde machen es praktikabel, viele kreative Varianten zu generieren und zu testen, bevor ausgewählt wird, welche mit Q3-Pro skaliert werden sollen. Beide Modelle laufen unter demselben Atlas Cloud API-Schlüssel mit einer einzigen Parameteränderung zwischen den Stufen.
Tourismusverbände und Reiseplattformen nutzen die Text-zu-Video-Generierung von Vidu Q3-Pro, um aus deskriptiven Text-Prompts stimmungsvolle Reiseziel-Clips mit natürlichem Umgebungsklang zu erstellen. Eine schriftliche Szenenbeschreibung einer Landschaft, eines Wahrzeichens oder eines kulturellen Schauplatzes erzeugt in einem einzigen Aufruf einen 16-sekündigen kinoreifen Clip mit passendem Audio. Dies bietet eine kostengünstige Alternative zu Dreharbeiten vor Ort für Inhalte, die die Buchungsabsicht fördern.
Vidu Q3 generiert in einem einzigen API-Aufruf bis zu 16 Sekunden kontinuierliches Video in 1080p und 24fps. Dies ist das längste Single-Pass-Generierungsfenster unter den führenden Videomodellen seiner Klasse. Die Clip-Dauer ist pro Aufruf innerhalb dieses Maximums konfigurierbar.
Ja. Vidu Q3 erzeugt Dialoge, Soundeffekte, Hintergrundmusik und Lippensynchronisation gleichzeitig mit den Videoframes in einem einzigen Inferenzdurchlauf. Es gibt keinen Schritt für die Postproduktions-Synchronisation oder eine manuelle Audioausrichtung. Audiotiming und Bildschirmaktion werden automatisch synchronisiert.
Sie beschreiben Kamerabewegungen direkt im Text-Prompt – Push-ins, Schwenks (Pans), Tracking-Shots – und das Modell führt diese ab dem ersten Frame aus. Es ist kein separater Parameter oder eine separate Steuerungsebene erforderlich. Dies gilt sowohl für Text-to-Video- als auch für Image-to-Video-Endpoints auf Atlas Cloud.
Vidu Q3-Pro liefert filmreife Ausgaben mit flüssigen Bewegungen und reichhaltigen Details zum Preis von 0,042 $ pro Sekunde in der Atlas Cloud. Vidu Q3-Turbo generiert mit höherer Geschwindigkeit und einem geringeren Preis von 0,034 $ pro Sekunde, ideal für Entwürfe und schnelle Iterationen. Beide teilen sich dieselbe 1080p-Ausgabeauflösung und native Audiounterstützung.
Der Reference-to-Video-Endpunkt von Vidu Q3 akzeptiert zwischen 1 und 4 Referenzbilder pro Aufruf. Sie können Subjekte, Umgebungen, Kostüme und visuelle Stile aus verschiedenen Bildern in einer einzigen Generierung kombinieren. Dies ist die primäre Methode, um die Charakter- und Szenenkonsistenz über mehrere Clips hinweg aufrechtzuerhalten.
Vidu Q3-Mix ist das Referenzmodell der höchsten Stufe in der Vidu Q3-Reihe und kostet 0,106 $ pro Sekunde in der Atlas Cloud. Es bietet die stärkste Multi-Subjekt-Konsistenz, wenn mehrere Referenzbilder in einer einzigen Generierung kombiniert werden. Es wurde für Workflows wie die Produktion von Animationsserien und Marken-Inhalten entwickelt, bei denen die Identität der Charaktere über viele Clips hinweg visuell identisch bleiben muss.
Ja. Sowohl Vidu Q3-Pro als auch Q3-Turbo verfügen über einen Start-end-to-video-Endpoint auf Atlas Cloud. Sie stellen ein Start-Frame-Bild zur Verfügung und beschreiben die gewünschte Bewegung oder den Endzustand, und das Modell generiert den Übergang. Dies ermöglicht eine präzise regieartige Kontrolle darüber, wie jede Szene beginnt und endet.
Vidu Q3-Turbo beginnt bei 0,034 $ pro Sekunde. Vidu Q3-Pro und der Reference-to-Video-Endpoint kosten 0,042 $ pro Sekunde. Vidu Q3-Mix, das Referenzmodell mit der höchsten Konsistenz, liegt bei 0,106 $ pro Sekunde. Alle Stufen werden 15 % unter den Standardraten der Shengshu API bepreist und sind im Pay-as-you-go-Verfahren verfügbar.
Join the Discord community for the latest model updates, prompts, and support.