
Créez des pipelines de production vidéo sur la Shengshu API : Vidu Q3 génère des clips cinématographiques de 16 secondes avec audio natif et coupes de caméra intelligentes à partir d'un seul appel.
Générez des vidéos cinématographiques en haute fidélité à partir de texte et d'images grâce aux derniers modèles d'IA de génération vidéo sur Atlas Cloud.
Compare standard vs. our pricing across every ShengShu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Vidu Q3-Mix Reference to Video | $0.125 | Start from$0.106/s video | -15% | View |
| Vidu Q3 Reference to Video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Pro Start-end-to-video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Turbo Image-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Start-end-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Text-to-video | $0.04 | Start from$0.034/s video | -15% | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Les clips de 16 secondes, l'audio natif et la cohérence multi-références de Vidu Q3 le rendent pratique pour des flux de travail qui nécessitaient auparavant une équipe de production. Les équipes utilisent les différents niveaux de Q3 pour passer d'une itération rapide à des ressources finales sans changer de fournisseur.
Les studios et les créateurs indépendants utilisent Vidu Q3-Mix pour générer du contenu animé à épisodes multiples où les personnages sont identiques dans chaque scène. En téléchargeant des feuilles de référence des personnages, chaque nouveau clip hérite des mêmes traits du visage, des mêmes costumes et du même style visuel sans travail manuel de cohérence image par image. Shengshu a présenté ce flux de travail au SXSW 2026 comme la première solution d'AI pour la production de séries animées.
Les équipes marketing téléchargent une seule fois les images de référence d'un personnage de la marque et utilisent Vidu Q3 Reference-to-Video pour générer des dizaines de clips courts pour TikTok, Reels et YouTube Shorts. Le personnage reste visuellement identique dans chaque résultat, ce qui élimine le goulot d'étranglement de conception lié à l'élaboration de briefs et à l'approbation individuelle de chaque ressource. À 0,042 $ par seconde sur Atlas Cloud, un lot complet de clips de 10 secondes coûte moins d'un dollar chacun.
Les équipes de commerce électronique fournissent des photos de produits sous plusieurs angles comme entrées de référence et génèrent des clips marketing cinématographiques qui montrent le produit en mouvement avec un son ambiant natif. Le résultat arrive avec un son synchronisé lors du même appel, prêt pour les publicités et les pages de produits sans tournage vidéo ni montage audio. Le contrôle des images de début et de fin permet aux équipes de diriger précisément la manière dont le produit est révélé dans chaque clip.
Les réalisateurs utilisent le contrôle de la caméra de Vidu Q3-Pro pour générer des clips de pré-visualisation avec des mouvements spécifiques : travellings avant sur un sujet, panoramiques sur un décor, plans de suivi d'un personnage. La sortie native de 16 secondes signifie qu'une scène courte complète peut être pré-visualisée en un seul appel. Cela remplace le travail de storyboard de la phase initiale par du matériel de référence avec une précision des mouvements pour les acteurs et l'équipe technique.
Les équipes de développement utilisent Vidu Q3-Turbo pour exécuter des pipelines de génération par lots à 0,034 $ par seconde, produisant des dizaines de courts clips à partir d'entrées de texte ou d'images par heure. Le coût par seconde plus bas permet de générer et de tester de nombreuses variantes créatives de manière pratique avant de sélectionner celles à mettre à l'échelle avec Q3-Pro. Les deux modèles s'exécutent sous la même clé API Atlas Cloud avec un seul changement de paramètre entre les niveaux.
Les offices de tourisme et les plateformes de voyage utilisent la génération de texte en vidéo de Vidu Q3-Pro pour créer des clips de destinations atmosphériques avec un son ambiant naturel à partir d'invites textuelles descriptives. Une description écrite d'un paysage, d'un point de repère ou d'un cadre culturel produit un clip cinématographique de 16 secondes avec l'audio correspondant en un seul appel. Cela constitue une alternative rentable aux tournages sur site pour le contenu qui stimule l'intention de réservation.
Vidu Q3 génère jusqu'à 16 secondes de vidéo continue en un seul appel d'API en 1080p et 24fps. Il s'agit de la plus longue fenêtre de génération en une seule passe parmi les principaux modèles vidéo de sa catégorie. La durée du clip est configurable par appel dans la limite de ce maximum.
Oui. Vidu Q3 produit des dialogues, des effets sonores, une musique de fond et une synchronisation labiale simultanément avec les images vidéo en un seul passage d'inférence. Il n'y a pas d'étape de doublage en post-production ni d'alignement audio manuel. La synchronisation de l'audio et de l'action à l'écran est automatique.
Vous décrivez le mouvement de la caméra directement dans le prompt textuel — zooms avant (push-ins), panoramiques (pans), travellings (tracking shots) — et le modèle les exécute dès la première image. Aucun paramètre ou couche de contrôle séparé n'est requis. Cela s'applique aux endpoints text-to-video et image-to-video sur Atlas Cloud.
Vidu Q3-Pro offre un rendu de qualité cinématographique avec des mouvements fluides et des détails riches, au tarif de 0,042 $ par seconde sur Atlas Cloud. Vidu Q3-Turbo génère à une vitesse supérieure avec un coût par seconde réduit de 0,034 $, idéal pour les brouillons et les itérations rapides. Les deux modèles partagent la même résolution de sortie de 1080p et la prise en charge de l'audio natif.
Le point de terminaison Reference-to-Video de Vidu Q3 accepte entre 1 et 4 images de référence par appel. Vous pouvez combiner des sujets, des environnements, des costumes et des styles visuels de différentes images en une seule génération. C'est le principal moyen de maintenir la cohérence des personnages et des scènes à travers plusieurs clips.
Vidu Q3-Mix est le modèle de référence de plus haut niveau de la gamme Vidu Q3, au prix de 0,106 $ par seconde sur Atlas Cloud. Il offre la plus forte cohérence multi-sujets lors de la combinaison de plusieurs images de référence en une seule génération. Il est conçu pour des flux de travail tels que la production de séries animées et le contenu de marque, où l'identité des personnages doit rester visuellement identique à travers de nombreux clips.
Oui. Vidu Q3-Pro et Q3-Turbo disposent tous deux d'un endpoint Start-end-to-video sur Atlas Cloud. Vous fournissez une image de trame initiale et décrivez le mouvement souhaité ou l'état final, et le modèle génère la transition. Cela offre un contrôle de direction précis sur la façon dont chaque scène s'ouvre et se ferme.
Vidu Q3-Turbo commence à 0,034 $ par seconde. Vidu Q3-Pro et le point de terminaison (endpoint) Reference-to-Video sont à 0,042 $ par seconde. Vidu Q3-Mix, le modèle de référence offrant la plus grande cohérence, est à 0,106 $ par seconde. Tous les niveaux sont proposés à un prix inférieur de 15 % aux tarifs standard de l'API Shengshu et sont disponibles selon une tarification à l'usage (pay-as-you-go).
Join the Discord community for the latest model updates, prompts, and support.