ShengShu Models on AtlasCloud | Vidu

Créez des pipelines de production vidéo sur la Shengshu API : Vidu Q3 génère des clips cinématographiques de 16 secondes avec audio natif et coupes de caméra intelligentes à partir d'un seul appel.

AI Video Models by ShengShu

Générez des vidéos cinématographiques en haute fidélité à partir de texte et d'images grâce aux derniers modèles d'IA de génération vidéo sur Atlas Cloud.

Voir tous les modèles

image-vers-vidéo

texte-vers-vidéo

LLM

Vidu

L'API Vidu donne aux développeurs accès aux modèles vidéo de Shengshu AI et de l'Université Tsinghua, basés sur l'architecture U-ViT qui unifie la conception Diffusion et Transformer. Insérez une à quatre images de référence et Vidu maintient la cohérence des sujets sur tous les plans, avec commutation intelligente de caméra et mouvement fluide et cinématique. Atlas Cloud ajoute un accès immédiat aux modèles et une clé compatible OpenAI pour toute la gamme. Commencez à construire dès aujourd'hui.

25 modèlesExplorer Vidu

ShengShu Models API Pricing Details

Compare standard vs. our pricing across every ShengShu model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Vidu Q3-Mix Reference to Video	$0.125	Start from$0.106/s video	-15%	View
Vidu Q3 Reference to Video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Pro Start-end-to-video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Turbo Image-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Start-end-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Text-to-video	$0.04	Start from$0.034/s video	-15%	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Cas d'utilisation de l'API ShengShu que vous pouvez développer sur Atlas Cloud

Les clips de 16 secondes, l'audio natif et la cohérence multi-références de Vidu Q3 le rendent pratique pour des flux de travail qui nécessitaient auparavant une équipe de production. Les équipes utilisent les différents niveaux de Q3 pour passer d'une itération rapide à des ressources finales sans changer de fournisseur.

Série Animée avec des Personnages Cohérents

Les studios et les créateurs indépendants utilisent Vidu Q3-Mix pour générer du contenu animé à épisodes multiples où les personnages sont identiques dans chaque scène. En téléchargeant des feuilles de référence des personnages, chaque nouveau clip hérite des mêmes traits du visage, des mêmes costumes et du même style visuel sans travail manuel de cohérence image par image. Shengshu a présenté ce flux de travail au SXSW 2026 comme la première solution d'AI pour la production de séries animées.

Contenu d'avatars de marque et de mascottes à grande échelle

Les équipes marketing téléchargent une seule fois les images de référence d'un personnage de la marque et utilisent Vidu Q3 Reference-to-Video pour générer des dizaines de clips courts pour TikTok, Reels et YouTube Shorts. Le personnage reste visuellement identique dans chaque résultat, ce qui élimine le goulot d'étranglement de conception lié à l'élaboration de briefs et à l'approbation individuelle de chaque ressource. À 0,042 $ par seconde sur Atlas Cloud, un lot complet de clips de 10 secondes coûte moins d'un dollar chacun.

Vidéo de marketing produit multi-angles

Les équipes de commerce électronique fournissent des photos de produits sous plusieurs angles comme entrées de référence et génèrent des clips marketing cinématographiques qui montrent le produit en mouvement avec un son ambiant natif. Le résultat arrive avec un son synchronisé lors du même appel, prêt pour les publicités et les pages de produits sans tournage vidéo ni montage audio. Le contrôle des images de début et de fin permet aux équipes de diriger précisément la manière dont le produit est révélé dans chaque clip.

Génération Dirigée de Scènes pour la Préproduction Cinématographique

Les réalisateurs utilisent le contrôle de la caméra de Vidu Q3-Pro pour générer des clips de pré-visualisation avec des mouvements spécifiques : travellings avant sur un sujet, panoramiques sur un décor, plans de suivi d'un personnage. La sortie native de 16 secondes signifie qu'une scène courte complète peut être pré-visualisée en un seul appel. Cela remplace le travail de storyboard de la phase initiale par du matériel de référence avec une précision des mouvements pour les acteurs et l'équipe technique.

Pipeline de contenu social à haut volume

Les équipes de développement utilisent Vidu Q3-Turbo pour exécuter des pipelines de génération par lots à 0,034 $ par seconde, produisant des dizaines de courts clips à partir d'entrées de texte ou d'images par heure. Le coût par seconde plus bas permet de générer et de tester de nombreuses variantes créatives de manière pratique avant de sélectionner celles à mettre à l'échelle avec Q3-Pro. Les deux modèles s'exécutent sous la même clé API Atlas Cloud avec un seul changement de paramètre entre les niveaux.

Tourisme Culturel et Contenu de Destination

Les offices de tourisme et les plateformes de voyage utilisent la génération de texte en vidéo de Vidu Q3-Pro pour créer des clips de destinations atmosphériques avec un son ambiant naturel à partir d'invites textuelles descriptives. Une description écrite d'un paysage, d'un point de repère ou d'un cadre culturel produit un clip cinématographique de 16 secondes avec l'audio correspondant en un seul appel. Cela constitue une alternative rentable aux tournages sur site pour le contenu qui stimule l'intention de réservation.

Concrétisez la vision de votre entreprise avec Atlas Cloud AI.

Contacter les ventes

Foire aux questions sur les modèles ShengShu

Vidu Q3 génère jusqu'à 16 secondes de vidéo continue en un seul appel d'API en 1080p et 24fps. Il s'agit de la plus longue fenêtre de génération en une seule passe parmi les principaux modèles vidéo de sa catégorie. La durée du clip est configurable par appel dans la limite de ce maximum.

Oui. Vidu Q3 produit des dialogues, des effets sonores, une musique de fond et une synchronisation labiale simultanément avec les images vidéo en un seul passage d'inférence. Il n'y a pas d'étape de doublage en post-production ni d'alignement audio manuel. La synchronisation de l'audio et de l'action à l'écran est automatique.

Vous décrivez le mouvement de la caméra directement dans le prompt textuel — zooms avant (push-ins), panoramiques (pans), travellings (tracking shots) — et le modèle les exécute dès la première image. Aucun paramètre ou couche de contrôle séparé n'est requis. Cela s'applique aux endpoints text-to-video et image-to-video sur Atlas Cloud.

Vidu Q3-Pro offre un rendu de qualité cinématographique avec des mouvements fluides et des détails riches, au tarif de 0,042 $ par seconde sur Atlas Cloud. Vidu Q3-Turbo génère à une vitesse supérieure avec un coût par seconde réduit de 0,034 $, idéal pour les brouillons et les itérations rapides. Les deux modèles partagent la même résolution de sortie de 1080p et la prise en charge de l'audio natif.

Le point de terminaison Reference-to-Video de Vidu Q3 accepte entre 1 et 4 images de référence par appel. Vous pouvez combiner des sujets, des environnements, des costumes et des styles visuels de différentes images en une seule génération. C'est le principal moyen de maintenir la cohérence des personnages et des scènes à travers plusieurs clips.

Vidu Q3-Mix est le modèle de référence de plus haut niveau de la gamme Vidu Q3, au prix de 0,106 $ par seconde sur Atlas Cloud. Il offre la plus forte cohérence multi-sujets lors de la combinaison de plusieurs images de référence en une seule génération. Il est conçu pour des flux de travail tels que la production de séries animées et le contenu de marque, où l'identité des personnages doit rester visuellement identique à travers de nombreux clips.

Oui. Vidu Q3-Pro et Q3-Turbo disposent tous deux d'un endpoint Start-end-to-video sur Atlas Cloud. Vous fournissez une image de trame initiale et décrivez le mouvement souhaité ou l'état final, et le modèle génère la transition. Cela offre un contrôle de direction précis sur la façon dont chaque scène s'ouvre et se ferme.

Vidu Q3-Turbo commence à 0,034 $ par seconde. Vidu Q3-Pro et le point de terminaison (endpoint) Reference-to-Video sont à 0,042 $ par seconde. Vidu Q3-Mix, le modèle de référence offrant la plus grande cohérence, est à 0,106 $ par seconde. Tous les niveaux sont proposés à un prix inférieur de 15 % aux tarifs standard de l'API Shengshu et sont disponibles selon une tarification à l'usage (pay-as-you-go).

Explorer Plus de Familles

Seedance 2.0

L'API Seedance 2.0 vous donne un accès en production au modèle vidéo multimodal de ByteDance — des entrées quadrimodales (texte, image, vidéo, audio) et un système « Universal Reference » leader du secteur qui verrouille la composition, les mouvements de caméra et les actions des personnages à travers les plans. Intégrez un contrôle de niveau réalisateur avec un seul appel d'API, un tarif fixe de 0,09 $/s, une clé instantanée et aucune liste d'attente — le tout soutenu par une disponibilité et une conformité de niveau entreprise. Seedance 2.0 Native 4K est désormais disponible !

Voir la Famille

Grok Imagine

La Grok Imagine API offre aux développeurs la génération d'images, de vidéos et d'audio de xAI dans une seule suite. Elle produit des images jusqu'à 2K avec un rendu de texte multilingue, ainsi que des vidéos allant jusqu'à 15 secondes avec un audio natif synchronisé et une édition basée sur des références. Sur Atlas Cloud, une seule clé exécute chaque mode Grok Imagine, ce qui vous permet de passer d'une image, d'une vidéo et d'un audio à l'autre sans configuration distincte, à partir de 0,02 $ par image et 0,05 $ par seconde.

Voir la Famille

Gemini Omni Flash

La Gemini Omni API apporte à votre stack le modèle multimodal de génération et d'édition vidéo de Google DeepMind, présenté à Google I/O 2026. Gemini Omni fusionne le moteur de raisonnement de Gemini avec les médias génératifs : il accepte n'importe quelle combinaison de texte, d'images, de vidéo et d'audio pour produire des résultats cohérents et ancrés dans la connaissance. Affinez vos résultats par simple conversation — remplacez des objets, réécrivez des scènes, changez de style — tandis que la physique, les personnages et la continuité restent intacts. Atlas Cloud propose toute la gamme Gemini Omni Flash — texte vers vidéo, image vers vidéo avec jusqu'à 7 images de référence, et référence vers vidéo — via une API unifiée, avec une tarification transparente à la seconde à partir de $0.112 et sans abonnement. Commencez à développer dès aujourd'hui.

Voir la Famille

GPT Image 2

L'API GPT Image 2 offre aux développeurs un accès au dernier modèle d'image d'OpenAI, le successeur de GPT Image 1.5. Elle génère et modifie des images avec un rendu de texte précis pour les caractères latins et CJK, ainsi qu'une composition solide pour les affiches, les maquettes et les infographies. Sur Atlas Cloud, vous y accédez via une API unifiée aux côtés de plus de 300 modèles, avec des crédits gratuits, une disponibilité de 99,99 % et sans aucune vérification d'organisation OpenAI requise.

Voir la Famille

Google

Les modèles créatifs les plus puissants de Google sont tous disponibles sur Atlas Cloud. Veo 3.1 offre une génération de vidéos cinématographiques, Nano Banana 2 permet de créer des images haute fidélité, et Gemini apporte une intelligence multimodale à chaque flux de travail. Accédez à la suite complète de modèles Google via une seule API key avec une disponibilité Day-0 et une tarification à l'usage (pay-as-you-go).

Voir la Famille

Seedance 2.0 Mini

Seedance 2.0 Mini apporte la génération de vidéos multimodale de ByteDance aux flux de travail où la vitesse et les coûts sont primordiaux. Il offre les capacités de base de Seedance 2.0 avec une empreinte plus légère — une génération plus rapide, un coût par vidéo réduit et la même intégration API que celle que vous utilisez déjà. Pour les équipes qui gèrent des pipelines à haut volume ou du prototypage à grande échelle, Mini est le choix par défaut pratique.

Voir la Famille

ByteDance

De la génération de vidéos cinématiques à la création d'images haute fidélité, les modèles les plus puissants de ByteDance sont disponibles sur Atlas Cloud. Exécutez Seedance et Seedream à grande échelle avec les prix d'inférence les plus bas et aucune surcharge d'infrastructure.

Voir la Famille

Alibaba

Atlas Cloud rassemble l'ensemble de la gamme de modèles d'Alibaba sous une seule API : Qwen pour les tâches linguistiques et d'imagerie, et Wan pour la génération de vidéos jusqu'en 1080p. Accédez à chaque modèle avec une tarification à l'usage (pay-as-you-go) sans abonnement. L'API Alibaba est disponible via une URL de base unique en utilisant votre client existant compatible avec OpenAI.

Voir la Famille

OpenAI

Atlas Cloud vous donne accès à l'ensemble de la gamme de l'API OpenAI, de GPT Image 2 pour la génération d'images à Sora 2 pour la vidéo. Chaque modèle est disponible en paiement à l'usage sans engagement mensuel. Intégrez-le en remplaçant simplement l'URL de base à l'aide de l'API compatible OpenAI.

Voir la Famille

xAI

Créez des pipelines complets d'images et de vidéos en utilisant la xAI API sur Atlas Cloud. Générez en 2K, éditez avec des images de référence et animez des images en clips synchronisés avec l'audio.

Voir la Famille

Kwaivgi

L'API Kwaivgi à 15 % en dessous du tarif standard. Atlas Cloud offre un accès Day-0 aux nouvelles versions de Kling avec une tarification à l'usage et sans limite de postes. Un seul compte, une seule clé, tous les modèles Kling du niveau standard au niveau master.

Voir la Famille

Seedream 5.0 Pro

L'API Seedream 5.0 Pro offre aux développeurs le modèle d'édition d'images contrôlable de ByteDance sur Atlas Cloud. Elle positionne les modifications avec précision à l'aide d'ancrages et de coordonnées, sépare les images en calques modifiables, fusionne de multiples références et fait correspondre les couleurs et matériaux exacts, avec du texte multilingue en 2K et 3K. Sur Atlas Cloud, vous y accédez via une seule clé !

Voir la Famille