ShengShu Models on AtlasCloud | Vidu

Construya flujos de trabajo de producción de video en la Shengshu API: mediante una sola llamada, Vidu Q3 genera clips cinematográficos de 16 segundos con audio nativo y cortes de cámara inteligentes.

AI Video Models by ShengShu

Genera vídeos cinematográficos de alta fidelidad a partir de texto e imágenes con los modelos de IA de generación de vídeo más recientes en Atlas Cloud.

Ver todos los modelos

Imagen a Video

Texto a Video

LLM

Vidu

La API de Vidu proporciona a los desarrolladores acceso a modelos de video de Shengshu AI y la Universidad de Tsinghua, construida en la arquitectura U-ViT que unifica el diseño de Diffusion y Transformer. Introduce de una a cuatro imágenes de referencia y Vidu mantiene la consistencia de los sujetos en todas las tomas, con cambio inteligente de cámara y movimiento suave y cinematográfico. Atlas Cloud añade acceso a modelos Day-0 y una clave compatible con OpenAI para toda la alineación. Comienza a construir hoy.

25 modelosExplorar Vidu

ShengShu Models API Pricing Details

Compare standard vs. our pricing across every ShengShu model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Vidu Q3-Mix Reference to Video	$0.125	Start from$0.106/s video	-15%	View
Vidu Q3 Reference to Video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Pro Start-end-to-video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Turbo Image-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Start-end-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Text-to-video	$0.04	Start from$0.034/s video	-15%	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Casos de uso de la API de ShengShu que puede desarrollar en Atlas Cloud

Los clips de 16 segundos, el audio nativo y la coherencia multirreferencia de Vidu Q3 lo hacen práctico para flujos de trabajo que antes requerían un equipo de producción. Los equipos utilizan los diferentes niveles de Q3 para pasar de la iteración rápida a los activos finales sin cambiar de proveedor.

Serie Animada con Personajes Consistentes

Los estudios y los creadores independientes utilizan Vidu Q3-Mix para generar contenido animado de múltiples episodios donde los personajes lucen idénticos en cada escena. Al cargar hojas de referencia de personajes, cada nuevo clip hereda los mismos rasgos faciales, vestuario y estilo visual sin necesidad de trabajo manual de consistencia cuadro por cuadro. Shengshu demostró este flujo de trabajo en SXSW 2026 como la primera solución de AI para la producción de series animadas.

Contenido de avatares de marca y mascotas a gran escala

Los equipos de marketing suben las imágenes de referencia de un personaje de la marca una sola vez y utilizan Vidu Q3 Reference-to-Video para generar docenas de clips cortos para TikTok, Reels y YouTube Shorts. El personaje se mantiene visualmente idéntico en cada resultado, eliminando el cuello de botella de diseño que supone instruir y aprobar cada recurso individualmente. A 0,042 $ por segundo en Atlas Cloud, un lote completo de clips de 10 segundos cuesta menos de un dólar cada uno.

Video de marketing de producto multiángulo

Los equipos de comercio electrónico proporcionan fotos de productos desde múltiples ángulos como entradas de referencia y generan clips de marketing cinematográficos que muestran el producto en movimiento con audio ambiental nativo. El resultado llega con sonido sincronizado en la misma llamada, listo para anuncios y páginas de productos sin necesidad de grabación de video ni edición de audio. El control de fotogramas de inicio y fin permite a los equipos dirigir con precisión cómo se revela el producto en cada clip.

Generación Dirigida de Escenas para la Preproducción Cinematográfica

Los directores utilizan el control de cámara de Vidu Q3-Pro para generar clips de previsualización con movimientos especificados: acercamientos a un sujeto, paneos a través de un set y tomas de seguimiento de un personaje. La salida nativa de 16 segundos significa que se puede previsualizar una escena corta completa en una sola llamada. Esto reemplaza el trabajo inicial de guion gráfico con material de referencia de movimiento preciso para el elenco y el equipo.

Pipeline de contenido social de alto volumen

Los equipos de desarrollo utilizan Vidu Q3-Turbo para ejecutar canales de generación por lotes a 0,034 $ por segundo, produciendo decenas de clips cortos a partir de entradas de texto o imagen por hora. El menor costo por segundo hace que sea práctico generar y probar muchas variantes creativas antes de seleccionar cuáles escalar con Q3-Pro. Ambos modelos se ejecutan bajo la misma clave de API de Atlas Cloud con un solo cambio de parámetro entre niveles.

Turismo Cultural y Contenido de Destino

Las oficinas de turismo y las plataformas de viajes utilizan la generación de texto a video de Vidu Q3-Pro para crear clips de destinos atmosféricos con sonido ambiente natural a partir de indicaciones de texto descriptivas. Una descripción escrita de un paisaje, un lugar emblemático o un entorno cultural produce un clip cinematográfico de 16 segundos con audio a juego en una sola llamada. Esto proporciona una alternativa rentable a los rodajes en exteriores para el contenido que impulsa la intención de reserva.

Haz realidad la visión de tu empresa con Atlas Cloud AI.

Contactar con ventas

Preguntas frecuentes sobre los modelos ShengShu

Vidu Q3 genera hasta 16 segundos de video continuo en una sola llamada a la API a 1080p y 24fps. Esta es la ventana de generación de un solo paso más larga entre los modelos de video líderes en su categoría. La duración del clip es configurable por llamada dentro de ese límite máximo.

Sí. Vidu Q3 produce diálogos, efectos de sonido, música de fondo y sincronización labial simultáneamente con los fotogramas de video en un solo paso de inferencia. No hay paso de doblaje de posproducción ni de alineación manual de audio. La sincronización del audio y la acción en pantalla se realiza automáticamente.

Puede describir el movimiento de la cámara directamente en el prompt de texto —acercamientos (push-ins), panorámicas (pans), tomas de seguimiento (tracking shots)— y el modelo los ejecutará desde el primer fotograma. No se requiere ningún parámetro ni capa de control adicional. Esto se aplica a los endpoints de text-to-video e image-to-video en Atlas Cloud.

Vidu Q3-Pro ofrece resultados de calidad cinematográfica con movimiento fluido y gran nivel de detalle, a un precio de 0,042 $ por segundo en Atlas Cloud. Vidu Q3-Turbo genera a mayor velocidad con un coste por segundo inferior de 0,034 $, ideal para borradores e iteración rápida. Ambos comparten la misma resolución de salida de 1080p y soporte de audio nativo.

El endpoint Reference-to-Video de Vidu Q3 acepta entre 1 y 4 imágenes de referencia por llamada. Puede combinar sujetos, entornos, vestuarios y estilos visuales de diferentes imágenes en una sola generación. Esta es la forma principal de mantener la consistencia de personajes y escenas a través de múltiples clips.

Vidu Q3-Mix es el modelo de referencia de nivel más alto en la línea Vidu Q3, con un precio de 0,106 $ por segundo en Atlas Cloud. Ofrece la mayor coherencia de múltiples sujetos al combinar varias imágenes de referencia en una sola generación. Está diseñado para flujos de trabajo como la producción de series animadas y contenido de marca, donde la identidad del personaje debe permanecer visualmente idéntica en muchos clips.

Sí. Tanto Vidu Q3-Pro como Q3-Turbo cuentan con un endpoint Start-end-to-video en Atlas Cloud. Usted proporciona una imagen de fotograma inicial y describe el movimiento deseado o el estado final, y el modelo genera la transición. Esto ofrece un control de dirección preciso sobre cómo se abre y se cierra cada escena.

Vidu Q3-Turbo comienza en $0.034 por segundo. Vidu Q3-Pro y el endpoint Reference-to-Video cuestan $0.042 por segundo. Vidu Q3-Mix, el modelo de referencia de mayor consistencia, cuesta $0.106 por segundo. Todos los niveles tienen un precio de un 15% por debajo de las tarifas estándar de la API de Shengshu y están disponibles con el modelo de pago por uso (pay-as-you-go).

Explorar Más Series

Seedance 2.0

La API de Seedance 2.0 le ofrece acceso de producción al modelo de video multimodal de ByteDance: entradas cuatrimodales (texto, imagen, video, audio) y un sistema "Universal Reference" líder en la industria que bloquea la composición, el movimiento de la cámara y las acciones de los personajes en diferentes tomas. Integre un control de nivel de director con una sola llamada a la API, una tarifa fija de $0.09/s, clave instantánea y sin lista de espera, todo respaldado por un tiempo de actividad y cumplimiento de nivel empresarial. ¡Seedance 2.0 Native 4K ya está disponible!

Ver Serie

Grok Imagine

La Grok Imagine API ofrece a los desarrolladores la generación de imágenes, video y audio de xAI en una sola suite. Produce imágenes de hasta 2K con renderizado de texto multilingüe, además de videos de hasta 15 segundos con audio nativo y sincronizado, y edición basada en referencias. En Atlas Cloud, una sola clave ejecuta cada modo de Grok Imagine, por lo que puede alternar entre imagen, video y audio sin configuraciones separadas, desde $0.02 por imagen y $0.05 por segundo.

Ver Serie

Gemini Omni Flash

La Gemini Omni API lleva a tu stack el modelo multimodal de generación y edición de vídeo de Google DeepMind, presentado en Google I/O 2026. Gemini Omni fusiona el motor de razonamiento de Gemini con los medios generativos y acepta cualquier combinación de texto, imágenes, vídeo y audio para producir resultados coherentes y fundamentados en conocimiento. Refina los resultados mediante conversación natural: sustituye objetos, reescribe escenas y cambia de estilo mientras la física, los personajes y la continuidad permanecen intactos. Atlas Cloud ofrece toda la gama Gemini Omni Flash —texto a vídeo, imagen a vídeo con hasta 7 imágenes de referencia y referencia a vídeo— a través de una única API unificada, con precios transparentes por segundo desde $0.112 y sin suscripción. Empieza a construir hoy mismo.

Ver Serie

GPT Image 2

La API de GPT Image 2 ofrece a los desarrolladores acceso al último modelo de imágenes de OpenAI, el sucesor de GPT Image 1.5. Genera y edita imágenes con una representación de texto precisa en caracteres latinos y CJK, además de una sólida composición para carteles, maquetas e infografías. En Atlas Cloud, puede acceder a ella a través de una API unificada junto con más de 300 modelos, con créditos gratuitos, un tiempo de actividad del 99,99% y sin necesidad de verificación de organización de OpenAI.

Ver Serie

Google

Los modelos creativos más potentes de Google están todos disponibles en Atlas Cloud. Veo 3.1 ofrece generación de video cinematográfico, Nano Banana 2 impulsa la creación de imágenes de alta fidelidad y Gemini aporta inteligencia multimodal a cada flujo de trabajo. Acceda a la suite completa de modelos de Google a través de una sola API key con disponibilidad Day-0 y precios de pago por uso (pay-as-you-go).

Ver Serie

Seedance 2.0 Mini

Seedance 2.0 Mini lleva la generación de video multimodal de ByteDance a los flujos de trabajo donde la velocidad y el costo son más importantes. Ofrece las capacidades principales de Seedance 2.0 con un menor consumo de recursos: generación más rápida, menor costo por video y la misma integración de API que ya utiliza. Para los equipos que ejecutan pipelines de alto volumen o crean prototipos a escala, Mini es la opción predeterminada práctica.

Ver Serie

ByteDance

Desde la generación de video cinematográfico hasta la creación de imágenes de alta fidelidad, los modelos más potentes de ByteDance están disponibles en Atlas Cloud. Ejecute Seedance y Seedream a gran escala con los precios de inferencia más bajos y cero gastos generales de infraestructura.

Ver Serie

Alibaba

Atlas Cloud reúne toda la línea de modelos de Alibaba bajo una sola API: Qwen para tareas de lenguaje e imagen, y Wan para la generación de video hasta 1080p. Acceda a cada modelo con pago por uso sin suscripciones. La API de Alibaba está disponible a través de una única URL base utilizando su cliente compatible con OpenAI existente.

Ver Serie

OpenAI

Atlas Cloud le ofrece acceso a la línea completa de la API de OpenAI, desde GPT Image 2 para la generación de imágenes hasta Sora 2 para video. Cada modelo está disponible bajo la modalidad de pago por uso sin compromiso mensual. Intégrelo cambiando simplemente la URL base mediante la API compatible con OpenAI.

Ver Serie

xAI

Construya pipelines completos de imágenes y video utilizando la xAI API en Atlas Cloud. Genere en 2K, edite con imágenes de referencia y anime imágenes en clips sincronizados con audio.

Ver Serie

Kwaivgi

La API de Kwaivgi a un 15% por debajo del precio estándar. Atlas Cloud ofrece acceso Day-0 a los nuevos lanzamientos de Kling con precios de pago por uso y sin límites de puestos. Una cuenta, una clave, todos los modelos de Kling desde el nivel estándar hasta el nivel maestro.

Ver Serie

Seedream 5.0 Pro

La API de Seedream 5.0 Pro ofrece a los desarrolladores el modelo de edición de imágenes controlable de ByteDance en Atlas Cloud. Sitúa las ediciones con precisión mediante anclajes y coordenadas, separa las imágenes en capas editables, fusiona múltiples referencias y empareja colores y materiales exactos, con texto multilingüe a 2K y 3K. ¡En Atlas Cloud puede acceder a él mediante una sola clave!

Ver Serie