
Construya flujos de trabajo de producción de video en la Shengshu API: mediante una sola llamada, Vidu Q3 genera clips cinematográficos de 16 segundos con audio nativo y cortes de cámara inteligentes.
Genera vídeos cinematográficos de alta fidelidad a partir de texto e imágenes con los modelos de IA de generación de vídeo más recientes en Atlas Cloud.
Compare standard vs. our pricing across every ShengShu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Vidu Q3-Mix Reference to Video | $0.125 | Start from$0.106/s video | -15% | View |
| Vidu Q3 Reference to Video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Pro Start-end-to-video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Turbo Image-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Start-end-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Text-to-video | $0.04 | Start from$0.034/s video | -15% | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Los clips de 16 segundos, el audio nativo y la coherencia multirreferencia de Vidu Q3 lo hacen práctico para flujos de trabajo que antes requerían un equipo de producción. Los equipos utilizan los diferentes niveles de Q3 para pasar de la iteración rápida a los activos finales sin cambiar de proveedor.
Los estudios y los creadores independientes utilizan Vidu Q3-Mix para generar contenido animado de múltiples episodios donde los personajes lucen idénticos en cada escena. Al cargar hojas de referencia de personajes, cada nuevo clip hereda los mismos rasgos faciales, vestuario y estilo visual sin necesidad de trabajo manual de consistencia cuadro por cuadro. Shengshu demostró este flujo de trabajo en SXSW 2026 como la primera solución de AI para la producción de series animadas.
Los equipos de marketing suben las imágenes de referencia de un personaje de la marca una sola vez y utilizan Vidu Q3 Reference-to-Video para generar docenas de clips cortos para TikTok, Reels y YouTube Shorts. El personaje se mantiene visualmente idéntico en cada resultado, eliminando el cuello de botella de diseño que supone instruir y aprobar cada recurso individualmente. A 0,042 $ por segundo en Atlas Cloud, un lote completo de clips de 10 segundos cuesta menos de un dólar cada uno.
Los equipos de comercio electrónico proporcionan fotos de productos desde múltiples ángulos como entradas de referencia y generan clips de marketing cinematográficos que muestran el producto en movimiento con audio ambiental nativo. El resultado llega con sonido sincronizado en la misma llamada, listo para anuncios y páginas de productos sin necesidad de grabación de video ni edición de audio. El control de fotogramas de inicio y fin permite a los equipos dirigir con precisión cómo se revela el producto en cada clip.
Los directores utilizan el control de cámara de Vidu Q3-Pro para generar clips de previsualización con movimientos especificados: acercamientos a un sujeto, paneos a través de un set y tomas de seguimiento de un personaje. La salida nativa de 16 segundos significa que se puede previsualizar una escena corta completa en una sola llamada. Esto reemplaza el trabajo inicial de guion gráfico con material de referencia de movimiento preciso para el elenco y el equipo.
Los equipos de desarrollo utilizan Vidu Q3-Turbo para ejecutar canales de generación por lotes a 0,034 $ por segundo, produciendo decenas de clips cortos a partir de entradas de texto o imagen por hora. El menor costo por segundo hace que sea práctico generar y probar muchas variantes creativas antes de seleccionar cuáles escalar con Q3-Pro. Ambos modelos se ejecutan bajo la misma clave de API de Atlas Cloud con un solo cambio de parámetro entre niveles.
Las oficinas de turismo y las plataformas de viajes utilizan la generación de texto a video de Vidu Q3-Pro para crear clips de destinos atmosféricos con sonido ambiente natural a partir de indicaciones de texto descriptivas. Una descripción escrita de un paisaje, un lugar emblemático o un entorno cultural produce un clip cinematográfico de 16 segundos con audio a juego en una sola llamada. Esto proporciona una alternativa rentable a los rodajes en exteriores para el contenido que impulsa la intención de reserva.
Vidu Q3 genera hasta 16 segundos de video continuo en una sola llamada a la API a 1080p y 24fps. Esta es la ventana de generación de un solo paso más larga entre los modelos de video líderes en su categoría. La duración del clip es configurable por llamada dentro de ese límite máximo.
Sí. Vidu Q3 produce diálogos, efectos de sonido, música de fondo y sincronización labial simultáneamente con los fotogramas de video en un solo paso de inferencia. No hay paso de doblaje de posproducción ni de alineación manual de audio. La sincronización del audio y la acción en pantalla se realiza automáticamente.
Puede describir el movimiento de la cámara directamente en el prompt de texto —acercamientos (push-ins), panorámicas (pans), tomas de seguimiento (tracking shots)— y el modelo los ejecutará desde el primer fotograma. No se requiere ningún parámetro ni capa de control adicional. Esto se aplica a los endpoints de text-to-video e image-to-video en Atlas Cloud.
Vidu Q3-Pro ofrece resultados de calidad cinematográfica con movimiento fluido y gran nivel de detalle, a un precio de 0,042 $ por segundo en Atlas Cloud. Vidu Q3-Turbo genera a mayor velocidad con un coste por segundo inferior de 0,034 $, ideal para borradores e iteración rápida. Ambos comparten la misma resolución de salida de 1080p y soporte de audio nativo.
El endpoint Reference-to-Video de Vidu Q3 acepta entre 1 y 4 imágenes de referencia por llamada. Puede combinar sujetos, entornos, vestuarios y estilos visuales de diferentes imágenes en una sola generación. Esta es la forma principal de mantener la consistencia de personajes y escenas a través de múltiples clips.
Vidu Q3-Mix es el modelo de referencia de nivel más alto en la línea Vidu Q3, con un precio de 0,106 $ por segundo en Atlas Cloud. Ofrece la mayor coherencia de múltiples sujetos al combinar varias imágenes de referencia en una sola generación. Está diseñado para flujos de trabajo como la producción de series animadas y contenido de marca, donde la identidad del personaje debe permanecer visualmente idéntica en muchos clips.
Sí. Tanto Vidu Q3-Pro como Q3-Turbo cuentan con un endpoint Start-end-to-video en Atlas Cloud. Usted proporciona una imagen de fotograma inicial y describe el movimiento deseado o el estado final, y el modelo genera la transición. Esto ofrece un control de dirección preciso sobre cómo se abre y se cierra cada escena.
Vidu Q3-Turbo comienza en $0.034 por segundo. Vidu Q3-Pro y el endpoint Reference-to-Video cuestan $0.042 por segundo. Vidu Q3-Mix, el modelo de referencia de mayor consistencia, cuesta $0.106 por segundo. Todos los niveles tienen un precio de un 15% por debajo de las tarifas estándar de la API de Shengshu y están disponibles con el modelo de pago por uso (pay-as-you-go).
Join the Discord community for the latest model updates, prompts, and support.