
Construa pipelines de produção de vídeo na Shengshu API: com uma única chamada, o Vidu Q3 gera clipes cinematográficos de 16 segundos com áudio nativo e cortes de câmera inteligentes.
Gere vídeos cinematográficos e de alta fidelidade a partir de texto e imagens com os mais recentes modelos de IA de geração de vídeo na Atlas Cloud.
Compare standard vs. our pricing across every ShengShu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Vidu Q3-Mix Reference to Video | $0.125 | Start from$0.106/s video | -15% | View |
| Vidu Q3 Reference to Video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Pro Start-end-to-video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Turbo Image-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Start-end-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Text-to-video | $0.04 | Start from$0.034/s video | -15% | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Os clipes de 16 segundos, o áudio nativo e a consistência multirreferência do Vidu Q3 tornam-no prático para fluxos de trabalho que anteriormente exigiam uma equipe de produção. As equipes usam os diferentes níveis do Q3 para passar da iteração rápida para os ativos finais sem mudar de provedor.
Estúdios e criadores independentes usam o Vidu Q3-Mix para gerar conteúdo animado de múltiplos episódios onde os personagens parecem idênticos em cada cena. Ao fazer o upload de planilhas de referência de personagens, cada novo clipe herda as mesmas características faciais, trajes e estilo visual sem trabalho manual de consistência quadro a quadro. A Shengshu demonstrou esse fluxo de trabalho no SXSW 2026 como a primeira solução de AI para a produção de séries animadas.
As equipes de marketing fazem o upload das imagens de referência de um personagem da marca uma vez e usam o Vidu Q3 Reference-to-Video para gerar dezenas de clipes curtos para o TikTok, Reels e YouTube Shorts. O personagem permanece visualmente idêntico em todos os resultados, eliminando o gargalo de design de instruir e aprovar cada ativo individualmente. A US$ 0,042 por segundo na Atlas Cloud, um lote completo de clipes de 10 segundos custa menos de um dólar cada.
As equipes de comércio eletrônico fornecem fotos de produtos de vários ângulos como entradas de referência e geram clipes de marketing cinematográficos que mostram o produto em movimento com áudio ambiente nativo. O resultado chega com som sincronizado na mesma chamada, pronto para anúncios e páginas de produtos sem a necessidade de gravação de vídeo ou edição de áudio. O controle de quadro inicial e final permite que as equipes direcionem com precisão como o produto é revelado em cada clipe.
Os diretores usam o controle de câmera do Vidu Q3-Pro para gerar clipes de pré-visualização com movimentos especificados — aproximações em um sujeito, panorâmicas em um cenário, planos de rastreamento seguindo um personagem. A saída nativa de 16 segundos significa que uma cena curta completa pode ser pré-visualizada em uma única chamada. Isso substitui o trabalho inicial de storyboard por material de referência com precisão de movimento para o elenco e a equipe.
As equipes de desenvolvimento usam o Vidu Q3-Turbo para executar pipelines de geração em lote a US$ 0,034 por segundo, produzindo dezenas de clipes curtos a partir de entradas de texto ou imagem por hora. O menor custo por segundo torna prático gerar e testar muitas variantes criativas antes de selecionar quais escalar com o Q3-Pro. Ambos os modelos funcionam sob a mesma chave de API do Atlas Cloud com uma única alteração de parâmetro entre as camadas.
Os conselhos de turismo e as plataformas de viagens utilizam a geração de texto para vídeo do Vidu Q3-Pro para criar clipes de destinos atmosféricos com som ambiente natural a partir de prompts de texto descritivos. Uma descrição de cena por escrito de uma paisagem, marco ou cenário cultural produz um clipe cinematográfico de 16 segundos com áudio correspondente em uma única chamada. Isso oferece uma alternativa econômica às filmagens em locação para conteúdos que impulsionam a intenção de reserva.
O Vidu Q3 gera até 16 segundos de vídeo contínuo em uma única chamada de API a 1080p e 24fps. Esta é a janela de geração de passagem única mais longa entre os principais modelos de vídeo em sua categoria. A duração do clipe é configurável por chamada dentro desse limite máximo.
Sim. O Vidu Q3 produz diálogos, efeitos sonoros, música de fundo e sincronia labial simultaneamente com os quadros de vídeo em uma única passagem de inferência. Não há dublagem de pós-produção ou etapa de alinhamento manual de áudio. O tempo do áudio e a ação na tela são sincronizados automaticamente.
Você descreve o movimento da câmera diretamente no prompt de texto — push-ins, panorâmicas (pans), tracking shots — e o modelo os executa a partir do primeiro quadro. Não é necessário nenhum parâmetro ou camada de controle separada. Isso se aplica aos endpoints de text-to-video e image-to-video no Atlas Cloud.
O Vidu Q3-Pro entrega resultados com qualidade de cinema, movimentos suaves e riqueza de detalhes, ao custo de US$ 0,042 por segundo na Atlas Cloud. O Vidu Q3-Turbo realiza gerações em maior velocidade com um custo menor de US$ 0,034 por segundo, ideal para rascunhos e iteração rápida. Ambos compartilham a mesma resolução de saída de 1080p e suporte de áudio nativo.
O endpoint Reference-to-Video do Vidu Q3 aceita entre 1 e 4 imagens de referência por chamada. Você pode combinar sujeitos, ambientes, trajes e estilos visuais de imagens diferentes em uma única geração. Esta é a principal maneira de manter a consistência de personagens e cenas em vários clipes.
O Vidu Q3-Mix é o modelo de referência de nível mais alto da linha Vidu Q3, com o preço de US$ 0,106 por segundo na Atlas Cloud. Ele oferece a mais forte consistência de vários sujeitos ao combinar várias imagens de referência em uma única geração. Foi desenvolvido para fluxos de trabalho como a produção de séries animadas e conteúdo de marca, onde a identidade da personagem deve permanecer visualmente idêntica em vários clipes.
Sim. Tanto o Vidu Q3-Pro quanto o Q3-Turbo possuem um endpoint Start-end-to-video no Atlas Cloud. Você fornece uma imagem de quadro inicial e descreve o movimento desejado ou o estado final, e o modelo gera a transição. Isso oferece um controle de direção preciso sobre como cada cena começa e termina.
O Vidu Q3-Turbo começa em US$ 0,034 por segundo. O Vidu Q3-Pro e o endpoint Reference-to-Video custam US$ 0,042 por segundo. O Vidu Q3-Mix, o modelo de referência com a mais alta consistência, custa US$ 0,106 por segundo. Todos os níveis têm preços 15% abaixo das taxas padrão da API Shengshu e estão disponíveis no modelo de pagamento conforme o uso (pay-as-you-go).
Join the Discord community for the latest model updates, prompts, and support.