ShengShu Models on AtlasCloud | Vidu

Construa pipelines de produção de vídeo na Shengshu API: com uma única chamada, o Vidu Q3 gera clipes cinematográficos de 16 segundos com áudio nativo e cortes de câmera inteligentes.

AI Video Models by ShengShu

Gere vídeos cinematográficos e de alta fidelidade a partir de texto e imagens com os mais recentes modelos de IA de geração de vídeo na Atlas Cloud.

Vidu

A API Vidu oferece aos desenvolvedores acesso a modelos de vídeo da Shengshu AI e da Universidade de Tsinghua, construída na arquitetura U-ViT que unifica o design Diffusion e Transformer. Insira de uma a quatro imagens de referência e Vidu mantém a consistência dos sujeitos entre os planos, com alternância inteligente de câmera e movimento suave e cinemático. O Atlas Cloud adiciona acesso ao modelo Day-0 e uma chave compatível com OpenAI para toda a linha. Comece a construir hoje.

25 modelosExplorar Vidu

ShengShu Models API Pricing Details

Compare standard vs. our pricing across every ShengShu model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Vidu Q3-Mix Reference to Video	$0.125	Start from$0.106/s video	-15%	View
Vidu Q3 Reference to Video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Pro Start-end-to-video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Turbo Image-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Start-end-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Text-to-video	$0.04	Start from$0.034/s video	-15%	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Casos de uso da API ShengShu que você pode desenvolver na Atlas Cloud

Os clipes de 16 segundos, o áudio nativo e a consistência multirreferência do Vidu Q3 tornam-no prático para fluxos de trabalho que anteriormente exigiam uma equipe de produção. As equipes usam os diferentes níveis do Q3 para passar da iteração rápida para os ativos finais sem mudar de provedor.

Série Animada com Personagens Consistentes

Estúdios e criadores independentes usam o Vidu Q3-Mix para gerar conteúdo animado de múltiplos episódios onde os personagens parecem idênticos em cada cena. Ao fazer o upload de planilhas de referência de personagens, cada novo clipe herda as mesmas características faciais, trajes e estilo visual sem trabalho manual de consistência quadro a quadro. A Shengshu demonstrou esse fluxo de trabalho no SXSW 2026 como a primeira solução de AI para a produção de séries animadas.

Conteúdo de avatares de marca e mascotes em larga escala

As equipes de marketing fazem o upload das imagens de referência de um personagem da marca uma vez e usam o Vidu Q3 Reference-to-Video para gerar dezenas de clipes curtos para o TikTok, Reels e YouTube Shorts. O personagem permanece visualmente idêntico em todos os resultados, eliminando o gargalo de design de instruir e aprovar cada ativo individualmente. A US$ 0,042 por segundo na Atlas Cloud, um lote completo de clipes de 10 segundos custa menos de um dólar cada.

Vídeo de marketing de produto multiângulo

As equipes de comércio eletrônico fornecem fotos de produtos de vários ângulos como entradas de referência e geram clipes de marketing cinematográficos que mostram o produto em movimento com áudio ambiente nativo. O resultado chega com som sincronizado na mesma chamada, pronto para anúncios e páginas de produtos sem a necessidade de gravação de vídeo ou edição de áudio. O controle de quadro inicial e final permite que as equipes direcionem com precisão como o produto é revelado em cada clipe.

Geração Direcionada de Cenas para Pré-produção Cinematográfica

Os diretores usam o controle de câmera do Vidu Q3-Pro para gerar clipes de pré-visualização com movimentos especificados — aproximações em um sujeito, panorâmicas em um cenário, planos de rastreamento seguindo um personagem. A saída nativa de 16 segundos significa que uma cena curta completa pode ser pré-visualizada em uma única chamada. Isso substitui o trabalho inicial de storyboard por material de referência com precisão de movimento para o elenco e a equipe.

Pipeline de conteúdo social de alto volume

As equipes de desenvolvimento usam o Vidu Q3-Turbo para executar pipelines de geração em lote a US$ 0,034 por segundo, produzindo dezenas de clipes curtos a partir de entradas de texto ou imagem por hora. O menor custo por segundo torna prático gerar e testar muitas variantes criativas antes de selecionar quais escalar com o Q3-Pro. Ambos os modelos funcionam sob a mesma chave de API do Atlas Cloud com uma única alteração de parâmetro entre as camadas.

Turismo Cultural e Conteúdo de Destino

Os conselhos de turismo e as plataformas de viagens utilizam a geração de texto para vídeo do Vidu Q3-Pro para criar clipes de destinos atmosféricos com som ambiente natural a partir de prompts de texto descritivos. Uma descrição de cena por escrito de uma paisagem, marco ou cenário cultural produz um clipe cinematográfico de 16 segundos com áudio correspondente em uma única chamada. Isso oferece uma alternativa econômica às filmagens em locação para conteúdos que impulsionam a intenção de reserva.

Transforme a visão da sua empresa em realidade com a Atlas Cloud AI.

Fale com vendas

Perguntas frequentes sobre os modelos ShengShu

O Vidu Q3 gera até 16 segundos de vídeo contínuo em uma única chamada de API a 1080p e 24fps. Esta é a janela de geração de passagem única mais longa entre os principais modelos de vídeo em sua categoria. A duração do clipe é configurável por chamada dentro desse limite máximo.

Sim. O Vidu Q3 produz diálogos, efeitos sonoros, música de fundo e sincronia labial simultaneamente com os quadros de vídeo em uma única passagem de inferência. Não há dublagem de pós-produção ou etapa de alinhamento manual de áudio. O tempo do áudio e a ação na tela são sincronizados automaticamente.

Você descreve o movimento da câmera diretamente no prompt de texto — push-ins, panorâmicas (pans), tracking shots — e o modelo os executa a partir do primeiro quadro. Não é necessário nenhum parâmetro ou camada de controle separada. Isso se aplica aos endpoints de text-to-video e image-to-video no Atlas Cloud.

O Vidu Q3-Pro entrega resultados com qualidade de cinema, movimentos suaves e riqueza de detalhes, ao custo de US$ 0,042 por segundo na Atlas Cloud. O Vidu Q3-Turbo realiza gerações em maior velocidade com um custo menor de US$ 0,034 por segundo, ideal para rascunhos e iteração rápida. Ambos compartilham a mesma resolução de saída de 1080p e suporte de áudio nativo.

O endpoint Reference-to-Video do Vidu Q3 aceita entre 1 e 4 imagens de referência por chamada. Você pode combinar sujeitos, ambientes, trajes e estilos visuais de imagens diferentes em uma única geração. Esta é a principal maneira de manter a consistência de personagens e cenas em vários clipes.

O Vidu Q3-Mix é o modelo de referência de nível mais alto da linha Vidu Q3, com o preço de US$ 0,106 por segundo na Atlas Cloud. Ele oferece a mais forte consistência de vários sujeitos ao combinar várias imagens de referência em uma única geração. Foi desenvolvido para fluxos de trabalho como a produção de séries animadas e conteúdo de marca, onde a identidade da personagem deve permanecer visualmente idêntica em vários clipes.

Sim. Tanto o Vidu Q3-Pro quanto o Q3-Turbo possuem um endpoint Start-end-to-video no Atlas Cloud. Você fornece uma imagem de quadro inicial e descreve o movimento desejado ou o estado final, e o modelo gera a transição. Isso oferece um controle de direção preciso sobre como cada cena começa e termina.

O Vidu Q3-Turbo começa em US$ 0,034 por segundo. O Vidu Q3-Pro e o endpoint Reference-to-Video custam US$ 0,042 por segundo. O Vidu Q3-Mix, o modelo de referência com a mais alta consistência, custa US$ 0,106 por segundo. Todos os níveis têm preços 15% abaixo das taxas padrão da API Shengshu e estão disponíveis no modelo de pagamento conforme o uso (pay-as-you-go).

Explorar Mais Séries

Seedance 2.0

A API do Seedance 2.0 oferece acesso de produção ao modelo de vídeo multimodal da ByteDance — entradas quadrimodais (texto, imagem, vídeo, áudio) e um sistema "Universal Reference" líder do setor que fixa a composição, o movimento da câmera e as ações dos personagens entre as cenas. Integre um controle de nível de diretor com uma única chamada de API, uma taxa fixa de $0,09/s, chave instantânea e sem lista de espera — respaldado por tempo de atividade e conformidade de nível corporativo. O Seedance 2.0 Native 4K já está no ar!

Ver Série

Grok Imagine

A Grok Imagine API oferece aos desenvolvedores a geração de imagens, vídeos e áudio da xAI em um único pacote. Ela produz imagens de até 2K com renderização de texto multilíngue, além de vídeos de até 15 segundos com áudio nativo sincronizado e edição baseada em referências. Na Atlas Cloud, uma única chave executa todos os modos do Grok Imagine, permitindo que você alterne entre imagem, vídeo e áudio sem configurações separadas, a partir de US$ 0,02 por imagem e US$ 0,05 por segundo.

Ver Série

Gemini Omni Flash

A Gemini Omni API traz para o seu stack o modelo multimodal de geração e edição de vídeo do Google DeepMind, apresentado no Google I/O 2026. O Gemini Omni funde o motor de raciocínio do Gemini com mídia generativa, aceitando qualquer combinação de texto, imagens, vídeo e áudio para produzir resultados consistentes e fundamentados em conhecimento. Refine os resultados por meio de conversas naturais — troque objetos, reescreva cenas e mude estilos, enquanto a física, os personagens e a continuidade permanecem intactos. A Atlas Cloud oferece toda a linha Gemini Omni Flash — texto para vídeo, imagem para vídeo com até 7 imagens de referência e referência para vídeo — por meio de uma única API unificada, com preços transparentes por segundo a partir de $0.112 e sem assinatura. Comece a construir hoje mesmo.

Ver Série

GPT Image 2

A API do GPT Image 2 dá aos desenvolvedores acesso ao mais recente modelo de imagem da OpenAI, o sucessor do GPT Image 1.5. Ele gera e edita imagens com renderização de texto precisa em caracteres latinos e CJK, além de uma forte composição para pôsteres, mockups e infográficos. Na Atlas Cloud, você o acessa através de uma API unificada junto a mais de 300 modelos, com créditos gratuitos, 99,99% de tempo de atividade e sem a necessidade de verificação de organização da OpenAI.

Ver Série

Google

Os modelos criativos mais poderosos do Google estão todos disponíveis na Atlas Cloud. O Veo 3.1 oferece geração de vídeo cinematográfico, o Nano Banana 2 impulsiona a criação de imagens de alta fidelidade e o Gemini traz inteligência multimodal para cada fluxo de trabalho. Acesse o pacote completo de modelos do Google por meio de uma única API key com disponibilidade Day-0 e preços de pagamento conforme o uso (pay-as-you-go).

Ver Série

Seedance 2.0 Mini

O Seedance 2.0 Mini leva a geração de vídeo multimodal da ByteDance para fluxos de trabalho onde a velocidade e o custo são essenciais. Ele oferece os principais recursos do Seedance 2.0 com menor impacto — geração mais rápida, menor custo por vídeo e a mesma integração de API que você já usa. Para equipes que executam pipelines de alto volume ou prototipagem em escala, o Mini é a opção padrão prática.

Ver Série

ByteDance

Da geração de vídeo cinematográfico à criação de imagens de alta fidelidade, os modelos mais poderosos da ByteDance estão disponíveis no Atlas Cloud. Execute o Seedance e o Seedream em grande escala com os preços de inferência mais baixos e zero custos indiretos de infraestrutura.

Ver Série

Alibaba

O Atlas Cloud reúne toda a linha de modelos da Alibaba sob uma única API: Qwen para tarefas de linguagem e imagem, e Wan para geração de vídeo em até 1080p. Acesse cada modelo no formato pré-pago (pay-as-you-go) sem necessidade de assinaturas. A API da Alibaba está disponível por meio de uma única URL base usando seu cliente compatível com OpenAI existente.

Ver Série

OpenAI

O Atlas Cloud oferece acesso a toda a linha da API da OpenAI, desde o GPT Image 2 para geração de imagens até o Sora 2 para vídeo. Todos os modelos estão disponíveis na modalidade de pagamento conforme o uso, sem compromisso mensal. Integre-se trocando apenas uma URL base usando a API compatível com a OpenAI.

Ver Série

xAI

Construa pipelines completos de imagem e vídeo usando a xAI API no Atlas Cloud. Gere em 2K, edite com imagens de referência e anime imagens em clipes sincronizados com áudio.

Ver Série

Kwaivgi

A API da Kwaivgi com preço 15% abaixo do padrão. A Atlas Cloud oferece acesso Day-0 a novos lançamentos da Kling com preços de pagamento conforme o uso e sem limite de assentos. Uma conta, uma chave, todos os modelos da Kling do nível padrão ao nível master.

Ver Série

Seedream 5.0 Pro

A API do Seedream 5.0 Pro fornece aos desenvolvedores o modelo de edição de imagens controlável da ByteDance no Atlas Cloud. Ela posiciona as edições com precisão usando âncoras e coordenadas, separa as imagens em camadas editáveis, funde múltiplas referências e combina cores e materiais exatos, com texto multilíngue em 2K e 3K. No Atlas Cloud, você pode acessá-lo por meio de uma única chave!

Ver Série