Kling Video O3 na Atlas Cloud: IA de vídeo multimodal omni (2026)

O Kling Video O3 é a variante omni multimodal da Kuaishou para a família de geração de vídeo Kling. Enquanto o Kling 3.0 padrão foca em fluxos de trabalho de texto para vídeo e imagem para vídeo, o Kling Video O3 expande a paleta de entrada para incluir a transformação de vídeo para vídeo (V2V) e a geração de referência para vídeo (Ref2V). Estes não são recursos incrementais -- eles representam um paradigma criativo fundamentalmente diferente. Em vez de gerar vídeos do zero com base em descrições de texto, o V2V e o Ref2V permitem que os criadores transformem filmagens existentes e usem materiais de referência como âncoras criativas.

As implicações práticas são significativas. Um vídeo de produto pode ter seu estilo alterado para combinar com a estética da marca sem a necessidade de uma nova filmagem. Filmagens existentes podem ser transformadas em estilos visuais completamente diferentes -- live action para anime, dia para noite, verão para inverno -- preservando o movimento, o tempo e a composição originais. Imagens de referência podem guiar a aparência dos personagens, o design ambiental e a direção artística nos vídeos gerados. O Kling Video O3 está disponível através da API da Atlas Cloud a US$ 0,15/segundo.

*Última atualização: 28 de fevereiro de 2026*

Veja o Kling Video O3 em ação:

Kling Video O3 em resumo


Recurso	Detalhe
Desenvolvedor	Kuaishou
ID do Modelo	`kwaivgi/kling-video-o3-pro/text-to-video`
Preço	US$ 0,15/segundo
Resolução Máx.	1080p a 4K
Duração Máx.	Até 10 segundos
Modos de Entrada	Texto para vídeo, Imagem para vídeo, Vídeo para vídeo (V2V), Referência para vídeo (Ref2V)
Principais Recursos	Transformação V2V, geração Ref2V, transferência de estilo, entrada multimodal
Endpoint da API	`/model/generateVideo` (assíncrono)

O que torna o Kling Video O3 diferente

Transformação de Vídeo para Vídeo (V2V)

O vídeo para vídeo é a capacidade principal. O V2V usa um vídeo existente como entrada e o transforma de acordo com comandos de texto, preservando o movimento, o tempo e a composição espacial originais. Isso é fundamentalmente diferente de gerar um novo vídeo do zero -- o vídeo de origem fornece o esqueleto de movimento e o modelo renderiza novamente o conteúdo visual.

As aplicações práticas de V2V incluem:

Transferência de estilo: Transforme filmagens live-action em animação, pintura a óleo, estética cyberpunk, filme vintage ou qualquer outro estilo visual.
Mudanças de estação e hora: Converta uma cena de rua diurna para noturna, verão para inverno, tempo claro para chuva.
Transformação ambiental: Altere o cenário mantendo o mesmo movimento de câmera e movimento do assunto.
Reestilização de marca: Aplique uma linguagem visual de marca consistente a diversas filmagens de origem.
Repurposing de conteúdo: Transforme um único vídeo de origem em múltiplas variantes visuais para diferentes plataformas ou públicos.

A principal vantagem do V2V sobre o texto para vídeo é o controle. Ao gerar a partir de texto, o modelo decide o movimento, o tempo, o movimento da câmera e a composição espacial. Com o V2V, tudo isso vem do vídeo de origem. O criador mantém o controle direcional sobre os fundamentos, enquanto o modelo lida com a transformação visual.

Geração de Referência para Vídeo (Ref2V)

A geração de referência para vídeo usa uma ou mais imagens de referência para guiar as características visuais do vídeo gerado. Ao contrário da simples imagem para vídeo (que anima uma única imagem), o Ref2V usa o material de referência como uma âncora criativa -- influenciando o estilo, a aparência do personagem, a paleta de cores e o design ambiental -- enquanto gera movimentos e composições totalmente novos.

As aplicações práticas do Ref2V incluem:

Consistência de personagem: Forneça uma imagem de referência do personagem e gere vários vídeos apresentando esse personagem em diferentes cenários.
Consistência visual da marca: Use imagens da marca como referências para garantir que os vídeos gerados correspondam às diretrizes visuais estabelecidas.
Visualização de conceito: Use arte conceitual ou imagens de mood board como referências para guiar a geração de vídeo em direção a uma estética específica.
Integração de produto: Referencie imagens de produto para gerar vídeos contextuais que representem o produto com precisão.

Processamento de Entrada Multimodal

A designação "omni" do Kling Video O3 reflete sua capacidade de processar vários tipos de entrada simultaneamente. Uma única solicitação de geração pode combinar:

Comandos de texto descrevendo a saída desejada
Vídeo de origem para transformação V2V
Imagens de referência para guia de estilo e conteúdo

Essa abordagem multimodal oferece aos criadores um nível de especificação que modelos apenas de texto não conseguem igualar. Em vez de tentar descrever um estilo visual em palavras -- o que é inerentemente impreciso -- os criadores podem mostrar ao modelo exatamente o que desejam por meio de materiais de referência.

Detalhes dos Principais Recursos

Transferência de Estilo

A transferência de estilo é uma das aplicações mais imediatamente úteis do V2V. O processo funciona fornecendo um vídeo de origem e uma descrição de estilo (ou imagem de referência de estilo) ao modelo, que então renderiza o vídeo no estilo alvo, preservando o movimento e a composição.

Casos de uso comuns de transferência de estilo:

Live action para anime/cartoon: Equipes de marketing podem criar versões animadas de vídeos de produtos ou depoimentos.
Fotorrealista para pictórico: Transforme filmagens em estilos de pintura a óleo, aquarela ou ilustração para conteúdo editorial.
Moderno para vintage: Aplique granulação de filme, color grading e características estéticas de épocas cinematográficas específicas.
Dia para noite / mudanças climáticas: Transformações ambientais que seriam impossíveis ou caras de refilmar.

A qualidade da transferência de estilo depende da complexidade da filmagem de origem e do estilo alvo. Cenas simples com assuntos claros são transferidas de forma limpa. Cenas complexas com muitos elementos, movimento rápido ou detalhes intrincados podem apresentar artefatos nas bordas entre os elementos transformados.

Resolução e Qualidade

O Kling Video O3 suporta resoluções de 1080p até 4K, colocando-o no nível superior de modelos de geração de vídeo em termos de qualidade de saída. Em 1080p, o modelo produz uma saída pronta para transmissão, adequada para mídias sociais, conteúdo da web e distribuição digital padrão. Em 4K, a saída é viável para exibição em telas grandes, fluxos de trabalho de produção que exigem material de origem de alta resolução e distribuição de conteúdo premium.

A escolha da resolução afeta tanto o tempo de geração quanto o custo. Um clipe de 10 segundos em 1080p custa US$ 1,50 (US$ 0,15/segundo x 10 segundos). Uma resolução mais alta aumenta o tempo de processamento proporcionalmente.

Duração e Tempo

O Kling Video O3 suporta a geração de vídeo de até 10 segundos. Embora isso possa parecer breve em comparação com os 15 segundos do Seedance 2.0, as capacidades V2V e Ref2V mudam a equação. Uma transformação V2V de 10 segundos de uma filmagem existente costuma ser mais valiosa do que uma geração de texto para vídeo de 15 segundos, porque a qualidade do movimento e a composição são baseadas em filmagens reais, em vez de sintetizadas do zero.

Para conteúdos mais longos, vários clipes de 10 segundos podem ser gerados e montados na pós-produção. Ao usar V2V, vídeos de origem mais longos podem ser processados em segmentos para manter a consistência.

Análise de Preços e Custos

Preço por Segundo


Duração	Custo	Rendimento do Crédito de US$ 1
5 segundos	US$ 0,75	~1,3 clipes
8 segundos	US$ 1,20	~0,8 clipes
10 segundos	US$ 1,50	~0,6 clipes

Comparação com outros modelos de vídeo


Modelo	Preço/segundo	Duração Máx.	Resolução Máx.	Suporte V2V
Kling Video O3	US$ 0,15/seg	10s	4K	Sim
Kling 3.0 Standard	US$ 0,126/seg	10s	Ultra HD	Não
Seedance 2.0	US$ 0,022/seg	15s	HD	Não
Sora 2	US$ 0,15/seg	12s	HD	Não
Veo 3.1	US$ 0,03/seg	8s	Cinemático	Não

O Kling Video O3 tem um preço premium em relação aos modelos padrão de texto para vídeo, o que reflete suas capacidades expandidas. Os recursos V2V e Ref2V fornecem um valor que os modelos de texto para vídeo simplesmente não conseguem replicar. Para equipes que precisam de transformação de vídeo, transferência de estilo ou geração guiada por referência, o preço de US$ 0,15/segundo inclui capacidades que, de outra forma, exigiriam várias ferramentas ou trabalho manual de pós-produção.

Custo em escala

10 clipes/semana (10s cada): US$ 15/semana, US$ 60/mês
50 clipes/semana (mix de 5-10s): US$ 56/semana, US$ 225/mês
Fluxo de trabalho de produção (200 clipes/mês, 8s méd.): US$ 240/mês

Para equipes que comparam o custo da transformação de vídeo por IA versus a produção de vídeo tradicional ou pós-produção manual, a economia é extremamente favorável. Uma única hora de edição profissional de vídeo para obter um efeito de transferência de estilo custa entre US$ 50-200. O Kling Video O3 alcança um resultado comparável por US$ 0,75-1,50 por clipe.

Como usar o Kling Video O3 via API da Atlas Cloud

Passo 1: Obtenha sua chave de API

Registre-se na Atlas Cloud e crie uma chave de API no console.

Passo 2: Geração de Texto para Vídeo

plaintext
1```python
2import requests
3import time
4
5API_KEY = "sua-chave-api-atlas-cloud"
6BASE_URL = "https://api.atlascloud.ai/api/v1"
7HEADERS = {
8    "Authorization": f"Bearer {API_KEY}",
9    "Content-Type": "application/json"
10}
11
12# Gerar vídeo com Kling Video O3
13response = requests.post(
14    f"{BASE_URL}/model/generateVideo",
15    headers=HEADERS,
16    json={
17        "model": "kwaivgi/kling-video-o3-pro/text-to-video",
18        "prompt": "Um artista ceramista moldando um vaso em uma roda de oleiro, close-up das mãos cobertas de argila úmida, iluminação de estúdio quente, profundidade de campo rasa, estilo documentário",
19        "duration": 10,
20        "resolution": "1080p"
21    }
22)
23
24result = response.json()
25request_id = result["request_id"]
26
27# Verificar resultados
28while True:
29    status = requests.get(
30        f"{BASE_URL}/model/prediction/{request_id}/get",
31        headers={"Authorization": f"Bearer {API_KEY}"}
32    ).json()
33
34    if status["status"] == "completed":
35        print(f"URL do vídeo: {status['output']['video_url']}")
36        break
37    elif status["status"] == "failed":
38        print(f"A geração falhou: {status.get('error', 'Erro desconhecido')}")
39        break
40
41    time.sleep(5)
42```

Passo 3: Transformação de Vídeo para Vídeo (V2V)

plaintext
1```python
2# Transformar vídeo existente com transferência de estilo
3response = requests.post(
4    f"{BASE_URL}/model/generateVideo",
5    headers=HEADERS,
6    json={
7        "model": "kwaivgi/kling-video-o3-pro/text-to-video",
8        "prompt": "Transformar no estilo de anime do Studio Ghibli, cores vibrantes, estética desenhada à mão, fundos de aquarela suaves, atmosfera fantasiosa",
9        "video_url": "https://example.com/seu-video-de-origem.mp4",
10        "duration": 10,
11        "resolution": "1080p"
12    }
13)
14
15result = response.json()
16request_id = result["request_id"]
17
18# Verificar resultados
19while True:
20    status = requests.get(
21        f"{BASE_URL}/model/prediction/{request_id}/get",
22        headers={"Authorization": f"Bearer {API_KEY}"}
23    ).json()
24
25    if status["status"] == "completed":
26        print(f"Vídeo transformado: {status['output']['video_url']}")
27        break
28    elif status["status"] == "failed":
29        print(f"A transformação falhou: {status.get('error', 'Erro desconhecido')}")
30        break
31
32    time.sleep(5)
33```

Passo 4: Geração de Referência para Vídeo (Ref2V)

plaintext
1```python
2# Gerar vídeo guiado por imagens de referência
3response = requests.post(
4    f"{BASE_URL}/model/generateVideo",
5    headers=HEADERS,
6    json={
7        "model": "kwaivgi/kling-video-o3-pro/text-to-video",
8        "prompt": "Uma mulher caminhando por uma cidade futurista à noite, luzes neon refletindo nas ruas molhadas, atmosfera cinematográfica, câmera lenta",
9        "image_url": "https://example.com/referencia-personagem.jpg",
10        "duration": 10,
11        "resolution": "1080p"
12    }
13)
14
15result = response.json()
16request_id = result["request_id"]
17
18# Verificar resultados
19while True:
20    status = requests.get(
21        f"{BASE_URL}/model/prediction/{request_id}/get",
22        headers={"Authorization": f"Bearer {API_KEY}"}
23    ).json()
24
25    if status["status"] == "completed":
26        print(f"Vídeo Ref2V: {status['output']['video_url']}")
27        break
28    elif status["status"] == "failed":
29        print(f"A geração falhou: {status.get('error', 'Erro desconhecido')}")
30        break
31
32    time.sleep(5)
33```

Passo 5: Pipeline de Transferência de Estilo em Lote

plaintext
1```python
2# Processar vários vídeos com a mesma transformação de estilo
3fonte_videos = [
4    "https://example.com/demo-produto-1.mp4",
5    "https://example.com/demo-produto-2.mp4",
6    "https://example.com/demo-produto-3.mp4"
7]
8
9prompt_estilo = "Transformar em estilo de filme cinematográfico com color grading azul-petróleo e laranja, reflexo de lente anamórfica, profundidade de campo rasa, visual comercial premium"
10
11ids_requisicao = []
12
13# Enviar todas as transformações
14for video_url in fonte_videos:
15    response = requests.post(
16        f"{BASE_URL}/model/generateVideo",
17        headers=HEADERS,
18        json={
19            "model": "kwaivgi/kling-video-o3-pro/text-to-video",
20            "prompt": prompt_estilo,
21            "video_url": video_url,
22            "duration": 10,
23            "resolution": "1080p"
24        }
25    )
26    result = response.json()
27    ids_requisicao.append(result["request_id"])
28    print(f"Enviado: {video_url}")
29
30# Verificar todos os resultados
31for i, request_id in enumerate(ids_requisicao):
32    while True:
33        status = requests.get(
34            f"{BASE_URL}/model/prediction/{request_id}/get",
35            headers={"Authorization": f"Bearer {API_KEY}"}
36        ).json()
37
38        if status["status"] == "completed":
39            print(f"Vídeo {i+1} concluído: {status['output']['video_url']}")
40            break
41        elif status["status"] == "failed":
42            print(f"Vídeo {i+1} falhou: {status.get('error', 'Erro desconhecido')}")
43            break
44
45        time.sleep(5)
46```

Casos de Uso Práticos

Reestilização de Conteúdo de Marca

Equipes de marketing geralmente precisam adaptar conteúdo de vídeo existente para diferentes campanhas, estações ou renovações de marca. As abordagens tradicionais exigem refilmagens ou pós-produção extensiva. Com a capacidade V2V do Kling Video O3, um único vídeo de origem pode ser transformado em múltiplas variantes visuais:

Versões festivas com estilo de inverno/comemorativo
Color grading e tratamentos visuais específicos de campanha
Adaptações estéticas específicas por plataforma (LinkedIn profissional vs. TikTok criativo)
Adaptações para mercados regionais com estilos visuais culturalmente apropriados

Variações de Vídeo de Produto

Equipes de e-commerce podem pegar um único vídeo de produto e criar múltiplos tratamentos visuais:

Diferentes ambientes de fundo (estúdio, ao ar livre, configurações de estilo de vida)
Variações sazonais (frescor de primavera, vibração de verão, calor de outono, elegância de inverno)
Estilos artísticos para diferentes canais de marketing
Variações de clima (energético, calmo, luxuoso, divertido)

Fluxos de Trabalho para Criadores de Conteúdo

Criadores independentes e pequenos estúdios podem aproveitar o V2V para elevar o nível da qualidade de sua produção:

Transformar filmagens de smartphone em conteúdo de aparência cinematográfica
Aplicar estilos visuais consistentes em uma série de conteúdo sem ferramentas caras de color grading
Criar versões animadas ou estilizadas de conteúdo live-action para variedade
Experimentar estéticas visuais de forma rápida e barata antes de se comprometer com uma abordagem de produção

Publicidade e Mídias Sociais

Equipes de publicidade podem usar o Ref2V para manter a consistência do personagem e da marca em várias variantes de anúncios enquanto testam diferentes cenários, configurações e narrativas. A imagem de referência ancora a identidade visual, enquanto o comando de texto controla a direção criativa de cada variante.

Pré-visualização de Filmes e Animação

Cineastas e animadores podem usar o V2V para visualizar rapidamente como as filmagens existentes seriam com diferentes tratamentos visuais. Isso é valioso durante o planejamento de pré-produção e pós-produção, permitindo que os diretores explorem opções criativas antes de se comprometerem com processos caros de pós-produção.

Kling Video O3 vs. Kling 3.0 Standard


Recurso	Kling Video O3	Kling 3.0 Standard
Preço	US$ 0,15/seg	US$ 0,126/seg
Texto para vídeo	Sim	Sim
Imagem para vídeo	Sim	Sim
Vídeo para vídeo	Sim	Não
Referência para vídeo	Sim	Não
Transferência de estilo	Sim	Não
Resolução Máx.	4K	Ultra HD
Duração Máx.	10s	10s
Melhor para	Transformação, reestilização	Geração original

A escolha entre Kling Video O3 e Kling 3.0 Standard depende do fluxo de trabalho. Se a necessidade principal for gerar novos vídeos a partir de comandos de texto ou imagem, o Kling 3.0 Standard oferece ótima qualidade a um preço menor. Se o fluxo de trabalho envolve transformar filmagens existentes, manter a consistência visual com materiais de referência ou aplicar transferências de estilo, as capacidades expandidas do Kling Video O3 justificam o preço premium.

Kling Video O3 vs. Outros Modelos de Vídeo

vs. Seedance 2.0

O Seedance 2.0 (US$ 0,022/seg) é significativamente mais barato e suporta durações mais longas (15s), mas não oferece transformação V2V real ou transferência de estilo. A força do Seedance 2.0 reside em sua entrada de referência multimodal (até 12 arquivos) para geração original. Equipes que precisam de V2V devem usar o Kling Video O3; equipes que precisam de geração original com bom custo-benefício devem usar o Seedance 2.0.

vs. Sora 2

O Sora 2 (US$ 0,15/seg) iguala o preço do Kling Video O3 e oferece uma simulação física superior, mas carece de capacidades V2V. Para texto para vídeo com interações físicas realistas, o Sora 2 é a escolha mais forte. Para transformação de vídeo e transferência de estilo, o Kling Video O3 é o vencedor claro.

vs. Veo 3.1

O Veo 3.1 (US$ 0,03/seg) destaca-se pelo polimento cinematográfico e saída com qualidade de filme a um preço menor, mas é focado na geração original, não na transformação. Para texto para vídeo cinematográfico, o Veo 3.1 oferece melhor valor. Para fluxos de trabalho de V2V e Ref2V, o Kling Video O3 é a única opção entre os quatro.

Dicas de Comandos para o Kling Video O3

Comandos de Texto para Vídeo

Siga os mesmos princípios da geração de vídeo padrão -- seja específico sobre o movimento da câmera, iluminação, ação do assunto e humor:

plaintext
1```
2Foto dolly lenta através de um jardim zen japonês ao amanhecer,
3névoa matinal subindo de um lago de carpas, pétalas de cerejeira
4caindo suavemente, pássaros cantando ao fundo,
5atmosfera pacífica e meditativa
6```

Comandos de Transferência de Estilo V2V

Ao usar V2V, o comando deve descrever o estilo alvo, não o conteúdo (o conteúdo vem do vídeo de origem):

plaintext
1```
2Transformar em estilo de anime cyberpunk com iluminação neon,
3superfícies molhadas pela chuva, anúncios holográficos,
4alto contraste com sombras profundas e destaques vívidos
5```

plaintext
1```
2Converter para estética de filme Super 8 vintage dos anos 1970, tonalidade quente,
3granulação de filme, leve vinheta, atmosfera nostálgica,
4cores desbotadas com ênfase em tons de laranja e azul-petróleo
5```

Comandos Ref2V

Ao usar imagens de referência, o comando deve descrever a ação e o cenário desejados, enquanto a imagem de referência lida com o estilo visual:

plaintext
1```
2O personagem caminha com confiança por um mercado movimentado,
3examinando artesanato em várias barracas,
4tracking shot dinâmico, luz solar quente da tarde
5```

Dicas para Melhores Resultados

A qualidade da fonte V2V importa: Vídeos de origem de maior qualidade produzem melhores transformações. Filmagens limpas e bem iluminadas com movimento de câmera estável transformam-se de forma mais confiável do que materiais de origem instáveis e de baixa resolução.
Descrições de estilo devem ser específicas: "Estilo anime" é muito vago. "Estilo de anime em aquarela do Studio Ghibli com bordas suaves, cores pastéis e texturas desenhadas à mão" é muito mais eficaz.
Mantenha o movimento V2V simples: Vídeos de origem com movimento moderado e previsível transformam-se melhor do que filmagens com movimento rápido e complexo. Movimentos suaves de câmera e movimento deliberado do assunto produzem resultados mais limpos.
Use imagens de referência de alta qualidade: Para Ref2V, as imagens de referência devem ser claras, bem compostas e representativas do estilo visual desejado. Múltiplas imagens de referência da mesma estética produzem resultados mais consistentes.
Combine a duração com o conteúdo: Nem todo clipe precisa ter 10 segundos. Durações mais curtas (5-8 segundos) geralmente produzem maior qualidade por quadro e custam menos.

Quem deve usar o Kling Video O3?

Escolha o Kling Video O3 se você precisar de:

Transformação de Vídeo para Vídeo (V2V) para reestilizar, recolorir ou transformar visualmente filmagens existentes enquanto preserva o movimento e a composição originais
Geração de vídeo baseada em referência (Ref2V) para manter a consistência do personagem, identidade visual da marca ou direção de arte conceitual em vários clipes
Capacidades de transferência de estilo -- converter live action para anime, mudar dia para noite ou aplicar tratamentos visuais específicos da marca a filmagens de origem

Considere alternativas se você precisar de:

Geração de vídeo econômica -- Seedance 2.0 (US$ 0,022/seg) ou Veo 3.1 (US$ 0,03/seg) são significativamente mais baratos para fluxos de trabalho de texto para vídeo padrão
Texto para vídeo simples sem recursos de transformação -- Kling 3.0 Standard (US$ 0,126/seg) oferece uma forte geração original a um preço menor
Geração de áudio nativa -- O Veo 3.1 ou o Kling 3.0 Standard incluem áudio sincronizado, o que o Kling Video O3 não enfatiza

Perguntas Frequentes

Qual é a diferença entre V2V e I2V?

Imagem para Vídeo (I2V) anima uma única imagem estática, criando movimento a partir de um quadro fixo. Vídeo para Vídeo (V2V) transforma um vídeo inteiro -- renderizando novamente o conteúdo visual enquanto preserva o movimento, o tempo e a composição originais. O V2V é fundamentalmente uma ferramenta de transformação; o I2V é uma ferramenta de geração.

Quais formatos de vídeo são suportados para entrada V2V?

Formatos de vídeo padrão, incluindo MP4, são suportados para entrada V2V. Os vídeos de origem devem estar acessíveis via URL para envio à API. Para melhores resultados, os vídeos de origem devem estar limpos, bem iluminados e ter movimento estável.

Posso usar V2V para conteúdo comercial?

Os direitos de uso comercial seguem as mesmas políticas da geração de vídeo Kling padrão. A Atlas Cloud não impõe restrições adicionais além dos termos do provedor do modelo. Certifique-se de que os direitos do seu vídeo de origem permitam obras derivadas se a fonte não for sua própria filmagem original.

Como o Kling Video O3 lida com transformações V2V complexas?

O modelo tem melhor desempenho com transformações de complexidade moderada -- mudanças de estilo, ajustes ambientais e mudanças estéticas. Transformações extremamente dramáticas (por exemplo, converter uma pessoa falando em um personagem completamente diferente) podem produzir resultados inconsistentes. Quanto mais próxima a linguagem visual do estilo alvo, melhor será o resultado.

A saída 4K está disponível para todos os tipos de geração?

A resolução 4K é suportada nos modos de geração de texto para vídeo, imagem para vídeo, V2V e Ref2V. Uma resolução mais alta aumenta o tempo de processamento e o custo proporcionalmente.

Posso combinar V2V e Ref2V em uma única solicitação?

O Kling Video O3 suporta entrada multimodal, o que significa que você pode fornecer um vídeo de origem, imagens de referência e comandos de texto em uma única solicitação. Isso permite transformações altamente controladas, onde o vídeo de origem fornece o movimento, as imagens de referência fornecem guia de estilo visual e o comando de texto fornece direção criativa adicional.

Como funciona o crédito de US$ 1 gratuito?

Ao se registrar na Atlas Cloud, US$ 1 em crédito é aplicado imediatamente. A US$ 0,15/segundo, isso cobre aproximadamente 6,6 segundos de vídeo gerado -- o suficiente para um clipe de teste para avaliar as capacidades do modelo para o seu caso de uso específico.

Veredito

O Kling Video O3 já está disponível na Atlas Cloud. Suas capacidades V2V e Ref2V tornam-no exclusivamente adequado para fluxos de trabalho de transformação de vídeo que nenhum outro modelo em sua classe suporta atualmente.

Página de Modelos da Atlas Cloud: Explore as capacidades do Kling Video O3 de forma interativa
Acesso à API: Inscreva-se e obtenha sua chave de API para começar a transformar vídeos com IA

────────────────────────────────────────────────────────────