
Wan 2.6 Video-to-Video API by Alibaba
A speed-optimized video-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.
Entrada
Saída
InativoCada execução custará $0.07. Com $10 você pode executar aproximadamente 142 vezes.
Você pode continuar com:
Exemplo de código
import requests
import time
# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "alibaba/wan-2.6/video-to-video",
"prompt": "A beautiful sunset over the ocean with gentle waves",
"width": 512,
"height": 512,
"duration": 3,
"fps": 24,
}
generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]
# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
def check_status():
while True:
response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
result = response.json()
if result["data"]["status"] in ["completed", "succeeded"]:
print("Generated video:", result["data"]["outputs"][0])
return result["data"]["outputs"][0]
elif result["data"]["status"] == "failed":
raise Exception(result["data"]["error"] or "Generation failed")
else:
# Still processing, wait 2 seconds
time.sleep(2)
video_url = check_status()Instalar
Instale o pacote necessário para a sua linguagem de programação.
pip install requestsAutenticação
Todas as solicitações de API requerem autenticação por meio de uma chave de API. Você pode obter sua chave de API no painel do Atlas Cloud.
export ATLASCLOUD_API_KEY="your-api-key-here"Cabeçalhos HTTP
import os
API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {API_KEY}"
}Nunca exponha sua chave de API em código do lado do cliente ou repositórios públicos. Use variáveis de ambiente ou um proxy de backend.
Enviar uma solicitação
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "your-model",
"prompt": "A beautiful landscape"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())Enviar uma solicitação
Envie uma solicitação de geração assíncrona. A API retorna um ID de predição que você pode usar para verificar o status e obter o resultado.
/api/v1/model/generateVideoCorpo da solicitação
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "alibaba/wan-2.6/video-to-video",
"input": {
"prompt": "A beautiful sunset over the ocean with gentle waves"
}
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")Resposta
{
"id": "pred_abc123",
"status": "processing",
"model": "model-name",
"created_at": "2025-01-01T00:00:00Z"
}Verificar status
Consulte o endpoint de predição para verificar o status atual da sua solicitação.
/api/v1/model/prediction/{prediction_id}Exemplo de polling
import requests
import time
prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
while True:
response = requests.get(url, headers=headers)
result = response.json()
status = result["data"]["status"]
print(f"Status: {status}")
if status in ["completed", "succeeded"]:
output_url = result["data"]["outputs"][0]
print(f"Output URL: {output_url}")
break
elif status == "failed":
print(f"Error: {result['data'].get('error', 'Unknown')}")
break
time.sleep(3)Valores de status
processingA solicitação ainda está sendo processada.completedA geração está completa. As saídas estão disponíveis.succeededA geração foi bem-sucedida. As saídas estão disponíveis.failedA geração falhou. Verifique o campo de erro.Resposta concluída
{
"data": {
"id": "pred_abc123",
"status": "completed",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}
}Enviar arquivos
Envie arquivos para o armazenamento do Atlas Cloud e obtenha uma URL que pode ser usada nas suas solicitações de API. Use multipart/form-data para enviar.
/api/v1/model/uploadMediaExemplo de upload
import requests
url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
with open("image.png", "rb") as f:
files = {"file": ("image.png", f, "image/png")}
response = requests.post(url, headers=headers, files=files)
result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")Resposta
{
"data": {
"download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
"file_name": "image.png",
"content_type": "image/png",
"size": 1024000
}
}Schema de entrada
Os seguintes parâmetros são aceitos no corpo da solicitação.
Nenhum parâmetro disponível.
Exemplo de corpo da solicitação
{
"model": "alibaba/wan-2.6/video-to-video"
}Schema de saída
A API retorna uma resposta de predição com as URL de saída geradas.
Exemplo de resposta
{
"id": "pred_abc123",
"status": "completed",
"model": "model-name",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}Atlas Cloud Skills
O Atlas Cloud Skills integra mais de 300 modelos de IA diretamente no seu assistente de codificação com IA. Um comando para instalar e depois use linguagem natural para gerar imagens, vídeos e conversar com LLM.
Clientes compatíveis
Instalar
npx skills add AtlasCloudAI/atlas-cloud-skillsConfigurar chave de API
Obtenha sua chave de API no painel do Atlas Cloud e defina-a como variável de ambiente.
export ATLASCLOUD_API_KEY="your-api-key-here"Funcionalidades
Após a instalação, você pode usar linguagem natural no seu assistente de IA para acessar todos os modelos do Atlas Cloud.
MCP Server
O Atlas Cloud MCP Server conecta seu IDE com mais de 300 modelos de IA através do Model Context Protocol. Funciona com qualquer cliente compatível com MCP.
Clientes compatíveis
Instalar
npx -y atlascloud-mcpConfiguração
Adicione a seguinte configuração ao arquivo de configuração de MCP do seu IDE.
{
"mcpServers": {
"atlascloud": {
"command": "npx",
"args": [
"-y",
"atlascloud-mcp"
],
"env": {
"ATLASCLOUD_API_KEY": "your-api-key-here"
}
}
}
}Ferramentas disponíveis
API Schema
Schema não disponívelFaça login para ver o histórico de solicitações
Você precisa fazer login para acessar o histórico de solicitações do modelo.
Fazer LoginWan 2.6Criação Profissional de Vídeos AI com Multi-Planos
O mais recente avanço da Alibaba em geração de vídeo com IA. Crie vídeos de até 15 segundos em 1080p com narrativa multi-planos, consistência de personagens orientada por referências e sincronização audiovisual nativa. O primeiro modelo a compreender verdadeiramente a lógica do storyboard para narrativas cinematográficas.
Avanços Revolucionários
O que torna o Wan 2.6 o divisor de águas na geração de vídeo com IA
Narrativa Multi-Planos
Primeiro modelo a compreender a lógica do storyboard. Gera automaticamente planos sequenciais com transições coerentes, mantendo a aparência do personagem e a consistência do ambiente através de mudanças de cena—permitindo arcos narrativos completos em uma única geração de 15 segundos.
Referência para Vídeo (R2V)
Carregue um vídeo de referência de 2-30 segundos para extrair e preservar a aparência do personagem, padrões de movimento e características de voz. Crie performances de personagens consistentes em múltiplos vídeos com precisão sem precedentes.
Renderização de Texto Precisa
Capacidades de renderização de texto líderes da indústria para embalagens de produtos, sinalização e conteúdo de marca. Gera texto claro e legível dentro dos quadros de vídeo—essencial para aplicações de marketing e comerciais.
Capacidades Principais
Duração Estendida de 15 Segundos
Gere até 15 segundos por vídeo com estrutura completa de "Três Atos" (Apresentação → Ação → Resolução)
Qualidade Profissional 1080p
Saída nativa de 1080p a 24fps com qualidade cinematográfica e estabilidade visual aprimorada
Sincronização de Áudio Nativa
Diálogo corresponde aos movimentos dos lábios, música de fundo alinhada com o ritmo, efeitos sonoros acionados perfeitamente
Consistência de Personagens
Mantenha aparência, figurino e identidade dos personagens através de planos e múltiplos vídeos
Controle de Câmera Cinematográfico
Movimentos de câmera profissionais incluindo panorâmicas, zooms, planos de acompanhamento e movimentos de dolly
Proporções de Tela Flexíveis
16:9 (YouTube), 9:16 (Reels), 1:1 (Quadrado) - otimizado para plataformas sem corte em pós-produção
Wan 2.6 vs Wan 2.5: Principais Melhorias
Veja as novidades no último lançamento
Três Modos de Geração Especializados
Escolha o modo adequado para seu fluxo de trabalho criativo
Texto para Vídeo (T2V)
Mais PopularGere vídeos completos a partir de prompts de texto com segmentação multi-planos aprimorada e manipulação de prompts melhorada. Perfeito para narrativa e exploração criativa.
- Segmentação automática de planos a partir de um único prompt
- Compreensão de interação multi-personagem
- Movimento de câmera e pistas emocionais
- Preservação de detalhes ambientais
Imagem para Vídeo (I2V)
AprimoradoTransforme imagens estáticas em vídeos em movimento com coerência de movimento melhorada. Ideal para showcases de produtos, animação de fotos e narrativa visual.
- Renderização de texto precisa para produtos
- Consistência de estilo entre quadros
- Movimento natural a partir de imagens estáticas
- Otimização visual orientada por narrativa
Referência para Vídeo (R2V)
NOVOCarregue um vídeo de referência (2-30s) para preservar aparência do personagem, padrões de movimento e voz. A garantia de consistência mais forte para conteúdo orientado por personagens.
- Preservação completa da identidade do personagem
- Extração de características de voz
- Replicação de padrões de movimento
- Cenas de co-atuação multi-personagem
Perfeito Para
Marketing e Publicidade
Demos de produtos com renderização de texto, campanhas de marca com consistência de personagens e vídeos promocionais
Criação de Conteúdo
Vídeos do YouTube, reels de redes sociais, narrativa multi-planos e fluxos de trabalho de edição de vídeo
E-commerce
Showcases de produtos com texto preciso, vídeos tutoriais e recriação de depoimentos de clientes
Educação e Treinamento
Conteúdo instrucional, materiais de cursos e narrativas educacionais multi-cena
Entretenimento
Curtas-metragens, histórias orientadas por personagens, sequências cinematográficas e experimentos criativos
Pré-visualização
Desenvolvimento de conceitos cinematográficos, criação de storyboards e planejamento de cenas para produções
Integração API Wan 2.6 T2V, I2V e R2V
Suíte completa de API para geração de Texto para Vídeo, Imagem para Vídeo e Referência para Vídeo
API de Texto para Vídeo (T2V API)
Nossa API Wan 2.6 T2V transforma prompts de texto em vídeos cinematográficos multi-planos com segmentação automática de cenas. Gere vídeos profissionais de 1080p até 15 segundos com sincronização de áudio nativa.
API de Imagem para Vídeo (I2V API)
Nossa API Wan 2.6 I2V dá vida a imagens estáticas com controle de movimento preciso e renderização de texto. Perfeito para vídeos de produtos, animação de fotos e criação de conteúdo de marca.
API de Referência para Vídeo (R2V API)
Nossa API Wan 2.6 R2V preserva a identidade do personagem a partir de vídeos de referência. Carregue clipes de 2-30 segundos para extrair aparência, voz e padrões de movimento para geração de personagens consistente.
Suíte Completa de API
Todos os três modos de API Wan 2.6 (T2V API, I2V API, R2V API) suportam arquitetura RESTful com documentação completa. Comece com SDKs para Python, Node.js e mais. Cada endpoint inclui sincronização audiovisual nativa e direitos completos de uso comercial.
Como Começar com Wan 2.6
Comece a criar vídeos profissionais em minutos com dois caminhos simples
Integração API
Para desenvolvedores que constroem aplicações
Registre-se e Faça Login
Crie sua conta Atlas Cloud ou faça login para acessar o console
Adicione Método de Pagamento
Vincule seu cartão de crédito na seção de Faturamento para financiar sua conta
Gere Chave API
Navegue até Console → Chaves API e crie sua chave de autenticação
Comece a Construir
Use endpoints de API T2V, I2V ou R2V para integrar Wan 2.6 em sua aplicação
Experiência Playground
Para testes rápidos e experimentação
Registre-se e Faça Login
Crie sua conta Atlas Cloud ou faça login para acessar a plataforma
Adicione Método de Pagamento
Vincule seu cartão de crédito na seção de Faturamento para começar
Use o Playground
Vá para o playground Wan 2.6, escolha modo T2V/I2V/R2V e gere vídeos instantaneamente
Perguntas Frequentes
O que torna a capacidade multi-planos do Wan 2.6 única?
Wan 2.6 é o primeiro modelo a realmente compreender a lógica do storyboard. Ao contrário do Wan 2.5 que criava efeitos de "morphing" desordenados, Wan 2.6 pode segmentar automaticamente um único prompt em múltiplos planos distintos com transições coerentes, mantendo a consistência do personagem através de mudanças de cena.
Como funciona Referência para Vídeo (R2V)?
Carregue um vídeo de referência de 2-30 segundos, e Wan 2.6 extrai a aparência do personagem, padrões de movimento e características de voz. Você pode então gerar novos vídeos apresentando o mesmo personagem com identidade consistente—ideal para criar séries de conteúdo orientadas por personagens.
Quais formatos e durações de vídeo são suportados?
Wan 2.6 gera vídeos de 1080p a 24fps com durações de 5 a 15 segundos. As proporções de tela suportadas incluem 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) e 1:1 (formato quadrado), otimizadas para cada plataforma sem exigir corte em pós-produção.
Wan 2.6 pode renderizar texto em vídeos?
Sim! Wan 2.6 possui renderização de texto líder da indústria para embalagens de produtos, sinalização e conteúdo de marca. O modelo pode gerar texto claro e legível dentro dos quadros de vídeo—uma característica crítica que Seedance e a maioria dos concorrentes não possuem.
Qual é a diferença entre modos T2V, I2V e R2V?
T2V (Texto para Vídeo) gera a partir de prompts de texto com capacidade multi-planos. I2V (Imagem para Vídeo) anima imagens estáticas com renderização de texto precisa. R2V (Referência para Vídeo) usa referências de vídeo para preservar a identidade do personagem entre gerações. Escolha com base no seu tipo de entrada e necessidades de consistência.
Tenho direitos comerciais sobre os vídeos gerados?
Sim! Cada criação Wan 2.6 vem com direitos completos de uso comercial. Os vídeos estão prontos para produção para campanhas de marketing, entregáveis a clientes, conteúdo de marca e aplicações comerciais sem requisitos de licenciamento adicional.
Por Que Usar Wan 2.6 no Atlas Cloud?
Aproveite infraestrutura de nível empresarial para seus fluxos de trabalho profissionais de geração de vídeo
Infraestrutura Construída com Propósito
Implante a geração multi-planos e capacidades R2V do Wan 2.6 em infraestrutura especificamente otimizada para cargas de trabalho exigentes de vídeo AI. Máximo desempenho para geração de 1080p de 15 segundos.
API Unificada para Todos os Modelos
Acesse Wan 2.6 (T2V, I2V, R2V) junto com mais de 300 modelos AI (LLMs, imagem, vídeo, áudio) através de uma API unificada. Integração única para todas as suas necessidades de IA generativa com autenticação consistente.
Preços Competitivos
Economize até 70% comparado com AWS com preços transparentes de pagamento conforme o uso. Sem taxas ocultas, sem compromissos—escale de protótipo a produção sem quebrar o banco.
Segurança Certificada SOC I & II
Seus vídeos de referência e conteúdo gerado protegidos com certificações SOC I & II e conformidade HIPAA. Segurança de nível empresarial com transmissão e armazenamento criptografados.
SLA de 99,9% de Tempo de Atividade
Confiabilidade de nível empresarial com garantia de 99,9% de tempo de atividade. Sua geração de vídeo multi-planos Wan 2.6 está sempre disponível para campanhas de produção e fluxos de trabalho de conteúdo crítico.
Integração Fácil
Integração completa em minutos com API REST e SDKs multi-linguagem (Python, Node.js, Go). Mude entre modos T2V, I2V e R2V perfeitamente com estrutura de endpoint unificada.
Especificações Técnicas
Experimente Geração de Vídeo Multi-Planos Profissional
Junte-se a criadores de conteúdo, profissionais de marketing e cineastas em todo o mundo que estão revolucionando a produção de vídeo com as capacidades revolucionárias de narrativa multi-planos e consistência de personagens do Wan 2.6.
Alibaba WAN 2.6 Video-to-Video Model
Alibaba WAN 2.6 is an advanced Video-to-Video model provided by Alibaba Cloud's DashScope platform. This model generates high-quality 480p/720p/1080p videos from text prompts.
What makes it stand out?
-
More affordable: Wan 2.6 is more streamlined and cost-effective - reducing creator expenses and offering more options.
-
One-pass A/V sync: Wan 2.6 creates a fully synchronized video (audio/voiceover + lip-sync) from a single, well-structured prompt - no separate recording or manual alignment required.
-
Multilingual friendly: Wan 2.6 reliably processes like Chinese prompts for A/V-synced videos.
-
Longer duration & more video size options: Wan 2.6 delivers up to 10 seconds and 6 aspect/size options, enabling more storytelling room and publishing flexibility.
-
Multi-shot storytelling: Generates cohesive multi-shot narratives, keeping key details consistent across shots and offering auto shot-split for simple prompts.
-
Video reference generation: Uses a reference video's appearance and voice to guide new videos; supports human or arbitrary subjects, single or dual performers.
-
15s long videos: Produces videos up to 15 seconds, expanding temporal capacity for richer storytelling.
Designed For
-
Marketing teams: Fast, polished demos/tutorials—low cost, consistent style.
-
Global enterprises: Multilingual, lip-synced videos with subtitles for efficient localization.
-
Storytellers & YouTubers: Immersive narratives while maintaining cadence and quality—driving growth.
-
Corporate training teams: HD videos over docs—clearer key points, better communication.
Pricing
The table below lists prices for easy comparsion.
| Output Resolution | Duration (5s) | Duration (10s) |
|---|---|---|
| 480p | $0.2 | $0.4 |
| 720p | $0.4 | $0.8 |
| 1080p | $0.6 | $1.2 |
Billing Rules
-
Minimum charge: 5 seconds
-
Per-second rate = (price per 5 seconds) ÷ 5
-
Billed duration = video length in seconds (rounded up), with a 5-second minimum
-
Total cost = billed duration × per-second rate (by output resolution)
How to Use
-
Write your prompt.
-
Upload an audio file (optional) for voice/music.
-
Choose the video size (resolution/aspect).
-
Select the video duration (e.g., 5s / 10s).
-
Submit and wait for processing.
-
Preview and download the result.






