alibaba/wan-2.6/image-to-video

Imagen a Video

Wan 2.6 Image-to-Video API by Alibaba

alibaba/wan-2.6/image-to-video

Image-to-video

A speed-optimized image-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.

Entrada

Cargando configuración de parámetros...

Salida

Inactivo

Los videos generados se mostrarán aquí

Configura los parámetros y haz clic en ejecutar para comenzar a generar

Cada ejecución costará $0.07. Con $10 puedes ejecutar aproximadamente 142 veces.

Puedes continuar con:

Seedance 2.0 Kling v3 Vidu Wan2.7

Parámetros

Ejemplo de código
import requests
import time

# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "alibaba/wan-2.6/image-to-video",
    "prompt": "A beautiful sunset over the ocean with gentle waves",
    "width": 512,
    "height": 512,
    "duration": 3,
    "fps": 24,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] in ["completed", "succeeded"]:
            print("Generated video:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

video_url = check_status()

Instalar

Instala el paquete de dependencias necesario.

pip install requests

Autenticación

Todas las solicitudes de API requieren autenticación mediante una clave de API. Puedes obtener tu clave de API desde el panel de Atlas Cloud.

export ATLASCLOUD_API_KEY="your-api-key-here"

Encabezados HTTP

import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}

Mantén tu clave de API segura

Nunca expongas tu clave de API en código del lado del cliente ni en repositorios públicos. Usa variables de entorno o un proxy de backend en su lugar.

Enviar una solicitud

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Enviar una solicitud

Envía una solicitud de generación asíncrona. La API devuelve un ID de predicción que puedes usar para verificar el estado y obtener el resultado.

POST/api/v1/model/generateVideo

Cuerpo de la solicitud

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "alibaba/wan-2.6/image-to-video",
    "prompt": "A beautiful sunset over the ocean with gentle waves"
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['data']['id']}")
print(f"Status: {result['data']['status']}")

Respuesta

{
  "code": 200,
  "data": {
    "id": "pred_abc123",
    "status": "processing",
    "model": "model-name",
    "created_at": "2025-01-01T00:00:00Z"
  }
}

Verificar estado

Consulta el endpoint de predicción para verificar el estado actual de tu solicitud.

GET/api/v1/model/prediction/{prediction_id}

Ejemplo de polling

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

Valores de estado

processingLa solicitud aún se está procesando.

completedLa generación está completa. Las salidas están disponibles.

succeededLa generación fue exitosa. Las salidas están disponibles.

failedLa generación falló. Verifica el campo de error.

Respuesta completada

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.mp4"
    ],
    "metrics": {
      "predict_time": 45.2
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

Subir archivos

Sube archivos al almacenamiento de Atlas Cloud y obtén una URL que puedes usar en tus solicitudes de API. Usa multipart/form-data para subir.

POST/api/v1/model/uploadMedia

Ejemplo de carga

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

Respuesta

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

Schema de entrada

Los siguientes parámetros se aceptan en el cuerpo de la solicitud.

Total: 0Obligatorio: 0Opcional: 0

No hay parámetros disponibles.

Ejemplo de cuerpo de solicitud

{
  "model": "alibaba/wan-2.6/image-to-video"
}

Schema de salida

La API devuelve una respuesta de predicción con las URL de salida generadas.

idstringrequired

Unique identifier for the prediction.

statusstringrequired

Current status of the prediction.

processingcompletedsucceededfailed

modelstringrequired

The model used for generation.

outputsarray[string]

Array of output URLs. Available when status is "completed".

errorstring

Error message if status is "failed".

metricsobject

Performance metrics.

predict_timenumber

Time taken for video generation in seconds.

created_atstringrequired

ISO 8601 timestamp when the prediction was created.

Format: date-time

completed_atstring

ISO 8601 timestamp when the prediction was completed.

Format: date-time

Ejemplo de respuesta

{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.mp4"
  ],
  "metrics": {
    "predict_time": 45.2
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills integra más de 300 modelos de IA directamente en tu asistente de codificación con IA. Un solo comando para instalar y luego usa lenguaje natural para generar imágenes, videos y chatear con LLM.

Clientes compatibles

Claude Code

OpenAI Codex

Gemini CLI

Cursor

Windsurf

VS Code

Trae

GitHub Copilot

Cline

Roo Code

Amp

Goose

Replit

40+ clientes compatibles

Instalar

npx skills add AtlasCloudAI/atlas-cloud-skills

Configurar clave de API

Obtén tu clave de API desde el panel de Atlas Cloud y configúrala como variable de entorno.

export ATLASCLOUD_API_KEY="your-api-key-here"

Funcionalidades

Una vez instalado, puedes usar lenguaje natural en tu asistente de IA para acceder a todos los modelos de Atlas Cloud.

Generación de imágenesGenera imágenes con modelos como Nano Banana 2, Z-Image y más.

Creación de videosCrea videos a partir de texto o imágenes con Kling, Vidu, Veo, etc.

Chat con LLMChatea con Qwen, DeepSeek y otros modelos de lenguaje de gran escala.

Carga de mediosSube archivos locales para flujos de trabajo de edición de imágenes e imagen a video.

Más información

github.com/AtlasCloudAI/atlas-cloud-skills

MCP Server

Atlas Cloud MCP Server conecta tu IDE con más de 300 modelos de IA a través del Model Context Protocol. Funciona con cualquier cliente compatible con MCP.

Clientes compatibles

Cursor

VS Code

Windsurf

Claude Code

OpenAI Codex

Gemini CLI

Cline

Roo Code

100+ clientes compatibles

Instalar

npx -y atlascloud-mcp

Configuración

Agrega la siguiente configuración al archivo de configuración de MCP de tu IDE.

{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

Herramientas disponibles

atlas_generate_imageGenera imágenes a partir de indicaciones de texto.

atlas_generate_videoCrea videos a partir de texto o imágenes.

atlas_chatChatea con modelos de lenguaje de gran escala.

atlas_list_modelsExplora más de 300 modelos de IA disponibles.

atlas_quick_generateCreación de contenido en un solo paso con selección automática de modelo.

atlas_upload_mediaSube archivos locales para flujos de trabajo de API.

Más información

github.com/AtlasCloudAI/mcp-server

API Schema

Schema no disponible

Sin ejemplos disponibles

Cargando...

🎬GENERACIÓN DE VIDEO MULTI-TOMA

Wan 2.6Creación profesional de video con IA multi-toma

El último avance de Alibaba en generación de video con IA. Crea videos de hasta 15 segundos en 1080p con narrativa multi-toma, consistencia de personajes guiada por referencias y sincronización audiovisual nativa. El primer modelo que realmente comprende la lógica del storyboard para narrativas cinematográficas.

Avances Revolucionarios

Lo que convierte a Wan 2.6 en un cambio radical para la generación de video con IA

Narración Multi-Toma

El primer modelo que comprende la lógica del storyboard. Genera automáticamente tomas secuenciales con transiciones fluidas, manteniendo la apariencia de los personajes y la consistencia del entorno a lo largo de los cambios de escena: permite arcos narrativos completos en una sola generación de 15 segundos.

Referencia a Video (R2V)

Sube un video de referencia de 2-30 segundos para extraer y preservar la apariencia del personaje, los patrones de movimiento y las características de voz. Crea interpretaciones de personajes coherentes en múltiples videos con una precisión sin precedentes.

Renderizado de Texto Preciso

Capacidades de renderizado de texto líderes en la industria para empaques de productos, señalización y contenido de marca. Genera texto claro y legible dentro de los fotogramas del video: algo esencial para aplicaciones de marketing y comerciales.

Capacidades Principales

Duración Extendida de 15 Segundos

Genera hasta 15 segundos por video con una estructura completa de «tres actos» (planteamiento → acción → desenlace)

Calidad Profesional 1080p

Salida nativa de 1080p a 24fps con calidad cinematográfica y estabilidad visual mejorada

Sincronización de Audio Nativa

Los diálogos coinciden con el movimiento de los labios, la música de fondo se ajusta al ritmo y los efectos de sonido se activan a la perfección

Consistencia de Personajes

Mantén la apariencia, el vestuario y la identidad de los personajes a lo largo de las tomas y en múltiples videos

Control de Cámara Cinematográfico

Movimientos de cámara profesionales, incluyendo paneos, zooms, tomas de seguimiento y travellings

Relaciones de Aspecto Flexibles

16:9 (YouTube), 9:16 (Reels), 1:1 (cuadrado): optimizado para cada plataforma, sin recorte en posproducción

Wan 2.6 vs Wan 2.5: Mejoras Principales

Descubre las novedades de la última versión

Duración del Video

Hasta 15 segundos

Wan 2.5: Máximo 10 segundos

Capacidad Multi-Toma

Comprende lógica de storyboard

Wan 2.5: toma única o transformaciones caóticas

Soporte de Video de Referencia

Modo R2V con preservación completa

Wan 2.5: Solo referencia de imagen

Consistencia de Personajes

Excelente entre tomas

Wan 2.5: problemas de deriva de personajes

Estabilidad de Movimiento

Menos vibración y artefactos

Wan 2.5: deriva de fotogramas ocasional

Comprensión de Prompts

Escenas complejas con múltiples personajes

Wan 2.5: Generación de escenas básica

Tres Modos de Generación Especializados

Elige el modo adecuado para tu flujo de trabajo creativo

Texto a Video (T2V)

Más Popular

Genera videos completos a partir de prompts de texto, con segmentación multi-toma mejorada y un manejo de prompts perfeccionado. Ideal para la narrativa y la exploración creativa.

Segmentación automática de tomas a partir de un solo prompt
Comprensión de la interacción entre múltiples personajes
Movimiento de cámara y señales emocionales
Preservación de los detalles del entorno

Imagen a Video (I2V)

Mejorado

Convierte imágenes estáticas en videos en movimiento con una coherencia de movimiento mejorada. Ideal para mostrar productos, animar fotos y crear narrativas visuales.

Renderizado de texto preciso para productos
Consistencia de estilo entre fotogramas
Movimiento natural a partir de imágenes estáticas
Optimización visual guiada por la narrativa

Referencia a Video (R2V)

NUEVO

Sube un video de referencia (2-30 s) para preservar la apariencia del personaje, los patrones de movimiento y la voz. La garantía de consistencia más sólida para contenido protagonizado por personajes.

Preservación completa de la identidad del personaje
Extracción de características de voz
Replicación de patrones de movimiento
Escenas con interacción entre múltiples personajes

Perfecto Para

Marketing y Publicidad

Demostraciones de productos con renderizado de texto, campañas de marca con consistencia de personajes y videos promocionales

Creación de Contenido

Videos de YouTube, reels para redes sociales, narrativa multi-toma y flujos de trabajo de edición de video

Comercio Electrónico

Exhibiciones de productos con texto preciso, videos tutoriales y recreación de testimonios de clientes

Educación y Capacitación

Contenido didáctico, materiales de cursos y narrativas educativas con múltiples escenas

Entretenimiento

Cortometrajes, historias protagonizadas por personajes, secuencias cinematográficas y experimentos creativos

Previsualización

Desarrollo de conceptos cinematográficos, creación de storyboards y planificación de escenas para producciones

Integración API de Wan 2.6 T2V, I2V y R2V

Suite de API completa para generación de texto a video, imagen a video y referencia a video

API de Texto a Video (T2V API)

Nuestra API de Wan 2.6 T2V convierte prompts de texto en videos cinematográficos multi-toma con segmentación automática de escenas. Genera videos profesionales en 1080p de hasta 15 segundos con sincronización de audio nativa.

Narrativa multi-toma a partir de un solo prompt

Duración de 15 segundos con estructura de tres actos

Comprensión mejorada de prompts para escenas complejas

Relaciones de aspecto flexibles: 16:9, 9:16, 1:1

API de Imagen a Video (I2V API)

Nuestra API de Wan 2.6 I2V da vida a las imágenes estáticas con un control de movimiento preciso y renderizado de texto. Ideal para videos de productos, animación de fotos y creación de contenido de marca.

Renderizado de texto preciso para productos y señalización

Consistencia de estilo entre los fotogramas de la animación

Movimiento natural con mayor coherencia

Salida visual optimizada según la narrativa

API de Referencia a Video (R2V API)

Nuestra API de Wan 2.6 R2V preserva la identidad del personaje a partir de videos de referencia. Sube clips de 2-30 segundos para extraer la apariencia, la voz y los patrones de movimiento, y lograr una generación de personajes coherente.

Preservación de la apariencia y la identidad del personaje

Extracción y replicación de las características de voz

Análisis y reproducción de los patrones de movimiento

Compatibilidad con escenas de múltiples personajes

💡

Suite Completa de API

Los tres modos de API de Wan 2.6 (T2V API, I2V API, R2V API) son compatibles con arquitectura RESTful y cuentan con documentación completa. Empieza rápido con SDKs para Python, Node.js y más. Cada endpoint incluye sincronización audiovisual nativa y plenos derechos de uso comercial.

Cómo Empezar con Wan 2.6

Empieza a crear videos profesionales en cuestión de minutos con dos rutas sencillas

Integración API

Para desarrolladores que crean aplicaciones

Regístrate e Inicia Sesión

Crea tu cuenta de Atlas Cloud o inicia sesión para acceder a la consola

Agrega Método de Pago

Vincula tu tarjeta de crédito en la sección de Facturación para recargar tu cuenta

Genera tu clave API

Ve a Consola → API Keys y crea tu clave de autenticación

Comienza a Construir

Usa los endpoints de API T2V, I2V o R2V para integrar Wan 2.6 en tu aplicación

Experiencia Playground

Para pruebas rápidas y experimentación

Regístrate e Inicia Sesión

Crea tu cuenta de Atlas Cloud o inicia sesión para acceder a la plataforma

Agrega Método de Pago

Vincula tu tarjeta de crédito en la sección de Facturación para comenzar

Usa el Playground

Ve al playground de Wan 2.6, elige el modo T2V/I2V/R2V y genera videos al instante

💡

Consejo profesional: prueba primero los distintos modos de generación en el Playground para descubrir cuál se adapta mejor a tu caso de uso, y luego integra la API correspondiente para escalar a producción.

Preguntas Frecuentes

¿Qué hace única la capacidad multi-toma de Wan 2.6?

Wan 2.6 es el primer modelo que realmente comprende la lógica del storyboard. A diferencia de Wan 2.5, que generaba efectos de «transformación» caóticos, Wan 2.6 puede segmentar automáticamente un solo prompt en múltiples tomas diferenciadas con transiciones coherentes, manteniendo la consistencia de los personajes a lo largo de los cambios de escena.

¿Cómo funciona Referencia a Video (R2V)?

Sube un video de referencia de 2-30 segundos y Wan 2.6 extraerá la apariencia, los patrones de movimiento y las características de voz del personaje. Luego podrás generar nuevos videos protagonizados por el mismo personaje con una identidad coherente: ideal para crear series de contenido protagonizadas por personajes.

¿Qué formatos y duraciones de video se soportan?

Wan 2.6 genera videos en 1080p a 24fps con duraciones de 5 a 15 segundos. Las relaciones de aspecto compatibles incluyen 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) y 1:1 (formato cuadrado), optimizadas para cada plataforma sin necesidad de recorte en posproducción.

¿Puede Wan 2.6 renderizar texto en videos?

¡Sí! Wan 2.6 cuenta con un renderizado de texto líder en la industria para empaques de productos, señalización y contenido de marca. El modelo puede generar texto claro y legible dentro de los fotogramas del video: una función clave de la que carecen Seedance y la mayoría de los competidores.

¿Cuál es la diferencia entre modos T2V, I2V y R2V?

T2V (texto a video) genera a partir de prompts de texto con capacidad multi-toma. I2V (imagen a video) anima imágenes estáticas con renderizado de texto preciso. R2V (referencia a video) usa videos de referencia para preservar la identidad del personaje entre generaciones. Elige según tu tipo de entrada y tus necesidades de consistencia.

¿Tengo derechos comerciales sobre los videos generados?

¡Sí! Cada creación de Wan 2.6 incluye plenos derechos de uso comercial. Los videos están listos para producción y pueden usarse en campañas de marketing, entregables para clientes, contenido de marca y aplicaciones comerciales sin requisitos de licencia adicionales.

¿Por Qué Usar Wan 2.6 en Atlas Cloud?

Aprovecha una infraestructura de nivel empresarial para tus flujos de trabajo profesionales de generación de video

Infraestructura específicamente diseñada

Despliega la generación multi-toma y las capacidades R2V de Wan 2.6 sobre una infraestructura optimizada específicamente para cargas de trabajo de video con IA de alta exigencia. Máximo rendimiento para la generación de 15 segundos en 1080p.

API Unificada para Todos los Modelos

Accede a Wan 2.6 (T2V, I2V, R2V) junto con más de 300 modelos de IA (LLM, imagen, video, audio) a través de una única API unificada. Una sola integración para todas tus necesidades de IA generativa, con autenticación coherente.

Precios Competitivos

Ahorra hasta un 70 % frente a AWS con precios transparentes y de pago por uso. Sin tarifas ocultas ni compromisos: escala del prototipo a la producción sin disparar tus costos.

Seguridad Certificada SOC I & II

Tus videos de referencia y el contenido generado están protegidos con las certificaciones SOC I y II y el cumplimiento de HIPAA. Seguridad de nivel empresarial con transmisión y almacenamiento cifrados.

SLA de 99.9% de Tiempo de Actividad

Fiabilidad de nivel empresarial con una disponibilidad garantizada del 99,9 %. Tu generación de video multi-toma con Wan 2.6 está siempre disponible para campañas de producción y flujos de trabajo de contenido crítico.

Integración Fácil

Integración completa en cuestión de minutos con API REST y SDKs multilenguaje (Python, Node.js, Go). Cambia entre los modos T2V, I2V y R2V sin complicaciones gracias a una estructura de endpoints unificada.

99.9%

Tiempo de Actividad

70%

Menor costo frente a AWS

300+

Modelos de IA Generativa

24/7

Soporte Pro

Especificaciones Técnicas

Architecture

Transformer avanzado con comprensión multimodal

Resolution

1080p (Full HD)

Frame Rate

24 FPS

Duration

5-15 segundos (según el modo)

Aspect Ratios

16:9, 9:16, 1:1

Generation Modes

T2V, I2V, R2V

Audio

Sincronización nativa con lip-sync

Commercial Rights

Uso comercial completo incluido

Experimenta la Generación de Video Multi-Toma Profesional

Únete a creadores de contenido, profesionales del marketing y cineastas de todo el mundo que están revolucionando la producción de video con las innovadoras capacidades de narrativa multi-toma y consistencia de personajes de Wan 2.6.

Alibaba WAN 2.6 Image-to-Video Model

Alibaba WAN 2.6 is an advanced image-to-video model on Alibaba Cloud’s DashScope. It generates high-quality videos from images and supports output resolutions of 720p and 1080p.

What makes it stand out?

More affordable: Wan 2.6 is more streamlined and cost-effective - reducing creator expenses and offering more options.
One-pass A/V sync: Wan 2.6 creates a fully synchronized video (audio/voiceover + lip-sync) from a single, well-structured prompt - no separate recording or manual alignment required.
Multilingual friendly: Wan 2.6 reliably processes like Chinese prompts for A/V-synced videos.
Longer duration & more video size options: Wan 2.6 delivers up to 10 seconds and 6 aspect/size options, enabling more storytelling room and publishing flexibility.
Multi-shot storytelling: Generates cohesive multi-shot narratives, keeping key details consistent across shots and offering auto shot-split for simple prompts.
Video reference generation: Uses a reference video's appearance and voice to guide new videos; supports human or arbitrary subjects, single or dual performers.
15s long videos: Produces videos up to 15 seconds, expanding temporal capacity for richer storytelling.

Designed For

Marketing teams: Fast, polished demos/tutorials—low cost, consistent style.
Global enterprises: Multilingual, lip-synced videos with subtitles for efficient localization.
Storytellers & YouTubers: Immersive narratives while maintaining cadence and quality—driving growth.
Corporate training teams: HD videos over docs—clearer key points, better communication.

Pricing

The table below lists prices for easy comparsion.

Output Resolution	Duration (5s)	Duration (10s)
720p	$0.5	$1
1080p	$0.75	$1.5

Billing Rules

Minimum charge: 5 seconds
Per-second rate = (price per 5 seconds) ÷ 5
Billed duration = video length in seconds (rounded up), with a 5-second minimum
Total cost = billed duration × per-second rate (by output resolution)

How to Use

Write your prompt.
Upload an audio file (optional) for voice/music.
Choose the video size (resolution/aspect).
Select the video duration (e.g., 5s / 10s).
Submit and wait for processing.
Preview and download the result.

Explorar Modelos Similares

NEW

HOT

Texto a Video

Van-2.6 Text-to-video

A speed-optimized text-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.

Van-2.6 Image-to-video

A speed-optimized image-to-video option that prioritizes lower latency while retaining strong visual fidelity. Ideal for iteration, batch generation, and prompt testing.

HappyHorse-1.1 Reference-to-video

Generates videos from one to nine reference images and a text prompt, supporting 720P or 1080P output, flexible aspect ratios, and durations from 3 to 15 seconds.

HappyHorse-1.1 Image-to-video

Animates a first-frame image into video with optional prompt guidance, 720P or 1080P output, and durations from 3 to 15 seconds.

HappyHorse-1.1 Text-to-video

Generates videos from text prompts with HappyHorse 1.1, supporting 720P or 1080P output, flexible aspect ratios, and durations from 3 to 15 seconds.

HappyHorse-1.0 Image-to-video

Animates a first-frame image into video with optional prompt guidance, 720P or 1080P output, and durations from 3 to 15 seconds.

HappyHorse-1.0 Text-to-video

Generates videos from text prompts with HappyHorse 1.0, supporting 720P or 1080P output, flexible aspect ratios, and durations from 3 to 15 seconds.

HappyHorse-1.0 Video-edit

Edits an input video with text instructions and optional reference images, supporting 720P or 1080P output.

HappyHorse-1.0 Reference-to-video

Generates videos from one to nine reference images and a text prompt, supporting 720P or 1080P output, flexible aspect ratios, and durations from 3 to 15 seconds.

From

$0.14/segundo