Supports image editing and mixed text and image output to meet diverse generation and integration needs.
Supports image editing and mixed text and image output to meet diverse generation and integration needs.
Alibaba WAN 2.6 Image Edit enables you to upload an existing visual and specify the desired adjustments. The model preserves layout and subject structure while implementing high-quality updates based on natural language.
If you did not upload the image locally, please ensure that the image URL is accessible! A successfully accessible image will display a preview in the interface.
| Aspect Ratio | Exact (W×H) | Exact Pixels | Rounded (W×H, ÷64) | Rounded Pixels |
|---|---|---|---|---|
| 1:1 | 1448 × 1448 | 2,096,704 | 1408 × 1408 | 1,982,464 |
| 3:2 | 1773 × 1182 | 2,095,686 | 1728 × 1152 | 1,990,656 |
| 4:3 | 1672 × 1254 | 2,096,688 | 1664 × 1216 | 2,023,424 |
| 16:9 | 1936 × 1089 | 2,108,304 | 1920 × 1088 | 2,088,960 |
| 21:9 | 2212 × 948 | 2,096,976 | 2176 × 960 | 2,088,960 |
| 1:1 | 1024 × 1024 | 1,048,576 | 1024 × 1024 | 1,048,576 |
| 3:2 | 1254 × 836 | 1,048,344 | 1216 × 832 | 1,011,712 |
| 4:3 | 1182 × 887 | 1,048,434 | 1152 × 896 | 1,032,192 |
| 16:9 | 1365 × 768 | 1,048,320 | 1344 × 768 | 1,032,192 |
| 21:9 | 1564 × 670 | 1,047,880 | 1536 × 640 | 983,040 |
| 1:1 | 323 × 323 | 104,329 | 320 × 320 | 102,400 |
| 3:2 | 397 × 264 | 104,808 | 384 × 256 | 98,304 |
| 4:3 | 374 × 280 | 104,720 | 448 × 320 | 143,360 |
| 16:9 | 432 × 243 | 104,976 | 448 × 256 | 114,688 |
| 21:9 | 495 × 212 | 104,940 | 576 × 256 | 147,456 |
El último avance de Alibaba en generación de video con IA. Crea videos de hasta 15 segundos en 1080p con narración multi-toma, consistencia de personajes impulsada por referencias y sincronización audiovisual nativa. El primer modelo que verdaderamente comprende la lógica del storyboard para narrativas cinematográficas.
Lo que hace de Wan 2.6 el cambio de juego en generación de video con IA
Primer modelo que comprende la lógica del storyboard. Genera automáticamente tomas secuenciales con transiciones coherentes, manteniendo la apariencia del personaje y la consistencia del entorno a través de cambios de escena—permitiendo arcos narrativos completos en una sola generación de 15 segundos.
Sube un video de referencia de 2-30 segundos para extraer y preservar la apariencia del personaje, patrones de movimiento y características de voz. Crea interpretaciones de personajes consistentes en múltiples videos con precisión sin precedentes.
Capacidades de renderizado de texto líderes en la industria para empaques de productos, señalización y contenido de marca. Genera texto claro y legible dentro de los cuadros de video—esencial para aplicaciones de marketing y comerciales.
Genera hasta 15 segundos por video con estructura completa de "Tres Actos" (Planteamiento → Acción → Resolución)
Salida nativa de 1080p a 24fps con calidad cinematográfica y estabilidad visual mejorada
El diálogo coincide con los movimientos de los labios, la música de fondo se alinea con el ritmo, los efectos de sonido se activan perfectamente
Mantén la apariencia, vestuario e identidad de los personajes a través de tomas y múltiples videos
Movimientos de cámara profesionales incluyendo panorámicas, zooms, tomas de seguimiento y movimientos de dolly
16:9 (YouTube), 9:16 (Reels), 1:1 (Cuadrado) - optimizado para plataformas sin recorte en posproducción
Mira las novedades en el último lanzamiento
Elige el modo adecuado para tu flujo de trabajo creativo
Genera videos completos desde prompts de texto con segmentación multi-toma mejorada y manejo de prompts perfeccionado. Perfecto para narración y exploración creativa.
Transforma imágenes estáticas en videos en movimiento con coherencia de movimiento mejorada. Ideal para exhibiciones de productos, animación de fotos y narración visual.
Sube un video de referencia (2-30s) para preservar la apariencia del personaje, patrones de movimiento y voz. La garantía de consistencia más fuerte para contenido impulsado por personajes.
Demos de productos con renderizado de texto, campañas de marca con consistencia de personajes y videos promocionales
Videos de YouTube, reels de redes sociales, narración multi-toma y flujos de trabajo de edición de video
Exhibiciones de productos con texto preciso, videos tutoriales y recreación de testimonios de clientes
Contenido instruccional, materiales de cursos y narrativas educativas multi-escena
Cortometrajes, historias impulsadas por personajes, secuencias cinematográficas y experimentos creativos
Desarrollo de conceptos cinematográficos, creación de storyboards y planificación de escenas para producciones
Suite completa de API para generación de Texto a Video, Imagen a Video y Referencia a Video
Nuestra API Wan 2.6 T2V transforma prompts de texto en videos cinematográficos multi-toma con segmentación automática de escenas. Genera videos profesionales de 1080p hasta 15 segundos con sincronización de audio nativa.
Nuestra API Wan 2.6 I2V da vida a imágenes estáticas con control de movimiento preciso y renderizado de texto. Perfecto para videos de productos, animación de fotos y creación de contenido de marca.
Nuestra API Wan 2.6 R2V preserva la identidad del personaje desde videos de referencia. Sube clips de 2-30 segundos para extraer apariencia, voz y patrones de movimiento para generación de personajes consistente.
Los tres modos de API Wan 2.6 (T2V API, I2V API, R2V API) soportan arquitectura RESTful con documentación completa. Comienza con SDKs para Python, Node.js y más. Cada endpoint incluye sincronización audiovisual nativa y derechos completos de uso comercial.
Comienza a crear videos profesionales en minutos con dos rutas simples
Para desarrolladores que construyen aplicaciones
Crea tu cuenta de Atlas Cloud o inicia sesión para acceder a la consola
Vincula tu tarjeta de crédito en la sección de Facturación para fondear tu cuenta
Navega a Consola → Claves API y crea tu clave de autenticación
Usa endpoints de API T2V, I2V o R2V para integrar Wan 2.6 en tu aplicación
Para pruebas rápidas y experimentación
Crea tu cuenta de Atlas Cloud o inicia sesión para acceder a la plataforma
Vincula tu tarjeta de crédito en la sección de Facturación para comenzar
Ve al playground de Wan 2.6, elige modo T2V/I2V/R2V y genera videos instantáneamente
Wan 2.6 es el primer modelo que realmente comprende la lógica del storyboard. A diferencia de Wan 2.5 que creaba efectos de "morphing" desordenados, Wan 2.6 puede segmentar automáticamente un solo prompt en múltiples tomas distintas con transiciones coherentes, manteniendo la consistencia del personaje a través de cambios de escena.
Sube un video de referencia de 2-30 segundos, y Wan 2.6 extrae la apariencia del personaje, patrones de movimiento y características de voz. Luego puedes generar nuevos videos presentando al mismo personaje con identidad consistente—ideal para crear series de contenido impulsadas por personajes.
Wan 2.6 genera videos de 1080p a 24fps con duraciones de 5 a 15 segundos. Las relaciones de aspecto soportadas incluyen 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) y 1:1 (formato cuadrado), optimizadas para cada plataforma sin requerir recorte en posproducción.
¡Sí! Wan 2.6 cuenta con renderizado de texto líder en la industria para empaques de productos, señalización y contenido de marca. El modelo puede generar texto claro y legible dentro de los cuadros de video—una característica crítica que Seedance y la mayoría de competidores carecen.
T2V (Texto a Video) genera desde prompts de texto con capacidad multi-toma. I2V (Imagen a Video) anima imágenes estáticas con renderizado de texto preciso. R2V (Referencia a Video) usa referencias de video para preservar la identidad del personaje entre generaciones. Elige según tu tipo de entrada y necesidades de consistencia.
¡Sí! Cada creación de Wan 2.6 viene con derechos completos de uso comercial. Los videos están listos para producción para campañas de marketing, entregables a clientes, contenido de marca y aplicaciones comerciales sin requisitos de licencia adicionales.
Aprovecha infraestructura de grado empresarial para tus flujos de trabajo profesionales de generación de video
Despliega la generación multi-toma y capacidades R2V de Wan 2.6 en infraestructura específicamente optimizada para cargas de trabajo exigentes de video AI. Máximo rendimiento para generación de 1080p de 15 segundos.
Accede a Wan 2.6 (T2V, I2V, R2V) junto con más de 300 modelos AI (LLMs, imagen, video, audio) a través de una API unificada. Integración única para todas tus necesidades de IA generativa con autenticación consistente.
Ahorra hasta 70% comparado con AWS con precios transparentes de pago por uso. Sin tarifas ocultas, sin compromisos—escala desde prototipo a producción sin quebrar el banco.
Tus videos de referencia y contenido generado protegidos con certificaciones SOC I & II y cumplimiento HIPAA. Seguridad de grado empresarial con transmisión y almacenamiento encriptados.
Confiabilidad de grado empresarial con garantía de 99.9% de tiempo de actividad. Tu generación de video multi-toma Wan 2.6 está siempre disponible para campañas de producción y flujos de trabajo de contenido crítico.
Integración completa en minutos con API REST y SDKs multi-lenguaje (Python, Node.js, Go). Cambia entre modos T2V, I2V y R2V sin problemas con estructura de endpoint unificada.
Únete a creadores de contenido, marketers y cineastas en todo el mundo que están revolucionando la producción de video con las capacidades revolucionarias de narración multi-toma y consistencia de personajes de Wan 2.6.
Todo en Atlas Cloud.