alibaba/wan-2.6/image-edit

Supports image editing and mixed text and image output to meet diverse generation and integration needs.

IMAGE-TO-IMAGEHOTNEW
изображение-в-изображение

Supports image editing and mixed text and image output to meet diverse generation and integration needs.

Alibaba WAN 2.6 Image Edit

Alibaba WAN 2.6 Image Edit enables you to upload an existing visual and specify the desired adjustments. The model preserves layout and subject structure while implementing high-quality updates based on natural language.

Why creators love it

  • Structure-preserving edits: Make lighting, color, or object changes without breaking composition.
  • Text-guided styling: Reimagine materials, moods, or art styles with concise prompts.
  • Prompt expansion on demand: Enable automatic prompt enrichment when you need extra detail.
  • Flexible output sizes: Pick the resolution that best matches your downstream workflow.

Perfect for

  • Marketing and design teams refining campaign visuals.
  • E-commerce sellers upgrading product imagery.
  • Content creators polishing thumbnails, covers, and posts.
  • Artists experimenting with variations of their original work.

Billing rules

  • Minimum charge: 1 image.
  • Total cost = number of images × price per resolution.

How to use

  1. Provide the image you want to refine. (Image dimensions must be in (384, 5000))
  2. Describe the desired adjustments in the prompt.
  3. Choose the target resolution and submit.
  4. Review the enhanced output and download the version you like best.

Pro tips

  • Start with clear instructions about colors, lighting, or objects to adjust.
  • Pair positive and negative prompts to control what should or should not appear.
  • Keep source images at or above your target resolution for optimal fidelity.

Note

If you did not upload the image locally, please ensure that the image URL is accessible! A successfully accessible image will display a preview in the interface.


Aspect RatioExact (W×H)Exact PixelsRounded (W×H, ÷64)Rounded Pixels
1:11448 × 14482,096,7041408 × 14081,982,464
3:21773 × 11822,095,6861728 × 11521,990,656
4:31672 × 12542,096,6881664 × 12162,023,424
16:91936 × 10892,108,3041920 × 10882,088,960
21:92212 × 9482,096,9762176 × 9602,088,960
1:11024 × 10241,048,5761024 × 10241,048,576
3:21254 × 8361,048,3441216 × 8321,011,712
4:31182 × 8871,048,4341152 × 8961,032,192
16:91365 × 7681,048,3201344 × 7681,032,192
21:91564 × 6701,047,8801536 × 640983,040
1:1323 × 323104,329320 × 320102,400
3:2397 × 264104,808384 × 25698,304
4:3374 × 280104,720448 × 320143,360
16:9432 × 243104,976448 × 256114,688
21:9495 × 212104,940576 × 256147,456

Подробные характеристики

Обзор:

Разработчик модели:QWEN
Тип модели:image-to-image
Развертывание:API вывода; Playground
Цены:$0.021/pic

Ключевые параметры:

Ограничение размера:до ширина × высота (настраивается пользователем)
Поддержка LoRA:Нет
Параметры seed:N/A

Создайте свой шедевр

🎬ГЕНЕРАЦИЯ МНОГОКАДРОВОГО ВИДЕО

Wan 2.6Профессиональное Создание Многокадрового AI-Видео

Новейший прорыв Alibaba в генерации AI-видео. Создавайте видео 1080p длительностью до 15 секунд с многокадровым повествованием, согласованностью персонажей на основе референсов и нативной аудиовизуальной синхронизацией. Первая модель, которая по-настоящему понимает логику раскадровки для кинематографического повествования.

Революционные Прорывы

Что делает Wan 2.6 переломным моментом в генерации AI-видео

Многокадровое Повествование

Первая модель, понимающая логику раскадровки. Автоматически генерирует последовательные кадры с согласованными переходами, сохраняя внешность персонажа и согласованность окружения при смене сцен—обеспечивая полные сюжетные арки в одной 15-секундной генерации.

Референс в Видео (R2V)

Загрузите референсное видео длительностью 2-30 секунд для извлечения и сохранения внешности персонажа, паттернов движения и голосовых характеристик. Создавайте согласованные выступления персонажей в нескольких видео с беспрецедентной точностью.

Точная Визуализация Текста

Ведущие в отрасли возможности визуализации текста для упаковки продукции, вывесок и брендированного контента. Генерируйте четкий, читаемый текст внутри видеокадров—необходимо для маркетинговых и коммерческих приложений.

Основные Возможности

Расширенная Длительность 15 Секунд

Генерируйте до 15 секунд на видео с полной структурой "Трёх Актов" (Завязка → Действие → Развязка)

Профессиональное Качество 1080p

Нативный вывод 1080p при 24fps с кинематографическим качеством и улучшенной визуальной стабильностью

Нативная Синхронизация Звука

Диалог соответствует движениям губ, фоновая музыка выравнивается с темпом, звуковые эффекты срабатывают идеально

Согласованность Персонажей

Сохраняйте внешность, костюмы и идентичность персонажей в кадрах и нескольких видео

Кинематографический Контроль Камеры

Профессиональные движения камеры, включая панорамирование, зуммирование, следящие кадры и движения на тележке

Гибкие Соотношения Сторон

16:9 (YouTube), 9:16 (Reels), 1:1 (Квадрат) - оптимизировано для платформ без постобработки обрезки

Wan 2.6 vs Wan 2.5: Основные Улучшения

Посмотрите, что нового в последнем релизе

Длительность Видео
До 15 секунд
Wan 2.5: Максимум 10 секунд
Многокадровая Способность
Понимает логику раскадровки
Wan 2.5: Один кадр или беспорядочный морфинг
Поддержка Референсного Видео
Режим R2V с полным сохранением
Wan 2.5: Только изображение-референс
Согласованность Персонажей
Отличная между кадрами
Wan 2.5: Проблемы дрейфа персонажей
Стабильность Движения
Уменьшенная дрожь и артефакты
Wan 2.5: Случайный дрейф кадров
Понимание Промптов
Сложные многоперсонажные сцены
Wan 2.5: Базовая генерация сцен

Три Специализированных Режима Генерации

Выберите правильный режим для вашего творческого рабочего процесса

Текст в Видео (T2V)

Самый Популярный

Генерируйте полные видео из текстовых промптов с улучшенной многокадровой сегментацией и усовершенствованной обработкой промптов. Идеально для повествования и творческого исследования.

  • Автоматическая сегментация кадров из одного промпта
  • Понимание многоперсонажного взаимодействия
  • Движение камеры и эмоциональные подсказки
  • Сохранение деталей окружения

Изображение в Видео (I2V)

Улучшенный

Превращайте неподвижные изображения в движущиеся видео с улучшенной согласованностью движения. Идеально для демонстраций продуктов, анимации фотографий и визуального повествования.

  • Точная визуализация текста для продуктов
  • Согласованность стиля во всех кадрах
  • Естественное движение из неподвижных изображений
  • Визуальная оптимизация, управляемая повествованием

Референс в Видео (R2V)

НОВЫЙ

Загрузите референсное видео (2-30с) для сохранения внешности персонажа, паттернов движения и голоса. Самая сильная гарантия согласованности для контента, управляемого персонажами.

  • Полное сохранение идентичности персонажа
  • Извлечение голосовых характеристик
  • Репликация паттернов движения
  • Сцены совместной игры нескольких персонажей

Идеально Для

Маркетинг и Реклама

Демонстрации продуктов с визуализацией текста, брендовые кампании с согласованностью персонажей и рекламные видео

Создание Контента

YouTube-видео, социальные сети reels, многокадровое повествование и рабочие процессы редактирования видео

Электронная Коммерция

Демонстрации продуктов с точным текстом, обучающие видео и воссоздание отзывов клиентов

Образование и Обучение

Обучающий контент, курсовые материалы и многосценовые образовательные повествования

Развлечения

Короткометражные фильмы, истории, управляемые персонажами, кинематографические последовательности и творческие эксперименты

Превизуализация

Разработка кинематографических концепций, создание раскадровок и планирование сцен для производства

Интеграция Wan 2.6 T2V, I2V и R2V API

Полный набор API для генерации Текст в Видео, Изображение в Видео и Референс в Видео

API Текст в Видео (T2V API)

Наш Wan 2.6 T2V API преобразует текстовые промпты в многокадровые кинематографические видео с автоматической сегментацией сцен. Генерируйте профессиональные видео 1080p до 15 секунд с нативной синхронизацией звука.

Многокадровое повествование из одного промпта
15-секундная длительность со структурой Трёх Актов
Улучшенное понимание промптов для сложных сцен
Гибкие соотношения сторон: 16:9, 9:16, 1:1

API Изображение в Видео (I2V API)

Наш Wan 2.6 I2V API оживляет неподвижные изображения с точным контролем движения и визуализацией текста. Идеально для продуктовых видео, анимации фотографий и создания брендированного контента.

Точная визуализация текста для продуктов и вывесок
Согласованность стиля в анимационных кадрах
Естественное движение с улучшенной согласованностью
Визуальный вывод, оптимизированный повествованием

API Референс в Видео (R2V API)

Наш Wan 2.6 R2V API сохраняет идентичность персонажа из референсных видео. Загружайте 2-30-секундные клипы для извлечения внешности, голоса и паттернов движения для согласованной генерации персонажей.

Сохранение внешности и идентичности персонажа
Извлечение и репликация голосовых характеристик
Анализ и воспроизведение паттернов движения
Поддержка многоперсонажных сцен
💡

Полный Набор API

Все три режима Wan 2.6 API (T2V API, I2V API, R2V API) поддерживают RESTful-архитектуру с полной документацией. Начните с SDK для Python, Node.js и других. Каждая конечная точка включает нативную аудиовизуальную синхронизацию и полные права на коммерческое использование.

Как Начать с Wan 2.6

Начните создавать профессиональные видео за считанные минуты двумя простыми путями

Интеграция API

Для разработчиков, создающих приложения

1

Зарегистрируйтесь и Войдите

Создайте свой аккаунт Atlas Cloud или войдите для доступа к консоли

2

Добавьте Способ Оплаты

Привяжите свою кредитную карту в разделе Биллинг для пополнения счёта

3

Сгенерируйте API Ключ

Перейдите в Консоль → API Ключи и создайте свой ключ аутентификации

4

Начните Создавать

Используйте конечные точки T2V, I2V или R2V API для интеграции Wan 2.6 в ваше приложение

Опыт Playground

Для быстрого тестирования и экспериментов

1

Зарегистрируйтесь и Войдите

Создайте свой аккаунт Atlas Cloud или войдите для доступа к платформе

2

Добавьте Способ Оплаты

Привяжите свою кредитную карту в разделе Биллинг для начала

3

Используйте Playground

Перейдите в Wan 2.6 playground, выберите режим T2V/I2V/R2V и генерируйте видео мгновенно

💡
Профессиональный Совет: Сначала протестируйте различные режимы генерации в Playground, чтобы понять, какой лучше всего подходит для вашего случая использования, затем интегрируйте соответствующий API для производственного масштаба.

Часто Задаваемые Вопросы

Что делает многокадровую способность Wan 2.6 уникальной?

Wan 2.6 - это первая модель, которая по-настоящему понимает логику раскадровки. В отличие от Wan 2.5, который создавал беспорядочные эффекты "морфинга", Wan 2.6 может автоматически сегментировать один промпт на несколько отдельных кадров с согласованными переходами, сохраняя согласованность персонажей при смене сцен.

Как работает Референс в Видео (R2V)?

Загрузите референсное видео длительностью 2-30 секунд, и Wan 2.6 извлечёт внешность персонажа, паттерны движения и голосовые характеристики. Затем вы можете генерировать новые видео с тем же персонажем с согласованной идентичностью—идеально для создания серий контента, управляемого персонажами.

Какие форматы и длительности видео поддерживаются?

Wan 2.6 генерирует видео 1080p при 24fps с длительностью от 5 до 15 секунд. Поддерживаемые соотношения сторон включают 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) и 1:1 (квадратный формат), оптимизированные для каждой платформы без необходимости обрезки в постобработке.

Может ли Wan 2.6 визуализировать текст в видео?

Да! Wan 2.6 имеет ведущую в отрасли визуализацию текста для упаковки продукции, вывесок и брендированного контента. Модель может генерировать чёткий, читаемый текст внутри видеокадров—критическая функция, которой не хватает Seedance и большинству конкурентов.

В чём разница между режимами T2V, I2V и R2V?

T2V (Текст в Видео) генерирует из текстовых промптов с многокадровой способностью. I2V (Изображение в Видео) анимирует неподвижные изображения с точной визуализацией текста. R2V (Референс в Видео) использует видео-референсы для сохранения идентичности персонажа в генерациях. Выбирайте на основе вашего типа ввода и потребностей в согласованности.

Имею ли я коммерческие права на сгенерированные видео?

Да! Каждое создание Wan 2.6 поставляется с полными правами на коммерческое использование. Видео готовы к производству для маркетинговых кампаний, клиентских поставок, брендированного контента и коммерческих приложений без дополнительных лицензионных требований.

Почему Использовать Wan 2.6 на Atlas Cloud?

Используйте инфраструктуру корпоративного уровня для ваших профессиональных рабочих процессов генерации видео

Специально Построенная Инфраструктура

Развёртывайте многокадровую генерацию и возможности R2V Wan 2.6 на инфраструктуре, специально оптимизированной для требовательных рабочих нагрузок AI-видео. Максимальная производительность для генерации 1080p 15 секунд.

Единый API для Всех Моделей

Получайте доступ к Wan 2.6 (T2V, I2V, R2V) наряду с 300+ моделями AI (LLM, изображение, видео, аудио) через один единый API. Единая интеграция для всех ваших потребностей в генеративном AI с согласованной аутентификацией.

Конкурентные Цены

Экономьте до 70% по сравнению с AWS с прозрачным ценообразованием по мере использования. Без скрытых комиссий, без обязательств—масштабируйте от прототипа до производства без превышения бюджета.

Сертифицированная Безопасность SOC I & II

Ваши референсные видео и сгенерированный контент защищены сертификациями SOC I & II и соответствием HIPAA. Безопасность корпоративного уровня с зашифрованной передачей и хранением.

SLA 99,9% Времени Работы

Надёжность корпоративного уровня с гарантированным 99,9% временем работы. Ваша многокадровая генерация видео Wan 2.6 всегда доступна для производственных кампаний и критических рабочих процессов контента.

Лёгкая Интеграция

Полная интеграция за считанные минуты с REST API и многоязычными SDK (Python, Node.js, Go). Беспрепятственно переключайтесь между режимами T2V, I2V и R2V с единой структурой конечных точек.

99.9%
Время Работы
70%
Более Низкая Стоимость vs AWS
300+
Модели Gen AI
24/7
Профессиональная Поддержка

Технические Характеристики

Architecture
Продвинутый Трансформер с Мультимодальным Пониманием
Resolution
1080p (Full HD)
Frame Rate
24 FPS
Duration
5-15 секунд (зависит от режима)
Aspect Ratios
16:9, 9:16, 1:1
Generation Modes
T2V, I2V, R2V
Audio
Нативная синхронизация с lip-sync
Commercial Rights
Полное коммерческое использование включено

Испытайте Профессиональную Многокадровую Генерацию Видео

Присоединяйтесь к создателям контента, маркетологам и кинематографистам по всему миру, которые революционизируют производство видео с помощью передовых возможностей многокадрового повествования и согласованности персонажей Wan 2.6.

Начните с 300+ моделей,

только в Atlas Cloud.