alibaba/wan-2.6/image-edit

изображение-в-изображение

Supports image editing and mixed text and image output to meet diverse generation and integration needs.

Alibaba WAN 2.6 Image Edit

Alibaba WAN 2.6 Image Edit enables you to upload an existing visual and specify the desired adjustments. The model preserves layout and subject structure while implementing high-quality updates based on natural language.

Why creators love it

Structure-preserving edits: Make lighting, color, or object changes without breaking composition.
Text-guided styling: Reimagine materials, moods, or art styles with concise prompts.
Prompt expansion on demand: Enable automatic prompt enrichment when you need extra detail.
Flexible output sizes: Pick the resolution that best matches your downstream workflow.

Perfect for

Marketing and design teams refining campaign visuals.
E-commerce sellers upgrading product imagery.
Content creators polishing thumbnails, covers, and posts.
Artists experimenting with variations of their original work.

Billing rules

Minimum charge: 1 image.
Total cost = number of images × price per resolution.

How to use

Provide the image you want to refine. (Image dimensions must be in (384, 5000))
Describe the desired adjustments in the prompt.
Choose the target resolution and submit.
Review the enhanced output and download the version you like best.

Pro tips

Start with clear instructions about colors, lighting, or objects to adjust.
Pair positive and negative prompts to control what should or should not appear.
Keep source images at or above your target resolution for optimal fidelity.

Note

If you did not upload the image locally, please ensure that the image URL is accessible! A successfully accessible image will display a preview in the interface.

Recommended Resolutions

Aspect Ratio	Exact (W×H)	Exact Pixels	Rounded (W×H, ÷64)	Rounded Pixels
1:1	1448 × 1448	2,096,704	1408 × 1408	1,982,464
3:2	1773 × 1182	2,095,686	1728 × 1152	1,990,656
4:3	1672 × 1254	2,096,688	1664 × 1216	2,023,424
16:9	1936 × 1089	2,108,304	1920 × 1088	2,088,960
21:9	2212 × 948	2,096,976	2176 × 960	2,088,960
1:1	1024 × 1024	1,048,576	1024 × 1024	1,048,576
3:2	1254 × 836	1,048,344	1216 × 832	1,011,712
4:3	1182 × 887	1,048,434	1152 × 896	1,032,192
16:9	1365 × 768	1,048,320	1344 × 768	1,032,192
21:9	1564 × 670	1,047,880	1536 × 640	983,040
1:1	323 × 323	104,329	320 × 320	102,400
3:2	397 × 264	104,808	384 × 256	98,304
4:3	374 × 280	104,720	448 × 320	143,360
16:9	432 × 243	104,976	448 × 256	114,688
21:9	495 × 212	104,940	576 × 256	147,456

Подробные характеристики

Обзор:

Разработчик модели:QWEN

Тип модели:image-to-image

Развертывание:API вывода; Playground

Цены:$0.021/pic

Ключевые параметры:

Ограничение размера:до ширина × высота (настраивается пользователем)

Поддержка LoRA:Нет

Параметры seed:N/A

Создайте свой шедевр

Qwen-Image Edit Plus 20251215

Supports multiple image inputs and outputs, allowing for precise modification of text within images, addition, deletion, or movement of objects, alteration of subject actions, transfer of image styles, and enhancement of image details.

$0.021/КАРТ

НОВОЕ

изображение-в-изображение

Qwen Image Edit

Qwen-Image-Edit — a 20B MMDiT model for next-gen image edit generation.

$0.02/КАРТ

НОВОЕ

изображение-в-изображение

Qwen Image Edit Plus

Qwen-Image-Edit-Plus a 20B MMDiT model for next-gen image edit generation.

$0.02/КАРТ

НОВОЕ

Qwen-Image Text-to-image Max

General-purpose image generation model that supports various art styles and is particularly good at rendering complex text.

$0.0525/КАРТ

🎬ГЕНЕРАЦИЯ МНОГОКАДРОВОГО ВИДЕО

Wan 2.6Профессиональное Создание Многокадрового AI-Видео

Новейший прорыв Alibaba в генерации AI-видео. Создавайте видео 1080p длительностью до 15 секунд с многокадровым повествованием, согласованностью персонажей на основе референсов и нативной аудиовизуальной синхронизацией. Первая модель, которая по-настоящему понимает логику раскадровки для кинематографического повествования.

Революционные Прорывы

Что делает Wan 2.6 переломным моментом в генерации AI-видео

Многокадровое Повествование

Первая модель, понимающая логику раскадровки. Автоматически генерирует последовательные кадры с согласованными переходами, сохраняя внешность персонажа и согласованность окружения при смене сцен—обеспечивая полные сюжетные арки в одной 15-секундной генерации.

Референс в Видео (R2V)

Загрузите референсное видео длительностью 2-30 секунд для извлечения и сохранения внешности персонажа, паттернов движения и голосовых характеристик. Создавайте согласованные выступления персонажей в нескольких видео с беспрецедентной точностью.

Точная Визуализация Текста

Ведущие в отрасли возможности визуализации текста для упаковки продукции, вывесок и брендированного контента. Генерируйте четкий, читаемый текст внутри видеокадров—необходимо для маркетинговых и коммерческих приложений.

Основные Возможности

Расширенная Длительность 15 Секунд

Генерируйте до 15 секунд на видео с полной структурой "Трёх Актов" (Завязка → Действие → Развязка)

Профессиональное Качество 1080p

Нативный вывод 1080p при 24fps с кинематографическим качеством и улучшенной визуальной стабильностью

Нативная Синхронизация Звука

Диалог соответствует движениям губ, фоновая музыка выравнивается с темпом, звуковые эффекты срабатывают идеально

Согласованность Персонажей

Сохраняйте внешность, костюмы и идентичность персонажей в кадрах и нескольких видео

Кинематографический Контроль Камеры

Профессиональные движения камеры, включая панорамирование, зуммирование, следящие кадры и движения на тележке

Гибкие Соотношения Сторон

16:9 (YouTube), 9:16 (Reels), 1:1 (Квадрат) - оптимизировано для платформ без постобработки обрезки

Wan 2.6 vs Wan 2.5: Основные Улучшения

Посмотрите, что нового в последнем релизе

Длительность Видео

До 15 секунд

Wan 2.5: Максимум 10 секунд

Многокадровая Способность

Понимает логику раскадровки

Wan 2.5: Один кадр или беспорядочный морфинг

Поддержка Референсного Видео

Режим R2V с полным сохранением

Wan 2.5: Только изображение-референс

Согласованность Персонажей

Отличная между кадрами

Wan 2.5: Проблемы дрейфа персонажей

Стабильность Движения

Уменьшенная дрожь и артефакты

Wan 2.5: Случайный дрейф кадров

Понимание Промптов

Сложные многоперсонажные сцены

Wan 2.5: Базовая генерация сцен

Три Специализированных Режима Генерации

Выберите правильный режим для вашего творческого рабочего процесса

Текст в Видео (T2V)

Самый Популярный

Генерируйте полные видео из текстовых промптов с улучшенной многокадровой сегментацией и усовершенствованной обработкой промптов. Идеально для повествования и творческого исследования.

Автоматическая сегментация кадров из одного промпта
Понимание многоперсонажного взаимодействия
Движение камеры и эмоциональные подсказки
Сохранение деталей окружения

Изображение в Видео (I2V)

Улучшенный

Превращайте неподвижные изображения в движущиеся видео с улучшенной согласованностью движения. Идеально для демонстраций продуктов, анимации фотографий и визуального повествования.

Точная визуализация текста для продуктов
Согласованность стиля во всех кадрах
Естественное движение из неподвижных изображений
Визуальная оптимизация, управляемая повествованием

Референс в Видео (R2V)

НОВЫЙ

Загрузите референсное видео (2-30с) для сохранения внешности персонажа, паттернов движения и голоса. Самая сильная гарантия согласованности для контента, управляемого персонажами.

Полное сохранение идентичности персонажа
Извлечение голосовых характеристик
Репликация паттернов движения
Сцены совместной игры нескольких персонажей

Идеально Для

Маркетинг и Реклама

Демонстрации продуктов с визуализацией текста, брендовые кампании с согласованностью персонажей и рекламные видео

Создание Контента

YouTube-видео, социальные сети reels, многокадровое повествование и рабочие процессы редактирования видео

Электронная Коммерция

Демонстрации продуктов с точным текстом, обучающие видео и воссоздание отзывов клиентов

Образование и Обучение

Обучающий контент, курсовые материалы и многосценовые образовательные повествования

Развлечения

Короткометражные фильмы, истории, управляемые персонажами, кинематографические последовательности и творческие эксперименты

Превизуализация

Разработка кинематографических концепций, создание раскадровок и планирование сцен для производства

Интеграция Wan 2.6 T2V, I2V и R2V API

Полный набор API для генерации Текст в Видео, Изображение в Видео и Референс в Видео

API Текст в Видео (T2V API)

Наш Wan 2.6 T2V API преобразует текстовые промпты в многокадровые кинематографические видео с автоматической сегментацией сцен. Генерируйте профессиональные видео 1080p до 15 секунд с нативной синхронизацией звука.

Многокадровое повествование из одного промпта

15-секундная длительность со структурой Трёх Актов

Улучшенное понимание промптов для сложных сцен

Гибкие соотношения сторон: 16:9, 9:16, 1:1

API Изображение в Видео (I2V API)

Наш Wan 2.6 I2V API оживляет неподвижные изображения с точным контролем движения и визуализацией текста. Идеально для продуктовых видео, анимации фотографий и создания брендированного контента.

Точная визуализация текста для продуктов и вывесок

Согласованность стиля в анимационных кадрах

Естественное движение с улучшенной согласованностью

Визуальный вывод, оптимизированный повествованием

API Референс в Видео (R2V API)

Наш Wan 2.6 R2V API сохраняет идентичность персонажа из референсных видео. Загружайте 2-30-секундные клипы для извлечения внешности, голоса и паттернов движения для согласованной генерации персонажей.

Сохранение внешности и идентичности персонажа

Извлечение и репликация голосовых характеристик

Анализ и воспроизведение паттернов движения

Поддержка многоперсонажных сцен

💡

Полный Набор API

Все три режима Wan 2.6 API (T2V API, I2V API, R2V API) поддерживают RESTful-архитектуру с полной документацией. Начните с SDK для Python, Node.js и других. Каждая конечная точка включает нативную аудиовизуальную синхронизацию и полные права на коммерческое использование.

Как Начать с Wan 2.6

Начните создавать профессиональные видео за считанные минуты двумя простыми путями

Интеграция API

Для разработчиков, создающих приложения

Зарегистрируйтесь и Войдите

Создайте свой аккаунт Atlas Cloud или войдите для доступа к консоли

Добавьте Способ Оплаты

Привяжите свою кредитную карту в разделе Биллинг для пополнения счёта

Сгенерируйте API Ключ

Перейдите в Консоль → API Ключи и создайте свой ключ аутентификации

Начните Создавать

Используйте конечные точки T2V, I2V или R2V API для интеграции Wan 2.6 в ваше приложение

Опыт Playground

Для быстрого тестирования и экспериментов

Зарегистрируйтесь и Войдите

Создайте свой аккаунт Atlas Cloud или войдите для доступа к платформе

Добавьте Способ Оплаты

Привяжите свою кредитную карту в разделе Биллинг для начала

Используйте Playground

Перейдите в Wan 2.6 playground, выберите режим T2V/I2V/R2V и генерируйте видео мгновенно

💡

Профессиональный Совет: Сначала протестируйте различные режимы генерации в Playground, чтобы понять, какой лучше всего подходит для вашего случая использования, затем интегрируйте соответствующий API для производственного масштаба.

Часто Задаваемые Вопросы

Что делает многокадровую способность Wan 2.6 уникальной?

Wan 2.6 - это первая модель, которая по-настоящему понимает логику раскадровки. В отличие от Wan 2.5, который создавал беспорядочные эффекты "морфинга", Wan 2.6 может автоматически сегментировать один промпт на несколько отдельных кадров с согласованными переходами, сохраняя согласованность персонажей при смене сцен.

Как работает Референс в Видео (R2V)?

Загрузите референсное видео длительностью 2-30 секунд, и Wan 2.6 извлечёт внешность персонажа, паттерны движения и голосовые характеристики. Затем вы можете генерировать новые видео с тем же персонажем с согласованной идентичностью—идеально для создания серий контента, управляемого персонажами.

Какие форматы и длительности видео поддерживаются?

Wan 2.6 генерирует видео 1080p при 24fps с длительностью от 5 до 15 секунд. Поддерживаемые соотношения сторон включают 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) и 1:1 (квадратный формат), оптимизированные для каждой платформы без необходимости обрезки в постобработке.

Может ли Wan 2.6 визуализировать текст в видео?

Да! Wan 2.6 имеет ведущую в отрасли визуализацию текста для упаковки продукции, вывесок и брендированного контента. Модель может генерировать чёткий, читаемый текст внутри видеокадров—критическая функция, которой не хватает Seedance и большинству конкурентов.

В чём разница между режимами T2V, I2V и R2V?

T2V (Текст в Видео) генерирует из текстовых промптов с многокадровой способностью. I2V (Изображение в Видео) анимирует неподвижные изображения с точной визуализацией текста. R2V (Референс в Видео) использует видео-референсы для сохранения идентичности персонажа в генерациях. Выбирайте на основе вашего типа ввода и потребностей в согласованности.

Имею ли я коммерческие права на сгенерированные видео?

Да! Каждое создание Wan 2.6 поставляется с полными правами на коммерческое использование. Видео готовы к производству для маркетинговых кампаний, клиентских поставок, брендированного контента и коммерческих приложений без дополнительных лицензионных требований.

Почему Использовать Wan 2.6 на Atlas Cloud?

Используйте инфраструктуру корпоративного уровня для ваших профессиональных рабочих процессов генерации видео

Специально Построенная Инфраструктура

Развёртывайте многокадровую генерацию и возможности R2V Wan 2.6 на инфраструктуре, специально оптимизированной для требовательных рабочих нагрузок AI-видео. Максимальная производительность для генерации 1080p 15 секунд.

Единый API для Всех Моделей

Получайте доступ к Wan 2.6 (T2V, I2V, R2V) наряду с 300+ моделями AI (LLM, изображение, видео, аудио) через один единый API. Единая интеграция для всех ваших потребностей в генеративном AI с согласованной аутентификацией.

Конкурентные Цены

Экономьте до 70% по сравнению с AWS с прозрачным ценообразованием по мере использования. Без скрытых комиссий, без обязательств—масштабируйте от прототипа до производства без превышения бюджета.

Сертифицированная Безопасность SOC I & II

Ваши референсные видео и сгенерированный контент защищены сертификациями SOC I & II и соответствием HIPAA. Безопасность корпоративного уровня с зашифрованной передачей и хранением.

SLA 99,9% Времени Работы

Надёжность корпоративного уровня с гарантированным 99,9% временем работы. Ваша многокадровая генерация видео Wan 2.6 всегда доступна для производственных кампаний и критических рабочих процессов контента.

Лёгкая Интеграция

Полная интеграция за считанные минуты с REST API и многоязычными SDK (Python, Node.js, Go). Беспрепятственно переключайтесь между режимами T2V, I2V и R2V с единой структурой конечных точек.

99.9%

Время Работы

70%

Более Низкая Стоимость vs AWS

300+

Модели Gen AI

24/7

Профессиональная Поддержка

Технические Характеристики

Architecture

Продвинутый Трансформер с Мультимодальным Пониманием

Resolution

1080p (Full HD)

Frame Rate

24 FPS

Duration

5-15 секунд (зависит от режима)

Aspect Ratios

16:9, 9:16, 1:1

Generation Modes

T2V, I2V, R2V

Audio

Нативная синхронизация с lip-sync

Commercial Rights

Полное коммерческое использование включено

Испытайте Профессиональную Многокадровую Генерацию Видео

Присоединяйтесь к создателям контента, маркетологам и кинематографистам по всему миру, которые революционизируют производство видео с помощью передовых возможностей многокадрового повествования и согласованности персонажей Wan 2.6.

Начните с 300+ моделей,

только в Atlas Cloud.

Все модели

alibaba/wan-2.6/image-edit

Alibaba WAN 2.6 Image Edit

Why creators love it

Perfect for

Billing rules

How to use

Pro tips

Note

Recommended Resolutions

Подробные характеристики

Обзор:

Ключевые параметры:

Создайте свой шедевр

Похожие модели

Qwen-Image Edit Plus 20251215

Qwen Image Edit

Qwen Image Edit Plus

Qwen-Image Text-to-image Max

Wan 2.6Профессиональное Создание Многокадрового AI-Видео

Революционные Прорывы

Многокадровое Повествование

Референс в Видео (R2V)

Точная Визуализация Текста

Основные Возможности

Расширенная Длительность 15 Секунд

Профессиональное Качество 1080p

Нативная Синхронизация Звука

Согласованность Персонажей

Кинематографический Контроль Камеры

Гибкие Соотношения Сторон

Wan 2.6 vs Wan 2.5: Основные Улучшения

Три Специализированных Режима Генерации

Текст в Видео (T2V)

Изображение в Видео (I2V)

Референс в Видео (R2V)

Идеально Для

Маркетинг и Реклама

Создание Контента

Электронная Коммерция

Образование и Обучение

Развлечения

Превизуализация

Интеграция Wan 2.6 T2V, I2V и R2V API

API Текст в Видео (T2V API)

API Изображение в Видео (I2V API)

API Референс в Видео (R2V API)

Полный Набор API

Как Начать с Wan 2.6

Интеграция API

Зарегистрируйтесь и Войдите

Добавьте Способ Оплаты

Сгенерируйте API Ключ

Начните Создавать

Опыт Playground

Зарегистрируйтесь и Войдите

Добавьте Способ Оплаты

Используйте Playground

Часто Задаваемые Вопросы

Что делает многокадровую способность Wan 2.6 уникальной?

Как работает Референс в Видео (R2V)?

Какие форматы и длительности видео поддерживаются?

Может ли Wan 2.6 визуализировать текст в видео?

В чём разница между режимами T2V, I2V и R2V?

Имею ли я коммерческие права на сгенерированные видео?

Почему Использовать Wan 2.6 на Atlas Cloud?

Специально Построенная Инфраструктура

Единый API для Всех Моделей

Конкурентные Цены

Сертифицированная Безопасность SOC I & II

SLA 99,9% Времени Работы

Лёгкая Интеграция

Технические Характеристики

Испытайте Профессиональную Многокадровую Генерацию Видео