alibaba/wan-2.6/image-edit

Supports image editing and mixed text and image output to meet diverse generation and integration needs.

IMAGE-TO-IMAGEHOTNEW
이미지를 이미지로

Supports image editing and mixed text and image output to meet diverse generation and integration needs.

Alibaba WAN 2.6 Image Edit

Alibaba WAN 2.6 Image Edit enables you to upload an existing visual and specify the desired adjustments. The model preserves layout and subject structure while implementing high-quality updates based on natural language.

Why creators love it

  • Structure-preserving edits: Make lighting, color, or object changes without breaking composition.
  • Text-guided styling: Reimagine materials, moods, or art styles with concise prompts.
  • Prompt expansion on demand: Enable automatic prompt enrichment when you need extra detail.
  • Flexible output sizes: Pick the resolution that best matches your downstream workflow.

Perfect for

  • Marketing and design teams refining campaign visuals.
  • E-commerce sellers upgrading product imagery.
  • Content creators polishing thumbnails, covers, and posts.
  • Artists experimenting with variations of their original work.

Billing rules

  • Minimum charge: 1 image.
  • Total cost = number of images × price per resolution.

How to use

  1. Provide the image you want to refine. (Image dimensions must be in (384, 5000))
  2. Describe the desired adjustments in the prompt.
  3. Choose the target resolution and submit.
  4. Review the enhanced output and download the version you like best.

Pro tips

  • Start with clear instructions about colors, lighting, or objects to adjust.
  • Pair positive and negative prompts to control what should or should not appear.
  • Keep source images at or above your target resolution for optimal fidelity.

Note

If you did not upload the image locally, please ensure that the image URL is accessible! A successfully accessible image will display a preview in the interface.


Aspect RatioExact (W×H)Exact PixelsRounded (W×H, ÷64)Rounded Pixels
1:11448 × 14482,096,7041408 × 14081,982,464
3:21773 × 11822,095,6861728 × 11521,990,656
4:31672 × 12542,096,6881664 × 12162,023,424
16:91936 × 10892,108,3041920 × 10882,088,960
21:92212 × 9482,096,9762176 × 9602,088,960
1:11024 × 10241,048,5761024 × 10241,048,576
3:21254 × 8361,048,3441216 × 8321,011,712
4:31182 × 8871,048,4341152 × 8961,032,192
16:91365 × 7681,048,3201344 × 7681,032,192
21:91564 × 6701,047,8801536 × 640983,040
1:1323 × 323104,329320 × 320102,400
3:2397 × 264104,808384 × 25698,304
4:3374 × 280104,720448 × 320143,360
16:9432 × 243104,976448 × 256114,688
21:9495 × 212104,940576 × 256147,456

상세 사양

개요:

모델 제공자:QWEN
모델 유형:image-to-image
배포:추론 API; Playground
가격:$0.021/pic

주요 사양:

크기 제한:최대 너비 × 높이 (사용자 구성 가능)
LoRA 지원:아니오
시드 옵션:N/A

다음 걸작 만들기

🎬멀티샷 비디오 생성

Wan 2.6전문가급 멀티샷 AI 비디오 제작

Alibaba의 최신 AI 비디오 생성 기술 혁신. 멀티샷 스토리텔링, 참조 기반 캐릭터 일관성, 네이티브 오디오-비주얼 동기화를 갖춘 최대 15초 1080p 비디오를 제작하세요. 시네마틱 내러티브를 위한 스토리보드 로직을 진정으로 이해하는 최초의 모델입니다.

혁명적인 돌파구

Wan 2.6이 AI 비디오 생성의 게임 체인저인 이유

멀티샷 스토리텔링

스토리보드 로직을 이해하는 최초의 모델. 장면 전환을 통해 캐릭터 외관과 환경 일관성을 유지하면서 일관된 전환을 가진 연속 샷을 자동 생성—단일 15초 생성에서 완전한 스토리 아크를 구현합니다.

참조 비디오 변환(R2V)

2~30초 참조 비디오를 업로드하여 캐릭터 외관, 동작 패턴, 음성 특성을 추출하고 보존합니다. 전례 없는 정확도로 여러 비디오에 걸쳐 일관된 캐릭터 퍼포먼스를 생성하세요.

정확한 텍스트 렌더링

제품 패키징, 사이니지, 브랜드 콘텐츠를 위한 업계 최고의 텍스트 렌더링 기능. 비디오 프레임 내에 명확하고 읽기 쉬운 텍스트 생성—마케팅 및 상업 애플리케이션에 필수적입니다.

핵심 기능

15초 확장 지속 시간

완전한 "3막 구조"(설정 → 전개 → 해결)를 갖춘 최대 15초 비디오 생성

전문가급 1080p 품질

시네마틱 품질과 향상된 시각적 안정성을 갖춘 24fps 네이티브 1080p 출력

네이티브 오디오 동기화

입 모양과 대화가 일치하고, 페이싱에 맞춘 배경 음악, 완벽하게 트리거되는 효과음

캐릭터 일관성

샷과 여러 비디오를 통해 캐릭터 외관, 의상, 정체성 유지

시네마틱 카메라 제어

팬, 줌, 트래킹 샷, 달리 이동을 포함한 전문 카메라 움직임

유연한 종횡비

16:9(YouTube), 9:16(릴스), 1:1(정사각형)—후반 작업 크롭 없이 플랫폼 최적화

Wan 2.6 vs Wan 2.5: 주요 개선 사항

최신 릴리스의 새로운 기능 확인

비디오 지속 시간
최대 15초
Wan 2.5: 최대 10초
멀티샷 기능
스토리보드 로직 이해
Wan 2.5: 단일 샷 또는 지저분한 모핑
참조 비디오 지원
완전 보존의 R2V 모드
Wan 2.5: 이미지 참조만
캐릭터 일관성
샷 간 뛰어난 성능
Wan 2.5: 캐릭터 드리프트 문제
모션 안정성
지터 및 아티팩트 감소
Wan 2.5: 가끔 프레임 드리프트
프롬프트 이해
복잡한 멀티 캐릭터 장면
Wan 2.5: 기본 장면 생성

3가지 전문 생성 모드

크리에이티브 워크플로에 적합한 모드 선택

텍스트-비디오(T2V)

가장 인기

향상된 멀티샷 세그먼테이션과 개선된 프롬프트 처리를 갖춘 텍스트 프롬프트에서 완전한 비디오 생성. 스토리텔링 및 창의적 탐구에 완벽합니다.

  • 단일 프롬프트에서 자동 샷 세그먼테이션
  • 멀티 캐릭터 상호작용 이해
  • 카메라 움직임 및 감정적 단서
  • 환경 디테일 보존

이미지-비디오(I2V)

향상됨

개선된 모션 일관성으로 정지 이미지를 모션 비디오로 변환. 제품 쇼케이스, 사진 애니메이션, 비주얼 스토리텔링에 이상적입니다.

  • 제품의 정확한 텍스트 렌더링
  • 프레임 간 스타일 일관성
  • 정지 이미지에서 자연스러운 모션
  • 내러티브 중심 비주얼 최적화

참조 비디오 변환(R2V)

신규

참조 비디오(2~30초)를 업로드하여 캐릭터 외관, 동작 패턴, 음성을 보존합니다. 캐릭터 중심 콘텐츠를 위한 최강의 일관성 보장.

  • 완전한 캐릭터 정체성 보존
  • 음성 특성 추출
  • 동작 패턴 복제
  • 멀티 캐릭터 공연 장면

완벽한 용도

마케팅 & 광고

텍스트 렌더링 포함 제품 데모, 캐릭터 일관성 있는 브랜드 캠페인, 프로모션 비디오

콘텐츠 제작

YouTube 비디오, 소셜 미디어 릴스, 멀티샷 스토리텔링, 비디오 편집 워크플로

이커머스

정확한 텍스트가 있는 제품 쇼케이스, 튜토리얼 비디오, 고객 후기 재현

교육 & 훈련

교육 콘텐츠, 강좌 자료, 멀티 장면 교육 내러티브

엔터테인먼트

단편 영화, 캐릭터 중심 스토리, 시네마틱 시퀀스, 창의적 실험

프리비주얼라이제이션

영화 컨셉 개발, 스토리보드 제작, 프로덕션을 위한 장면 계획

Wan 2.6 T2V, I2V, R2V API 통합

텍스트-비디오, 이미지-비디오, 참조 비디오 변환을 위한 완전한 API 스위트

텍스트-비디오 API(T2V API)

저희 Wan 2.6 T2V API는 텍스트 프롬프트를 자동 장면 세그먼테이션이 있는 멀티샷 시네마틱 비디오로 변환합니다. 네이티브 오디오 동기화를 갖춘 최대 15초의 전문 1080p 비디오를 생성하세요.

단일 프롬프트에서 멀티샷 스토리텔링
3막 구조를 가진 15초 지속 시간
복잡한 장면을 위한 향상된 프롬프트 이해
유연한 종횡비: 16:9, 9:16, 1:1

이미지-비디오 API(I2V API)

저희 Wan 2.6 I2V API는 정확한 모션 제어와 텍스트 렌더링으로 정지 이미지에 생명을 불어넣습니다. 제품 비디오, 사진 애니메이션, 브랜드 콘텐츠 제작에 완벽합니다.

제품 및 사이니지의 정확한 텍스트 렌더링
애니메이션 프레임 간 스타일 일관성
개선된 일관성을 가진 자연스러운 모션
내러티브 최적화된 비주얼 출력

참조 비디오 변환 API(R2V API)

저희 Wan 2.6 R2V API는 참조 비디오에서 캐릭터 정체성을 보존합니다. 외관, 음성, 동작 패턴을 추출하여 일관된 캐릭터 생성을 위해 2~30초 클립을 업로드하세요.

캐릭터 외관 및 정체성 보존
음성 특성 추출 및 복제
동작 패턴 분석 및 재현
멀티 캐릭터 장면 지원
💡

완전한 API 스위트

모든 3가지 Wan 2.6 API 모드(T2V API, I2V API, R2V API)는 포괄적인 문서와 함께 RESTful 아키텍처를 지원합니다. Python, Node.js 등을 위한 SDK로 시작하세요. 각 엔드포인트에는 네이티브 오디오-비주얼 동기화 및 완전한 상업적 사용권이 포함됩니다.

Wan 2.6 시작하기

두 가지 간단한 경로로 몇 분 안에 전문 비디오 제작 시작

API 통합

애플리케이션을 구축하는 개발자용

1

가입 및 로그인

Atlas Cloud 계정을 만들거나 로그인하여 콘솔에 액세스

2

결제 방법 추가

청구 섹션에서 신용카드를 연결하여 계정에 자금 충전

3

API 키 생성

콘솔 → API 키로 이동하여 인증 키 생성

4

빌드 시작

T2V, I2V 또는 R2V API 엔드포인트를 사용하여 Wan 2.6을 애플리케이션에 통합

Playground 경험

빠른 테스트 및 실험용

1

가입 및 로그인

Atlas Cloud 계정을 만들거나 로그인하여 플랫폼에 액세스

2

결제 방법 추가

청구 섹션에서 신용카드를 연결하여 시작

3

Playground 사용

Wan 2.6 playground로 이동하여 T2V/I2V/R2V 모드를 선택하고 즉시 비디오 생성

💡
프로 팁: 먼저 Playground에서 다양한 생성 모드를 테스트하여 사용 사례에 가장 적합한 것을 이해한 다음 프로덕션 규모를 위해 해당 API를 통합하세요.

자주 묻는 질문

Wan 2.6의 멀티샷 기능의 고유성은 무엇인가요?

Wan 2.6은 스토리보드 로직을 진정으로 이해하는 최초의 모델입니다. 지저분한 "모핑" 효과를 만든 Wan 2.5와 달리, Wan 2.6은 단일 프롬프트를 일관된 전환을 가진 여러 개의 명확한 샷으로 자동 세그먼트화하여 장면 전환을 통해 캐릭터 일관성을 유지할 수 있습니다.

참조 비디오 변환(R2V)은 어떻게 작동하나요?

2~30초 참조 비디오를 업로드하면 Wan 2.6이 캐릭터의 외관, 동작 패턴, 음성 특성을 추출합니다. 그런 다음 일관된 정체성을 가진 동일한 캐릭터를 특징으로 하는 새 비디오를 생성할 수 있습니다—캐릭터 중심 콘텐츠 시리즈를 만드는 데 이상적입니다.

지원되는 비디오 형식과 지속 시간은?

Wan 2.6은 5~15초 지속 시간으로 24fps의 1080p 비디오를 생성합니다. 지원되는 종횡비에는 16:9(YouTube), 9:16(Instagram Reels/TikTok), 1:1(정사각형 형식)이 포함되며 각 플랫폼에 최적화되어 있어 후반 작업 크롭이 필요하지 않습니다.

Wan 2.6은 비디오에서 텍스트를 렌더링할 수 있나요?

네! Wan 2.6은 제품 패키징, 사이니지, 브랜드 콘텐츠를 위한 업계 최고의 텍스트 렌더링을 갖추고 있습니다. 이 모델은 비디오 프레임 내에 명확하고 읽기 쉬운 텍스트를 생성할 수 있습니다—이것은 Seedance와 대부분의 경쟁사가 부족한 중요한 기능입니다.

T2V, I2V, R2V 모드의 차이점은 무엇인가요?

T2V(텍스트-비디오)는 멀티샷 기능을 갖춘 텍스트 프롬프트에서 생성합니다. I2V(이미지-비디오)는 정확한 텍스트 렌더링으로 정지 이미지를 애니메이션화합니다. R2V(참조 비디오 변환)는 비디오 참조를 사용하여 생성 전반에 걸쳐 캐릭터 정체성을 보존합니다. 입력 유형과 일관성 요구 사항에 따라 선택하세요.

생성된 비디오에 대한 상업적 권리가 있나요?

네! 모든 Wan 2.6 생성물에는 완전한 상업적 사용권이 포함되어 있습니다. 비디오는 추가 라이선스 요구 사항 없이 마케팅 캠페인, 클라이언트 결과물, 브랜드 콘텐츠 및 상업적 애플리케이션에 프로덕션 준비가 되어 있습니다.

Atlas Cloud에서 Wan 2.6을 사용하는 이유

전문 비디오 생성 워크플로를 위한 엔터프라이즈급 인프라 활용

목적별 인프라

까다로운 AI 비디오 워크로드에 특별히 최적화된 인프라에 Wan 2.6의 멀티샷 생성 및 R2V 기능을 배포하세요. 1080p 15초 생성을 위한 최대 성능.

모든 모델을 위한 통합 API

하나의 통합 API를 통해 Wan 2.6(T2V, I2V, R2V)과 300개 이상의 AI 모델(LLM, 이미지, 비디오, 오디오)에 액세스하세요. 일관된 인증으로 모든 생성형 AI 요구 사항을 위한 단일 통합.

경쟁력 있는 가격

투명한 종량제 가격으로 AWS 대비 최대 70% 절약. 숨겨진 수수료나 약정 없음—은행을 터뜨리지 않고 프로토타입에서 프로덕션으로 확장하세요.

SOC I & II 인증 보안

SOC I & II 인증 및 HIPAA 규정 준수로 참조 비디오와 생성된 콘텐츠를 보호합니다. 암호화된 전송 및 스토리지를 갖춘 엔터프라이즈급 보안.

99.9% 가동 시간 SLA

보장된 99.9% 가동 시간을 갖춘 엔터프라이즈급 안정성. Wan 2.6 멀티샷 비디오 생성은 프로덕션 캠페인 및 중요한 콘텐츠 워크플로를 위해 항상 사용 가능합니다.

손쉬운 통합

REST API 및 다국어 SDK(Python, Node.js, Go)로 몇 분 안에 완전한 통합. 통합 엔드포인트 구조로 T2V, I2V, R2V 모드 간 원활한 전환.

99.9%
가동 시간
70%
AWS 대비 낮은 비용
300+
생성형 AI 모델
24/7
프로 지원

기술 사양

Architecture
멀티모달 이해를 갖춘 고급 Transformer
Resolution
1080p(풀 HD)
Frame Rate
24 FPS
Duration
5~15초(모드 의존)
Aspect Ratios
16:9, 9:16, 1:1
Generation Modes
T2V, I2V, R2V
Audio
립싱크를 갖춘 네이티브 동기화
Commercial Rights
완전한 상업적 사용 포함

전문가급 멀티샷 비디오 생성 경험

Wan 2.6의 획기적인 멀티샷 스토리텔링 및 캐릭터 일관성 기능으로 비디오 제작을 혁신하고 있는 전 세계 콘텐츠 크리에이터, 마케터, 영화 제작자에 합류하세요.

300개 이상의 모델로 시작하세요,

Atlas Cloud에서만.