alibaba/wan-2.6/image-edit

이미지를 이미지로

Wan 2.6 Image-to-Image API by Alibaba

alibaba/wan-2.6/image-edit

Image-edit

Supports image editing and mixed text and image output to meet diverse generation and integration needs.

입력

매개변수 구성 로드 중...

출력

대기

생성된 이미지가 여기에 표시됩니다

설정을 구성하고 실행을 클릭하여 시작하세요

요청당 $0.021가 소요됩니다. $10로 이 모델을 약 476번 실행할 수 있습니다.

다음으로 할 수 있는 작업:

이미지를 비디오로 이미지를 이미지로

파라미터

코드 예시
import requests
import time

# Step 1: Start image generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "alibaba/wan-2.6/image-edit",
    "prompt": "A beautiful landscape with mountains and lake",
    "width": 512,
    "height": 512,
    "steps": 20,
    "guidance_scale": 7.5,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] == "completed":
            print("Generated image:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

image_url = check_status()

설치

사용하는 언어에 필요한 패키지를 설치하세요.

pip install requests

인증

모든 API 요청에는 API 키를 통한 인증이 필요합니다. Atlas Cloud 대시보드에서 API 키를 받을 수 있습니다.

export ATLASCLOUD_API_KEY="your-api-key-here"

HTTP 헤더

import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}

API 키를 안전하게 보관하세요

클라이언트 측 코드나 공개 저장소에 API 키를 노출하지 마세요. 대신 환경 변수 또는 백엔드 프록시를 사용하세요.

요청 제출

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

요청 제출

비동기 생성 요청을 제출합니다. API는 상태 확인 및 결과 조회에 사용할 수 있는 예측 ID를 반환합니다.

POST/api/v1/model/generateImage

요청 본문

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "alibaba/wan-2.6/image-edit",
    "prompt": "A beautiful landscape with mountains and lake"
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['data']['id']}")
print(f"Status: {result['data']['status']}")

응답

{
  "code": 200,
  "data": {
    "id": "pred_abc123",
    "status": "processing",
    "model": "model-name",
    "created_at": "2025-01-01T00:00:00Z"
  }
}

상태 확인

예측 엔드포인트를 폴링하여 요청의 현재 상태를 확인합니다.

GET/api/v1/model/prediction/{prediction_id}

폴링 예시

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

상태 값

processing요청이 아직 처리 중입니다.

completed생성이 완료되었습니다. 출력을 사용할 수 있습니다.

succeeded생성이 성공했습니다. 출력을 사용할 수 있습니다.

failed생성에 실패했습니다. 오류 필드를 확인하세요.

완료 응답

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.png"
    ],
    "metrics": {
      "predict_time": 8.3
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

파일 업로드

Atlas Cloud 스토리지에 파일을 업로드하고 API 요청에 사용할 수 있는 URL을 받습니다. multipart/form-data를 사용하여 업로드합니다.

POST/api/v1/model/uploadMedia

업로드 예시

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

응답

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

입력 Schema

다음 파라미터를 요청 본문에서 사용할 수 있습니다.

전체: 0필수: 0선택: 0

사용 가능한 파라미터가 없습니다.

요청 본문 예시

{
  "model": "alibaba/wan-2.6/image-edit"
}

출력 Schema

API는 생성된 출력 URL이 포함된 예측 응답을 반환합니다.

idstringrequired

Unique identifier for the prediction.

statusstringrequired

Current status of the prediction.

processingcompletedsucceededfailed

modelstringrequired

The model used for generation.

outputsarray[string]

Array of output URLs. Available when status is "completed".

errorstring

Error message if status is "failed".

metricsobject

Performance metrics.

predict_timenumber

Time taken for image generation in seconds.

created_atstringrequired

ISO 8601 timestamp when the prediction was created.

Format: date-time

completed_atstring

ISO 8601 timestamp when the prediction was completed.

Format: date-time

응답 예시

{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.png"
  ],
  "metrics": {
    "predict_time": 8.3
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills는 300개 이상의 AI 모델을 AI 코딩 어시스턴트에 직접 통합합니다. 한 번의 명령으로 설치하고 자연어로 이미지, 동영상 생성 및 LLM과 대화할 수 있습니다.

지원 클라이언트

Claude Code

OpenAI Codex

Gemini CLI

Cursor

Windsurf

VS Code

Trae

GitHub Copilot

Cline

Roo Code

Amp

Goose

Replit

40+ 지원 클라이언트

설치

npx skills add AtlasCloudAI/atlas-cloud-skills

API 키 설정

Atlas Cloud 대시보드에서 API 키를 받아 환경 변수로 설정하세요.

export ATLASCLOUD_API_KEY="your-api-key-here"

기능

설치 후 AI 어시스턴트에서 자연어를 사용하여 모든 Atlas Cloud 모델에 접근할 수 있습니다.

이미지 생성Nano Banana 2, Z-Image 등의 모델로 이미지를 생성합니다.

동영상 제작Kling, Vidu, Veo 등으로 텍스트나 이미지에서 동영상을 만듭니다.

LLM 채팅Qwen, DeepSeek 등 대규모 언어 모델과 대화합니다.

미디어 업로드이미지 편집 및 이미지-동영상 변환 워크플로우를 위해 로컬 파일을 업로드합니다.

더 알아보기

github.com/AtlasCloudAI/atlas-cloud-skills

MCP Server

Atlas Cloud MCP Server는 Model Context Protocol을 통해 IDE와 300개 이상의 AI 모델을 연결합니다. MCP 호환 클라이언트에서 사용할 수 있습니다.

지원 클라이언트

Cursor

VS Code

Windsurf

Claude Code

OpenAI Codex

Gemini CLI

Cline

Roo Code

100+ 지원 클라이언트

설치

npx -y atlascloud-mcp

설정

다음 설정을 IDE의 MCP 설정 파일에 추가하세요.

{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

사용 가능한 도구

atlas_generate_image텍스트 프롬프트로 이미지를 생성합니다.

atlas_generate_video텍스트나 이미지로 동영상을 만듭니다.

atlas_chat대규모 언어 모델과 대화합니다.

atlas_list_models300개 이상의 사용 가능한 AI 모델을 탐색합니다.

atlas_quick_generate최적 모델을 자동 선택하여 한 번에 콘텐츠를 생성합니다.

atlas_upload_mediaAPI 워크플로우를 위해 로컬 파일을 업로드합니다.

더 알아보기

github.com/AtlasCloudAI/mcp-server

API 스키마

스키마를 사용할 수 없음

사용 가능한 예제 없음

로드 중...

🎬멀티샷 비디오 생성

Wan 2.6전문가급 멀티샷 AI 비디오 제작

Alibaba의 최신 AI 비디오 생성 기술 혁신. 멀티샷 스토리텔링, 참조 기반 캐릭터 일관성, 네이티브 오디오-비주얼 동기화를 갖춘 최대 15초 1080p 비디오를 제작하세요. 시네마틱 내러티브를 위한 스토리보드 로직을 진정으로 이해하는 최초의 모델입니다.

혁명적 혁신

Wan 2.6이 AI 비디오 생성의 게임 체인저인 이유

멀티샷 스토리텔링

스토리보드 로직을 이해하는 최초의 모델. 매끄러운 전환으로 연속 샷을 자동 생성하고, 장면 전환 속에서도 캐릭터 외관과 환경의 일관성을 유지합니다—단 한 번의 15초 생성으로 완전한 스토리 아크를 완성합니다.

참조 비디오 변환(R2V)

2~30초 참조 비디오를 업로드하여 캐릭터 외관, 동작 패턴, 음성 특성을 추출하고 보존합니다. 전례 없는 정확도로 여러 비디오에 걸쳐 일관된 캐릭터 퍼포먼스를 생성하세요.

정확한 텍스트 렌더링

제품 패키징, 사이니지, 브랜드 콘텐츠를 위한 업계 최고의 텍스트 렌더링 기능. 비디오 프레임 내에 명확하고 읽기 쉬운 텍스트 생성—마케팅 및 상업 애플리케이션에 필수적입니다.

핵심 기능

15초 확장 지속 시간

완전한 "3막 구조"(설정 → 전개 → 해결)를 갖춘 최대 15초 비디오 생성

전문가급 1080p 품질

시네마틱 품질과 향상된 시각적 안정성을 갖춘 24fps 네이티브 1080p 출력

네이티브 오디오 동기화

입 모양과 대화가 일치하고, 페이싱에 맞춘 배경 음악, 완벽하게 트리거되는 효과음

캐릭터 일관성

샷과 여러 비디오를 통해 캐릭터 외관, 의상, 정체성 유지

시네마틱 카메라 제어

팬, 줌, 트래킹 샷, 달리 이동을 포함한 전문 카메라 움직임

유연한 종횡비

16:9(YouTube), 9:16(릴스), 1:1(정사각형)—후반 작업 크롭 없이 플랫폼 최적화

Wan 2.6 vs Wan 2.5: 주요 개선 사항

최신 릴리스의 새로운 기능 확인

비디오 지속 시간

최대 15초

Wan 2.5: 최대 10초

멀티샷 기능

스토리보드 로직 이해

Wan 2.5: 단일 샷 또는 지저분한 모핑

참조 비디오 지원

R2V 모드로 완전 보존

Wan 2.5: 이미지 참조만

캐릭터 일관성

샷 간 뛰어난 성능

Wan 2.5: 캐릭터 드리프트 문제

모션 안정성

지터 및 아티팩트 감소

Wan 2.5: 가끔 프레임 드리프트

프롬프트 이해

복잡한 멀티 캐릭터 장면

Wan 2.5: 기본 장면 생성

3가지 전문 생성 모드

크리에이티브 워크플로에 적합한 모드 선택

텍스트-비디오(T2V)

가장 인기

향상된 멀티샷 세그먼테이션과 개선된 프롬프트 처리를 갖춘 텍스트 프롬프트에서 완전한 비디오 생성. 스토리텔링 및 창의적 탐구에 완벽합니다.

단일 프롬프트에서 자동 샷 세그먼테이션
멀티 캐릭터 상호작용 이해
카메라 움직임 및 감정적 단서
환경 디테일 보존

이미지-비디오(I2V)

향상됨

개선된 모션 일관성으로 정지 이미지를 모션 비디오로 변환. 제품 쇼케이스, 사진 애니메이션, 비주얼 스토리텔링에 이상적입니다.

제품의 정확한 텍스트 렌더링
프레임 간 스타일 일관성
정지 이미지에서 자연스러운 모션
내러티브 중심 비주얼 최적화

참조 비디오 변환(R2V)

신규

참조 비디오(2~30초)를 업로드하여 캐릭터 외관, 동작 패턴, 음성을 보존합니다. 캐릭터 중심 콘텐츠를 위한 최강의 일관성 보장.

완전한 캐릭터 정체성 보존
음성 특성 추출
동작 패턴 복제
다중 캐릭터 합동 연기 장면

완벽한 용도

마케팅 & 광고

텍스트 렌더링 포함 제품 데모, 캐릭터 일관성 있는 브랜드 캠페인, 프로모션 비디오

콘텐츠 제작

YouTube 비디오, 소셜 미디어 릴스, 멀티샷 스토리텔링, 비디오 편집 워크플로

이커머스

정확한 텍스트가 있는 제품 쇼케이스, 튜토리얼 비디오, 고객 후기 재현

교육 & 훈련

교육 콘텐츠, 강좌 자료, 멀티 장면 교육 내러티브

엔터테인먼트

단편 영화, 캐릭터 중심 스토리, 시네마틱 시퀀스, 창의적 실험

프리비주얼라이제이션

영화 컨셉 개발, 스토리보드 제작, 프로덕션을 위한 장면 계획

Wan 2.6 T2V, I2V, R2V API 통합

텍스트-비디오, 이미지-비디오, 참조 비디오 변환을 위한 완전한 API 스위트

텍스트-비디오 API(T2V API)

저희 Wan 2.6 T2V API는 텍스트 프롬프트를 자동 장면 세그먼테이션이 있는 멀티샷 시네마틱 비디오로 변환합니다. 네이티브 오디오 동기화를 갖춘 최대 15초의 전문 1080p 비디오를 생성하세요.

단일 프롬프트에서 멀티샷 스토리텔링

3막 구조를 가진 15초 지속 시간

복잡한 장면을 위한 향상된 프롬프트 이해

유연한 종횡비: 16:9, 9:16, 1:1

이미지-비디오 API(I2V API)

저희 Wan 2.6 I2V API는 정밀한 모션 제어와 텍스트 렌더링으로 정지 이미지에 생동감을 불어넣습니다. 제품 비디오, 사진 애니메이션, 브랜드 콘텐츠 제작에 완벽합니다.

제품 및 사이니지의 정확한 텍스트 렌더링

애니메이션 프레임 간 스타일 일관성

개선된 일관성을 가진 자연스러운 모션

내러티브 최적화된 비주얼 출력

참조 비디오 변환 API(R2V API)

저희 Wan 2.6 R2V API는 참조 비디오에서 캐릭터 정체성을 보존합니다. 외관, 음성, 동작 패턴을 추출하여 일관된 캐릭터 생성을 위해 2~30초 클립을 업로드하세요.

캐릭터 외관 및 정체성 보존

음성 특성 추출 및 복제

동작 패턴 분석 및 재현

멀티 캐릭터 장면 지원

💡

완전한 API 스위트

모든 3가지 Wan 2.6 API 모드(T2V API, I2V API, R2V API)는 포괄적인 문서와 함께 RESTful 아키텍처를 지원합니다. Python, Node.js 등을 위한 SDK로 시작하세요. 각 엔드포인트에는 네이티브 오디오-비주얼 동기화 및 완전한 상업적 사용권이 포함됩니다.

Wan 2.6 시작하기

두 가지 간단한 경로로 몇 분 안에 전문 비디오 제작 시작

API 통합

애플리케이션을 구축하는 개발자용

가입 및 로그인

Atlas Cloud 계정을 만들거나 로그인하여 콘솔에 액세스

결제 방법 추가

청구 섹션에서 신용카드를 연결하여 계정에 자금 충전

API 키 생성

콘솔 → API 키로 이동하여 인증 키 생성

빌드 시작

T2V, I2V 또는 R2V API 엔드포인트를 사용하여 Wan 2.6을 애플리케이션에 통합

Playground 경험

빠른 테스트 및 실험용

가입 및 로그인

Atlas Cloud 계정을 만들거나 로그인하여 플랫폼에 액세스

결제 방법 추가

청구 섹션에서 신용카드를 연결하여 시작

Playground 사용

Wan 2.6 playground로 이동하여 T2V/I2V/R2V 모드를 선택하고 즉시 비디오 생성

💡

프로 팁: 먼저 Playground에서 다양한 생성 모드를 테스트하여 사용 사례에 가장 적합한 것을 이해한 다음 프로덕션 규모를 위해 해당 API를 통합하세요.

자주 묻는 질문

Wan 2.6의 멀티샷 기능의 고유성은 무엇인가요?

Wan 2.6은 스토리보드 로직을 진정으로 이해하는 최초의 모델입니다. 지저분한 "모핑" 효과를 만든 Wan 2.5와 달리, Wan 2.6은 단일 프롬프트를 일관된 전환을 가진 여러 개의 명확한 샷으로 자동 세그먼트화하여 장면 전환을 통해 캐릭터 일관성을 유지할 수 있습니다.

참조 비디오 변환(R2V)은 어떻게 작동하나요?

2~30초 참조 비디오를 업로드하면 Wan 2.6이 캐릭터의 외관, 동작 패턴, 음성 특성을 추출합니다. 그런 다음 일관된 정체성을 가진 동일한 캐릭터를 특징으로 하는 새 비디오를 생성할 수 있습니다—캐릭터 중심 콘텐츠 시리즈를 만드는 데 이상적입니다.

지원되는 비디오 형식과 지속 시간은?

Wan 2.6은 5~15초 지속 시간으로 24fps의 1080p 비디오를 생성합니다. 지원되는 종횡비에는 16:9(YouTube), 9:16(Instagram Reels/TikTok), 1:1(정사각형 형식)이 포함되며 각 플랫폼에 최적화되어 있어 후반 작업 크롭이 필요하지 않습니다.

Wan 2.6은 비디오에서 텍스트를 렌더링할 수 있나요?

네! Wan 2.6은 제품 패키징, 사이니지, 브랜드 콘텐츠를 위한 업계 최고의 텍스트 렌더링을 갖추고 있습니다. 이 모델은 비디오 프레임 내에 명확하고 읽기 쉬운 텍스트를 생성할 수 있습니다—이것은 Seedance와 대부분의 경쟁사가 부족한 중요한 기능입니다.

T2V, I2V, R2V 모드의 차이점은 무엇인가요?

T2V(텍스트-비디오)는 멀티샷 기능을 갖춘 텍스트 프롬프트에서 생성합니다. I2V(이미지-비디오)는 정확한 텍스트 렌더링으로 정지 이미지를 애니메이션화합니다. R2V(참조 비디오 변환)는 비디오 참조를 사용하여 생성 전반에 걸쳐 캐릭터 정체성을 보존합니다. 입력 유형과 일관성 요구 사항에 따라 선택하세요.

생성된 비디오에 대한 상업적 권리가 있나요?

네! 모든 Wan 2.6 생성물에는 완전한 상업적 사용권이 포함되어 있습니다. 비디오는 추가 라이선스 요구 사항 없이 마케팅 캠페인, 클라이언트 결과물, 브랜드 콘텐츠 및 상업적 애플리케이션에 프로덕션 준비가 되어 있습니다.

Atlas Cloud에서 Wan 2.6을 사용하는 이유

전문 비디오 생성 워크플로를 위한 엔터프라이즈급 인프라 활용

목적별 인프라

까다로운 AI 비디오 워크로드에 특별히 최적화된 인프라에 Wan 2.6의 멀티샷 생성 및 R2V 기능을 배포하세요. 1080p 15초 생성을 위한 최대 성능.

모든 모델을 위한 통합 API

하나의 통합 API를 통해 Wan 2.6(T2V, I2V, R2V)과 300개 이상의 AI 모델(LLM, 이미지, 비디오, 오디오)에 액세스하세요. 일관된 인증으로 모든 생성형 AI 요구 사항을 위한 단일 통합.

경쟁력 있는 가격

투명한 종량제 가격으로 AWS 대비 최대 70% 절감. 숨겨진 수수료나 약정 없이—부담 없이 프로토타입에서 프로덕션으로 확장하세요.

SOC I & II 인증 보안

SOC I & II 인증 및 HIPAA 규정 준수로 참조 비디오와 생성된 콘텐츠를 보호합니다. 암호화된 전송 및 스토리지를 갖춘 엔터프라이즈급 보안.

99.9% 가동 시간 SLA

보장된 99.9% 가동 시간을 갖춘 엔터프라이즈급 안정성. Wan 2.6 멀티샷 비디오 생성은 프로덕션 캠페인 및 중요한 콘텐츠 워크플로를 위해 항상 사용 가능합니다.

손쉬운 통합

REST API 및 다국어 SDK(Python, Node.js, Go)로 몇 분 안에 완전한 통합. 통합 엔드포인트 구조로 T2V, I2V, R2V 모드 간 원활한 전환.

99.9%

가동 시간

70%

AWS 대비 낮은 비용

300+

생성형 AI 모델

24/7

전문 지원

기술 사양

Architecture

멀티모달 이해를 갖춘 고급 Transformer

Resolution

1080p(풀 HD)

Frame Rate

24 FPS

Duration

5~15초(모드 의존)

Aspect Ratios

16:9, 9:16, 1:1

Generation Modes

T2V, I2V, R2V

Audio

립싱크를 지원하는 네이티브 동기화

Commercial Rights

완전한 상업적 사용 포함

전문가급 멀티샷 비디오 생성 경험

Wan 2.6의 획기적인 멀티샷 스토리텔링과 캐릭터 일관성 기능으로 비디오 제작을 혁신하고 있는 전 세계 콘텐츠 크리에이터, 마케터, 영화 제작자들과 함께하세요.

Alibaba WAN 2.6 Image Edit

Alibaba WAN 2.6 Image Edit enables you to upload an existing visual and specify the desired adjustments. The model preserves layout and subject structure while implementing high-quality updates based on natural language.

Why creators love it

Structure-preserving edits: Make lighting, color, or object changes without breaking composition.
Text-guided styling: Reimagine materials, moods, or art styles with concise prompts.
Prompt expansion on demand: Enable automatic prompt enrichment when you need extra detail.
Flexible output sizes: Pick the resolution that best matches your downstream workflow.

Perfect for

Marketing and design teams refining campaign visuals.
E-commerce sellers upgrading product imagery.
Content creators polishing thumbnails, covers, and posts.
Artists experimenting with variations of their original work.

Billing rules

Minimum charge: 1 image.
Total cost = number of images × price per resolution.

How to use

Provide the image you want to refine. (Image dimensions must be in (384, 5000))
Describe the desired adjustments in the prompt.
Choose the target resolution and submit.
Review the enhanced output and download the version you like best.

Pro tips

Start with clear instructions about colors, lighting, or objects to adjust.
Pair positive and negative prompts to control what should or should not appear.
Keep source images at or above your target resolution for optimal fidelity.

Note

If you did not upload the image locally, please ensure that the image URL is accessible! A successfully accessible image will display a preview in the interface.

Recommended Resolutions

Aspect Ratio	Exact (W×H)	Exact Pixels	Rounded (W×H, ÷64)	Rounded Pixels
1:1	1448 × 1448	2,096,704	1408 × 1408	1,982,464
3:2	1773 × 1182	2,095,686	1728 × 1152	1,990,656
4:3	1672 × 1254	2,096,688	1664 × 1216	2,023,424
16:9	1936 × 1089	2,108,304	1920 × 1088	2,088,960
21:9	2212 × 948	2,096,976	2176 × 960	2,088,960
1:1	1024 × 1024	1,048,576	1024 × 1024	1,048,576
3:2	1254 × 836	1,048,344	1216 × 832	1,011,712
4:3	1182 × 887	1,048,434	1152 × 896	1,032,192
16:9	1365 × 768	1,048,320	1344 × 768	1,032,192
21:9	1564 × 670	1,047,880	1536 × 640	983,040
1:1	323 × 323	104,329	320 × 320	102,400
3:2	397 × 264	104,808	384 × 256	98,304
4:3	374 × 280	104,720	448 × 320	143,360
16:9	432 × 243	104,976	448 × 256	114,688
21:9	495 × 212	104,940	576 × 256	147,456

유사한 모델 탐색

Wan-2.7 Pro Image-to-image

Edits and recomposes images with Wan 2.7 image pro using text instructions and multi-image references for higher quality outputs.

Wan-2.7 Pro Text-to-image

Generates images from text prompts with Wan 2.7 image pro, supporting higher fidelity outputs and 4K-ready workflows.

Wan-2.7 Image-to-image

Edits and recomposes images with Wan 2.7 image using text instructions, multi-image references, and optional interaction boxes.

Wan-2.7 Text-to-image

Generates images from text prompts with Wan 2.7 image, supporting fast iteration and strong prompt fidelity for illustration and photorealistic outputs.

Qwen Image 2.0 Pro Text-to-image

Qwen Image 2.0 Pro is a professional-grade text-to-image model with superior quality and advanced prompt understanding. Up to 2k. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Qwen Image 2.0 Pro Edit

Qwen Image 2.0 Pro Edit is a professional-grade image editing model with superior quality and advanced instruction understanding. Up to 2k. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Qwen Image 2.0 Edit

Qwen Image 2.0 Edit is an advanced image-editing model with improved quality and better understanding of instructions. Up to 2k. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Qwen Image 2.0 Text-to-image

Qwen Image 2.0 is an advanced text-to-image model with enhanced image quality and improved prompt understanding. Up to 2k. Ready-to-use REST inference API, best performance, no coldstarts, affordable pricing.

Qwen-Image Edit Plus 20251215

Supports multiple image inputs and outputs, allowing for precise modification of text within images, addition, deletion, or movement of objects, alteration of subject actions, transfer of image styles, and enhancement of image details.

From$0.03/이미지

$0.021/이미지

-30%