alibaba/wan-2.6/text-to-image

Generates images based on text, supports various artistic styles and realistic photographic effects, and meets diverse creative needs.

TEXT-TO-IMAGEHOTNEW
Wan-2.6 Text-to-image
テキストから画像

Generates images based on text, supports various artistic styles and realistic photographic effects, and meets diverse creative needs.

入力

パラメータ設定を読み込み中...

出力

待機中
生成された画像がここに表示されます
設定を構成して「実行」をクリックして開始

各実行には0.021かかります。$10で約476回実行できます。

次にできること:

パラメータ

コード例

import requests
import time

# Step 1: Start image generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "alibaba/wan-2.6/text-to-image",
    "prompt": "A beautiful landscape with mountains and lake",
    "width": 512,
    "height": 512,
    "steps": 20,
    "guidance_scale": 7.5,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] == "completed":
            print("Generated image:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

image_url = check_status()

インストール

お使いの言語に必要なパッケージをインストールしてください。

bash
pip install requests

認証

すべての API リクエストには API キーによる認証が必要です。API キーは Atlas Cloud ダッシュボードから取得できます。

bash
export ATLASCLOUD_API_KEY="your-api-key-here"

HTTP ヘッダー

python
import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}
API キーを安全に保管してください

API キーをクライアントサイドのコードや公開リポジトリに公開しないでください。代わりに環境変数またはバックエンドプロキシを使用してください。

リクエストを送信

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

リクエストを送信

非同期生成リクエストを送信します。API は予測 ID を返し、それを使用してステータスの確認や結果の取得ができます。

POST/api/v1/model/generateImage

リクエストボディ

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "alibaba/wan-2.6/text-to-image",
    "input": {
        "prompt": "A beautiful landscape with mountains and lake"
    }
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")

レスポンス

{
  "id": "pred_abc123",
  "status": "processing",
  "model": "model-name",
  "created_at": "2025-01-01T00:00:00Z"
}

ステータスを確認

予測エンドポイントをポーリングして、リクエストの現在のステータスを確認します。

GET/api/v1/model/prediction/{prediction_id}

ポーリング例

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

ステータス値

processingリクエストはまだ処理中です。
completed生成が完了しました。出力が利用可能です。
succeeded生成が成功しました。出力が利用可能です。
failed生成に失敗しました。エラーフィールドを確認してください。

完了レスポンス

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.png"
    ],
    "metrics": {
      "predict_time": 8.3
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

ファイルをアップロード

Atlas Cloud ストレージにファイルをアップロードし、API リクエストで使用できる URL を取得します。multipart/form-data を使用してアップロードします。

POST/api/v1/model/uploadMedia

アップロード例

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

レスポンス

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

入力 Schema

以下のパラメータがリクエストボディで使用できます。

合計: 0必須: 0任意: 0

利用可能なパラメータはありません。

リクエストボディの例

json
{
  "model": "alibaba/wan-2.6/text-to-image"
}

出力 Schema

API は生成された出力 URL を含む予測レスポンスを返します。

idstringrequired
Unique identifier for the prediction.
statusstringrequired
Current status of the prediction.
processingcompletedsucceededfailed
modelstringrequired
The model used for generation.
outputsarray[string]
Array of output URLs. Available when status is "completed".
errorstring
Error message if status is "failed".
metricsobject
Performance metrics.
predict_timenumber
Time taken for image generation in seconds.
created_atstringrequired
ISO 8601 timestamp when the prediction was created.
Format: date-time
completed_atstring
ISO 8601 timestamp when the prediction was completed.
Format: date-time

レスポンス例

json
{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.png"
  ],
  "metrics": {
    "predict_time": 8.3
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills は 300 以上の AI モデルを AI コーディングアシスタントに直接統合します。ワンコマンドでインストールし、自然言語で画像・動画生成や LLM との対話が可能です。

対応クライアント

Claude Code
OpenAI Codex
Gemini CLI
Cursor
Windsurf
VS Code
Trae
GitHub Copilot
Cline
Roo Code
Amp
Goose
Replit
40+ 対応クライアント

インストール

bash
npx skills add AtlasCloudAI/atlas-cloud-skills

API キーの設定

Atlas Cloud ダッシュボードから API キーを取得し、環境変数として設定してください。

bash
export ATLASCLOUD_API_KEY="your-api-key-here"

機能

インストール後、AI アシスタントで自然言語を使用してすべての Atlas Cloud モデルにアクセスできます。

画像生成Nano Banana 2、Z-Image などのモデルで画像を生成します。
動画作成Kling、Vidu、Veo などでテキストや画像から動画を作成します。
LLM チャットQwen、DeepSeek などの大規模言語モデルと対話します。
メディアアップロード画像編集や画像から動画へのワークフロー用にローカルファイルをアップロードします。

MCP Server

Atlas Cloud MCP Server は Model Context Protocol を通じて IDE と 300 以上の AI モデルを接続します。MCP 対応のあらゆるクライアントで動作します。

対応クライアント

Cursor
VS Code
Windsurf
Claude Code
OpenAI Codex
Gemini CLI
Cline
Roo Code
100+ 対応クライアント

インストール

bash
npx -y atlascloud-mcp

設定

以下の設定を IDE の MCP 設定ファイルに追加してください。

json
{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

利用可能なツール

atlas_generate_imageテキストプロンプトから画像を生成します。
atlas_generate_videoテキストや画像から動画を作成します。
atlas_chat大規模言語モデルと対話します。
atlas_list_models300 以上の利用可能な AI モデルを閲覧します。
atlas_quick_generateモデル自動選択によるワンステップコンテンツ作成。
atlas_upload_mediaAPI ワークフロー用にローカルファイルをアップロードします。

APIスキーマ

スキーマが利用できません

リクエスト履歴を表示するにはログインしてください

モデルのリクエスト履歴にアクセスするにはログインが必要です。

ログイン
🎬マルチショット動画生成

Wan 2.6プロフェッショナルマルチショットAI動画制作

Alibabaの最新AI動画生成技術の飛躍的進化。マルチショットストーリーテリング、リファレンス駆動のキャラクター一貫性、ネイティブオーディオビジュアル同期を備えた最大15秒の1080p動画を作成。ストーリーボードロジックを真に理解した初のシネマティックナラティブモデル。

革命的なブレークスルー

Wan 2.6がAI動画生成のゲームチェンジャーである理由

マルチショットストーリーテリング

ストーリーボードロジックを理解する初のモデル。シーン変更を通じてキャラクターの外観と環境の一貫性を維持しながら、一貫したトランジションを持つ連続ショットを自動生成—単一の15秒生成で完全なストーリーアークを実現。

リファレンス動画変換(R2V)

2〜30秒のリファレンス動画をアップロードして、キャラクターの外観、動きパターン、音声特性を抽出・保存。複数の動画にわたって前例のない精度で一貫したキャラクターパフォーマンスを作成。

正確なテキストレンダリング

製品パッケージ、看板、ブランドコンテンツ向けの業界最先端のテキストレンダリング機能。動画フレーム内に明瞭で読みやすいテキストを生成—マーケティングと商用アプリケーションに不可欠。

コア機能

15秒の長時間生成

完全な「三幕構成」(設定→展開→解決)を持つ最大15秒の動画を生成

プロフェッショナル1080p品質

シネマティック品質と強化された視覚安定性を備えた24fpsのネイティブ1080p出力

ネイティブオーディオ同期

口の動きとセリフが一致し、ペーシングに合わせた背景音楽、完璧にトリガーされる効果音

キャラクター一貫性

ショットと複数の動画を通じてキャラクターの外観、衣装、アイデンティティを維持

シネマティックカメラコントロール

パン、ズーム、トラッキングショット、ドリー移動を含むプロフェッショナルカメラムーブメント

柔軟なアスペクト比

16:9(YouTube)、9:16(リール)、1:1(スクエア)—ポストプロダクションクロッピング不要のプラットフォーム最適化

Wan 2.6 vs Wan 2.5:主要な改善点

最新リリースの新機能をご覧ください

動画時間
最大15秒
Wan 2.5:最大10秒
マルチショット機能
ストーリーボードロジックを理解
Wan 2.5:単一ショットまたは乱雑なモーフィング
リファレンス動画サポート
完全保存のR2Vモード
Wan 2.5:画像リファレンスのみ
キャラクター一貫性
ショット間で優れた性能
Wan 2.5:キャラクターのドリフト問題
モーション安定性
ジッターとアーティファクトを削減
Wan 2.5:時折フレームドリフト
プロンプト理解
複雑なマルチキャラクターシーン
Wan 2.5:基本的なシーン生成

3つの専門生成モード

クリエイティブワークフローに適したモードを選択

テキストto動画(T2V)

最も人気

強化されたマルチショットセグメンテーションと改善されたプロンプト処理を備えたテキストプロンプトから完全な動画を生成。ストーリーテリングとクリエイティブ探求に最適。

  • 単一プロンプトからの自動ショットセグメンテーション
  • マルチキャラクターインタラクション理解
  • カメラムーブメントと感情的手がかり
  • 環境ディテール保存

画像to動画(I2V)

強化版

モーションコヒーレンスを改善して静止画像をモーション動画に変換。製品ショーケース、写真アニメーション、ビジュアルストーリーテリングに最適。

  • 製品の正確なテキストレンダリング
  • フレーム間のスタイル一貫性
  • 静止画像からの自然なモーション
  • ナラティブ駆動のビジュアル最適化

リファレンス動画変換(R2V)

新機能

リファレンス動画(2〜30秒)をアップロードして、キャラクターの外観、動きパターン、音声を保存。キャラクター駆動コンテンツの最強の一貫性保証。

  • 完全なキャラクターアイデンティティ保存
  • 音声特性抽出
  • 動きパターンの複製
  • マルチキャラクター共演シーン

最適な用途

マーケティング&広告

テキストレンダリング付き製品デモ、キャラクター一貫性のあるブランドキャンペーン、プロモーション動画

コンテンツ制作

YouTube動画、ソーシャルメディアリール、マルチショットストーリーテリング、動画編集ワークフロー

eコマース

正確なテキスト付き製品ショーケース、チュートリアル動画、顧客証言の再現

教育&トレーニング

教育コンテンツ、コース教材、マルチシーン教育ナラティブ

エンターテインメント

短編映画、キャラクター駆動ストーリー、シネマティックシーケンス、クリエイティブ実験

プリビジュアライゼーション

映画コンセプト開発、ストーリーボード作成、制作のシーンプランニング

Wan 2.6 T2V、I2V、R2V API統合

テキストto動画、画像to動画、リファレンス動画変換の完全APIスイート

テキストto動画API(T2V API)

当社のWan 2.6 T2V APIは、テキストプロンプトを自動シーンセグメンテーション付きのマルチショットシネマティック動画に変換。ネイティブオーディオ同期を備えた最大15秒のプロフェッショナル1080p動画を生成。

単一プロンプトからのマルチショットストーリーテリング
三幕構成を持つ15秒時間
複雑なシーンの強化されたプロンプト理解
柔軟なアスペクト比:16:9、9:16、1:1

画像to動画API(I2V API)

当社のWan 2.6 I2V APIは、正確なモーションコントロールとテキストレンダリングで静止画像に命を吹き込みます。製品動画、写真アニメーション、ブランドコンテンツ制作に最適。

製品と看板の正確なテキストレンダリング
アニメーションフレーム間のスタイル一貫性
改善されたコヒーレンスを持つ自然なモーション
ナラティブ最適化されたビジュアル出力

リファレンス動画変換API(R2V API)

当社のWan 2.6 R2V APIは、リファレンス動画からキャラクターアイデンティティを保存。外観、音声、動きパターンを抽出して一貫したキャラクター生成を実現する2〜30秒のクリップをアップロード。

キャラクター外観とアイデンティティの保存
音声特性の抽出と複製
動きパターンの分析と再現
マルチキャラクターシーンのサポート
💡

完全なAPIスイート

すべての3つのWan 2.6 APIモード(T2V API、I2V API、R2V API)は、包括的なドキュメントを備えたRESTfulアーキテクチャをサポート。Python、Node.jsなどのSDKで開始。各エンドポイントにはネイティブオーディオビジュアル同期と完全な商用利用権が含まれます。

Wan 2.6の始め方

2つのシンプルなパスで数分でプロフェッショナル動画作成を開始

API統合

アプリケーションを構築する開発者向け

1

サインアップ&ログイン

Atlas Cloudアカウントを作成するか、ログインしてコンソールにアクセス

2

支払い方法の追加

請求セクションでクレジットカードを紐付けてアカウントに入金

3

APIキーの生成

コンソール→APIキーに移動して認証キーを作成

4

構築開始

T2V、I2V、またはR2V APIエンドポイントを使用してWan 2.6をアプリケーションに統合

Playground体験

クイックテストと実験向け

1

サインアップ&ログイン

Atlas Cloudアカウントを作成するか、ログインしてプラットフォームにアクセス

2

支払い方法の追加

請求セクションでクレジットカードを紐付けて開始

3

Playgroundを使用

Wan 2.6 playgroundに移動し、T2V/I2V/R2Vモードを選択して即座に動画を生成

💡
プロのヒント: まずPlaygroundでさまざまな生成モードをテストして、ユースケースに最適なものを理解してから、本番スケール用の対応するAPIを統合してください。

よくある質問

Wan 2.6のマルチショット機能の独自性は何ですか?

Wan 2.6は、ストーリーボードロジックを真に理解する初のモデルです。乱雑な「モーフィング」効果を生み出したWan 2.5とは異なり、Wan 2.6は単一のプロンプトを一貫したトランジションを持つ複数の明確なショットに自動的にセグメント化し、シーン変更を通じてキャラクターの一貫性を維持できます。

リファレンス動画変換(R2V)はどのように機能しますか?

2〜30秒のリファレンス動画をアップロードすると、Wan 2.6はキャラクターの外観、動きパターン、音声特性を抽出します。その後、同じキャラクターをフィーチャーした新しい動画を一貫したアイデンティティで生成できます—キャラクター駆動のコンテンツシリーズの作成に最適です。

サポートされている動画形式と時間は?

Wan 2.6は、5〜15秒の時間で24fpsの1080p動画を生成します。サポートされているアスペクト比には、16:9(YouTube)、9:16(Instagram Reels/TikTok)、1:1(スクエアフォーマット)が含まれ、各プラットフォーム向けに最適化されており、ポストプロダクションクロッピングは不要です。

Wan 2.6は動画内でテキストをレンダリングできますか?

はい!Wan 2.6は、製品パッケージ、看板、ブランドコンテンツ向けの業界最先端のテキストレンダリングを備えています。モデルは動画フレーム内に明瞭で読みやすいテキストを生成できます—これはSeedanceとほとんどの競合他社が欠いている重要な機能です。

T2V、I2V、R2Vモードの違いは何ですか?

T2V(テキストto動画)は、マルチショット機能を備えたテキストプロンプトから生成します。I2V(画像to動画)は、正確なテキストレンダリングで静止画像をアニメーション化します。R2V(リファレンス動画変換)は、動画リファレンスを使用して生成間でキャラクターアイデンティティを保存します。入力タイプと一貫性のニーズに基づいて選択してください。

生成された動画の商用権はありますか?

はい!すべてのWan 2.6作成には完全な商用利用権が付属します。動画は、追加のライセンス要件なしに、マーケティングキャンペーン、クライアント成果物、ブランドコンテンツ、商用アプリケーション向けに本番レディです。

Atlas CloudでWan 2.6を使用する理由

プロフェッショナル動画生成ワークフロー向けのエンタープライズグレードインフラストラクチャを活用

専用インフラストラクチャ

要求の厳しいAI動画ワークロード向けに特別に最適化されたインフラストラクチャにWan 2.6のマルチショット生成とR2V機能を展開。1080p 15秒生成の最大パフォーマンス。

すべてのモデル向け統一API

1つの統一APIを通じて、Wan 2.6(T2V、I2V、R2V)と300以上のAIモデル(LLM、画像、動画、音声)にアクセス。一貫した認証ですべての生成AI ニーズに単一統合。

競争力のある価格

透明な従量課金制の価格でAWSと比較して最大70%節約。隠れた料金や契約なし—銀行を壊すことなくプロトタイプから本番にスケール。

SOC I & II認定セキュリティ

SOC I & II認定とHIPAAコンプライアンスでリファレンス動画と生成コンテンツを保護。暗号化された伝送とストレージを備えたエンタープライズグレードのセキュリティ。

99.9%稼働時間SLA

保証された99.9%稼働時間を備えたエンタープライズグレードの信頼性。Wan 2.6マルチショット動画生成は、本番キャンペーンと重要なコンテンツワークフローで常に利用可能。

簡単な統合

REST APIと多言語SDK(Python、Node.js、Go)で数分で完全統合。統一されたエンドポイント構造でT2V、I2V、R2Vモード間をシームレスに切り替え。

99.9%
稼働時間
70%
AWS比低コスト
300+
生成AIモデル
24/7
プロサポート

技術仕様

Architecture
マルチモーダル理解を備えた高度なTransformer
Resolution
1080p(フルHD)
Frame Rate
24 FPS
Duration
5〜15秒(モード依存)
Aspect Ratios
16:9、9:16、1:1
Generation Modes
T2V、I2V、R2V
Audio
リップシンク付きネイティブ同期
Commercial Rights
完全な商用利用が含まれます

プロフェッショナルマルチショット動画生成を体験

Wan 2.6の画期的なマルチショットストーリーテリングとキャラクター一貫性機能で動画制作を革新している世界中のコンテンツクリエーター、マーケター、映画製作者に参加してください。

Alibaba WAN 2.6 Text-to-Image Model

Alibaba WAN 2.6 is a cutting-edge text-to-image model on Alibaba Cloud’s DashScope. It generates high-quality, detailed images directly from text prompts and supports multiple output resolutions. The Tongyi Wanxiang text-to-image model generates images based on text, supporting various artistic styles and realistic photography effects to meet diverse creative needs.

What makes it stand out?

  • High Fidelity: Wan 2.6 produces crisp, detailed images that capture complex scene descriptions and artistic styles.
  • Creative Flexibility: From product design mockups to character art, Wan 2.6 supports diverse use cases and genres.
  • Multiple Styles & Formats: Choose from photo-realistic, anime, sketch, or artistic rendering modes—adaptable to your creative vision.
  • Customizable Size: Easily adjust width and height with simple sliders. Set the exact dimensions you need.

Designed For

  • Design teams: Quick iterations on visuals, product concepts, and campaign mockups.
  • Content creators: Generate unique visuals for blogs, social posts, and digital branding.
  • Storytellers & artists: Visualize characters, scenes, and worlds from simple text prompts.
  • Enterprises: Efficiently produce consistent visuals across marketing, training, and documentation.

Pricing

  • Every image is just cost $0.03!!

Billing Rules

  • Minimum charge: 1 image.
  • Total cost = number of images × price per resolution.

How to Use

  1. Write your prompt.
  2. Submit your request.
  3. Preview and download the generated image.

300以上のモデルから始める、

すべてのモデルを探索