atlascloud/wan-2.6-spicy/image-to-video

画像から動画

Wan 2.6 Spicy Image-to-Video API by Atlas Cloud

atlascloud/wan-2.6-spicy/image-to-video

Image-to-video

AtlasCloud Wan 2.6 Spicy Image-to-Video turns a reference image into a short motion clip with expressive character movement and stable temporal detail.

入力

パラメータ設定を読み込み中...

出力

待機中

生成された動画がここに表示されます

設定を構成して「実行」をクリックして開始

各実行には$0.07かかります。$10で約142回実行できます。

次にできること：

Seedance 2.0 Kling v3 Vidu Wan2.7

パラメータ

コード例
import requests
import time

# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "atlascloud/wan-2.6-spicy/image-to-video",
    "prompt": "A beautiful sunset over the ocean with gentle waves",
    "width": 512,
    "height": 512,
    "duration": 3,
    "fps": 24,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] in ["completed", "succeeded"]:
            print("Generated video:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

video_url = check_status()

インストール

お使いの言語に必要なパッケージをインストールしてください。

bash

pip install requests

認証

すべての API リクエストには API キーによる認証が必要です。API キーは Atlas Cloud ダッシュボードから取得できます。

bash

export ATLASCLOUD_API_KEY="your-api-key-here"

HTTP ヘッダー

python

import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}

API キーを安全に保管してください

API キーをクライアントサイドのコードや公開リポジトリに公開しないでください。代わりに環境変数またはバックエンドプロキシを使用してください。

リクエストを送信

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

リクエストを送信

非同期生成リクエストを送信します。API は予測 ID を返し、それを使用してステータスの確認や結果の取得ができます。

POST/api/v1/model/generateVideo

リクエストボディ

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "atlascloud/wan-2.6-spicy/image-to-video",
    "input": {
        "prompt": "A beautiful sunset over the ocean with gentle waves"
    }
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")

レスポンス

{
  "id": "pred_abc123",
  "status": "processing",
  "model": "model-name",
  "created_at": "2025-01-01T00:00:00Z"
}

ステータスを確認

予測エンドポイントをポーリングして、リクエストの現在のステータスを確認します。

GET/api/v1/model/prediction/{prediction_id}

ポーリング例

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

ステータス値

processingリクエストはまだ処理中です。

completed生成が完了しました。出力が利用可能です。

succeeded生成が成功しました。出力が利用可能です。

failed生成に失敗しました。エラーフィールドを確認してください。

完了レスポンス

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.mp4"
    ],
    "metrics": {
      "predict_time": 45.2
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

ファイルをアップロード

Atlas Cloud ストレージにファイルをアップロードし、API リクエストで使用できる URL を取得します。multipart/form-data を使用してアップロードします。

POST/api/v1/model/uploadMedia

アップロード例

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

レスポンス

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

入力 Schema

以下のパラメータがリクエストボディで使用できます。

合計: 0必須: 0任意: 0

利用可能なパラメータはありません。

リクエストボディの例

json

{
  "model": "atlascloud/wan-2.6-spicy/image-to-video"
}

出力 Schema

API は生成された出力 URL を含む予測レスポンスを返します。

idstringrequired

Unique identifier for the prediction.

statusstringrequired

Current status of the prediction.

processingcompletedsucceededfailed

modelstringrequired

The model used for generation.

outputsarray[string]

Array of output URLs. Available when status is "completed".

errorstring

Error message if status is "failed".

metricsobject

Performance metrics.

predict_timenumber

Time taken for video generation in seconds.

created_atstringrequired

ISO 8601 timestamp when the prediction was created.

Format: date-time

completed_atstring

ISO 8601 timestamp when the prediction was completed.

Format: date-time

レスポンス例

json

{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.mp4"
  ],
  "metrics": {
    "predict_time": 45.2
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills は 300 以上の AI モデルを AI コーディングアシスタントに直接統合します。ワンコマンドでインストールし、自然言語で画像・動画生成や LLM との対話が可能です。

対応クライアント

Claude Code

OpenAI Codex

Gemini CLI

Cursor

Windsurf

VS Code

Trae

GitHub Copilot

Cline

Roo Code

Amp

Goose

Replit

40+ 対応クライアント

インストール

bash

npx skills add AtlasCloudAI/atlas-cloud-skills

API キーの設定

Atlas Cloud ダッシュボードから API キーを取得し、環境変数として設定してください。

bash

export ATLASCLOUD_API_KEY="your-api-key-here"

機能

インストール後、AI アシスタントで自然言語を使用してすべての Atlas Cloud モデルにアクセスできます。

画像生成Nano Banana 2、Z-Image などのモデルで画像を生成します。

動画作成Kling、Vidu、Veo などでテキストや画像から動画を作成します。

LLM チャットQwen、DeepSeek などの大規模言語モデルと対話します。

メディアアップロード画像編集や画像から動画へのワークフロー用にローカルファイルをアップロードします。

詳細を見る

github.com/AtlasCloudAI/atlas-cloud-skills

MCP Server

Atlas Cloud MCP Server は Model Context Protocol を通じて IDE と 300 以上の AI モデルを接続します。MCP 対応のあらゆるクライアントで動作します。

対応クライアント

Cursor

VS Code

Windsurf

Claude Code

OpenAI Codex

Gemini CLI

Cline

Roo Code

100+ 対応クライアント

インストール

bash

npx -y atlascloud-mcp

設定

以下の設定を IDE の MCP 設定ファイルに追加してください。

json

{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

利用可能なツール

atlas_generate_imageテキストプロンプトから画像を生成します。

atlas_generate_videoテキストや画像から動画を作成します。

atlas_chat大規模言語モデルと対話します。

atlas_list_models300 以上の利用可能な AI モデルを閲覧します。

atlas_quick_generateモデル自動選択によるワンステップコンテンツ作成。

atlas_upload_mediaAPI ワークフロー用にローカルファイルをアップロードします。

詳細を見る

github.com/AtlasCloudAI/mcp-server

APIスキーマ

スキーマが利用できません

リクエスト履歴を表示するにはログインしてください

モデルのリクエスト履歴にアクセスするにはログインが必要です。

ログイン

🎬マルチショット動画生成

Wan 2.6プロフェッショナルマルチショットAI動画制作

Alibabaの最新AI動画生成技術の飛躍的進化。マルチショットストーリーテリング、リファレンス駆動のキャラクター一貫性、ネイティブオーディオビジュアル同期を備えた最大15秒の1080p動画を作成。ストーリーボードロジックを真に理解した初のシネマティックナラティブモデル。

革命的なブレークスルー

Wan 2.6がAI動画生成のゲームチェンジャーである理由

マルチショットストーリーテリング

ストーリーボードロジックを理解する初のモデル。シーン変更を通じてキャラクターの外観と環境の一貫性を維持しながら、一貫したトランジションを持つ連続ショットを自動生成—単一の15秒生成で完全なストーリーアークを実現。

リファレンス動画変換(R2V)

2〜30秒のリファレンス動画をアップロードして、キャラクターの外観、動きパターン、音声特性を抽出・保存。複数の動画にわたって前例のない精度で一貫したキャラクターパフォーマンスを作成。

正確なテキストレンダリング

製品パッケージ、看板、ブランドコンテンツ向けの業界最先端のテキストレンダリング機能。動画フレーム内に明瞭で読みやすいテキストを生成—マーケティングと商用アプリケーションに不可欠。

コア機能

15秒の長時間生成

完全な「三幕構成」（設定→展開→解決）を持つ最大15秒の動画を生成

プロフェッショナル1080p品質

シネマティック品質と強化された視覚安定性を備えた24fpsのネイティブ1080p出力

ネイティブオーディオ同期

口の動きとセリフが一致し、ペーシングに合わせた背景音楽、完璧にトリガーされる効果音

キャラクター一貫性

ショットと複数の動画を通じてキャラクターの外観、衣装、アイデンティティを維持

シネマティックカメラコントロール

パン、ズーム、トラッキングショット、ドリー移動を含むプロフェッショナルカメラムーブメント

柔軟なアスペクト比

16:9（YouTube）、9:16（リール）、1:1（スクエア）—ポストプロダクションクロッピング不要のプラットフォーム最適化

Wan 2.6 vs Wan 2.5:主要な改善点

最新リリースの新機能をご覧ください

動画時間

最大15秒

Wan 2.5:最大10秒

マルチショット機能

ストーリーボードロジックを理解

Wan 2.5:単一ショットまたは乱雑なモーフィング

リファレンス動画サポート

完全保存のR2Vモード

Wan 2.5:画像リファレンスのみ

キャラクター一貫性

ショット間で優れた性能

Wan 2.5:キャラクターのドリフト問題

モーション安定性

ジッターとアーティファクトを削減

Wan 2.5:時折フレームドリフト

プロンプト理解

複雑なマルチキャラクターシーン

Wan 2.5:基本的なシーン生成

3つの専門生成モード

クリエイティブワークフローに適したモードを選択

テキストto動画(T2V)

最も人気

強化されたマルチショットセグメンテーションと改善されたプロンプト処理を備えたテキストプロンプトから完全な動画を生成。ストーリーテリングとクリエイティブ探求に最適。

単一プロンプトからの自動ショットセグメンテーション
マルチキャラクターインタラクション理解
カメラムーブメントと感情的手がかり
環境ディテール保存

画像to動画(I2V)

強化版

モーションコヒーレンスを改善して静止画像をモーション動画に変換。製品ショーケース、写真アニメーション、ビジュアルストーリーテリングに最適。

製品の正確なテキストレンダリング
フレーム間のスタイル一貫性
静止画像からの自然なモーション
ナラティブ駆動のビジュアル最適化

リファレンス動画変換(R2V)

新機能

リファレンス動画（2〜30秒）をアップロードして、キャラクターの外観、動きパターン、音声を保存。キャラクター駆動コンテンツの最強の一貫性保証。

完全なキャラクターアイデンティティ保存
音声特性抽出
動きパターンの複製
マルチキャラクター共演シーン

最適な用途

マーケティング&広告

テキストレンダリング付き製品デモ、キャラクター一貫性のあるブランドキャンペーン、プロモーション動画

コンテンツ制作

YouTube動画、ソーシャルメディアリール、マルチショットストーリーテリング、動画編集ワークフロー

eコマース

正確なテキスト付き製品ショーケース、チュートリアル動画、顧客証言の再現

教育&トレーニング

教育コンテンツ、コース教材、マルチシーン教育ナラティブ

エンターテインメント

短編映画、キャラクター駆動ストーリー、シネマティックシーケンス、クリエイティブ実験

プリビジュアライゼーション

映画コンセプト開発、ストーリーボード作成、制作のシーンプランニング

Wan 2.6 T2V、I2V、R2V API統合

テキストto動画、画像to動画、リファレンス動画変換の完全APIスイート

テキストto動画API(T2V API)

当社のWan 2.6 T2V APIは、テキストプロンプトを自動シーンセグメンテーション付きのマルチショットシネマティック動画に変換。ネイティブオーディオ同期を備えた最大15秒のプロフェッショナル1080p動画を生成。

単一プロンプトからのマルチショットストーリーテリング

三幕構成を持つ15秒時間

複雑なシーンの強化されたプロンプト理解

柔軟なアスペクト比:16:9、9:16、1:1

画像to動画API(I2V API)

当社のWan 2.6 I2V APIは、正確なモーションコントロールとテキストレンダリングで静止画像に命を吹き込みます。製品動画、写真アニメーション、ブランドコンテンツ制作に最適。

製品と看板の正確なテキストレンダリング

アニメーションフレーム間のスタイル一貫性

改善されたコヒーレンスを持つ自然なモーション

ナラティブ最適化されたビジュアル出力

リファレンス動画変換API(R2V API)

当社のWan 2.6 R2V APIは、リファレンス動画からキャラクターアイデンティティを保存。外観、音声、動きパターンを抽出して一貫したキャラクター生成を実現する2〜30秒のクリップをアップロード。

キャラクター外観とアイデンティティの保存

音声特性の抽出と複製

動きパターンの分析と再現

マルチキャラクターシーンのサポート

💡

完全なAPIスイート

すべての3つのWan 2.6 APIモード(T2V API、I2V API、R2V API)は、包括的なドキュメントを備えたRESTfulアーキテクチャをサポート。Python、Node.jsなどのSDKで開始。各エンドポイントにはネイティブオーディオビジュアル同期と完全な商用利用権が含まれます。

Wan 2.6の始め方

2つのシンプルなパスで数分でプロフェッショナル動画作成を開始

API統合

アプリケーションを構築する開発者向け

サインアップ&ログイン

Atlas Cloudアカウントを作成するか、ログインしてコンソールにアクセス

支払い方法の追加

請求セクションでクレジットカードを紐付けてアカウントに入金

APIキーの生成

コンソール→APIキーに移動して認証キーを作成

構築開始

T2V、I2V、またはR2V APIエンドポイントを使用してWan 2.6をアプリケーションに統合

Playground体験

クイックテストと実験向け

サインアップ&ログイン

Atlas Cloudアカウントを作成するか、ログインしてプラットフォームにアクセス

支払い方法の追加

請求セクションでクレジットカードを紐付けて開始

Playgroundを使用

Wan 2.6 playgroundに移動し、T2V/I2V/R2Vモードを選択して即座に動画を生成

💡

プロのヒント: まずPlaygroundでさまざまな生成モードをテストして、ユースケースに最適なものを理解してから、本番スケール用の対応するAPIを統合してください。

よくある質問

Wan 2.6のマルチショット機能の独自性は何ですか?

Wan 2.6は、ストーリーボードロジックを真に理解する初のモデルです。乱雑な「モーフィング」効果を生み出したWan 2.5とは異なり、Wan 2.6は単一のプロンプトを一貫したトランジションを持つ複数の明確なショットに自動的にセグメント化し、シーン変更を通じてキャラクターの一貫性を維持できます。

リファレンス動画変換(R2V)はどのように機能しますか?

2〜30秒のリファレンス動画をアップロードすると、Wan 2.6はキャラクターの外観、動きパターン、音声特性を抽出します。その後、同じキャラクターをフィーチャーした新しい動画を一貫したアイデンティティで生成できます—キャラクター駆動のコンテンツシリーズの作成に最適です。

サポートされている動画形式と時間は?

Wan 2.6は、5〜15秒の時間で24fpsの1080p動画を生成します。サポートされているアスペクト比には、16:9(YouTube)、9:16(Instagram Reels/TikTok)、1:1(スクエアフォーマット)が含まれ、各プラットフォーム向けに最適化されており、ポストプロダクションクロッピングは不要です。

Wan 2.6は動画内でテキストをレンダリングできますか?

はい!Wan 2.6は、製品パッケージ、看板、ブランドコンテンツ向けの業界最先端のテキストレンダリングを備えています。モデルは動画フレーム内に明瞭で読みやすいテキストを生成できます—これはSeedanceとほとんどの競合他社が欠いている重要な機能です。

T2V、I2V、R2Vモードの違いは何ですか?

T2V(テキストto動画)は、マルチショット機能を備えたテキストプロンプトから生成します。I2V(画像to動画)は、正確なテキストレンダリングで静止画像をアニメーション化します。R2V(リファレンス動画変換)は、動画リファレンスを使用して生成間でキャラクターアイデンティティを保存します。入力タイプと一貫性のニーズに基づいて選択してください。

生成された動画の商用権はありますか?

はい!すべてのWan 2.6作成には完全な商用利用権が付属します。動画は、追加のライセンス要件なしに、マーケティングキャンペーン、クライアント成果物、ブランドコンテンツ、商用アプリケーション向けに本番レディです。

Atlas CloudでWan 2.6を使用する理由

プロフェッショナル動画生成ワークフロー向けのエンタープライズグレードインフラストラクチャを活用

専用インフラストラクチャ

要求の厳しいAI動画ワークロード向けに特別に最適化されたインフラストラクチャにWan 2.6のマルチショット生成とR2V機能を展開。1080p 15秒生成の最大パフォーマンス。

すべてのモデル向け統一API

1つの統一APIを通じて、Wan 2.6(T2V、I2V、R2V)と300以上のAIモデル(LLM、画像、動画、音声)にアクセス。一貫した認証ですべての生成AI ニーズに単一統合。

競争力のある価格

透明な従量課金制の価格でAWSと比較して最大70%節約。隠れた料金や契約なし—銀行を壊すことなくプロトタイプから本番にスケール。

SOC I & II認定セキュリティ

SOC I & II認定とHIPAAコンプライアンスでリファレンス動画と生成コンテンツを保護。暗号化された伝送とストレージを備えたエンタープライズグレードのセキュリティ。

99.9%稼働時間SLA

保証された99.9%稼働時間を備えたエンタープライズグレードの信頼性。Wan 2.6マルチショット動画生成は、本番キャンペーンと重要なコンテンツワークフローで常に利用可能。

簡単な統合

REST APIと多言語SDK(Python、Node.js、Go)で数分で完全統合。統一されたエンドポイント構造でT2V、I2V、R2Vモード間をシームレスに切り替え。

99.9%

稼働時間

70%

AWS比低コスト

300+

生成AIモデル

24/7

プロサポート

技術仕様

Architecture

マルチモーダル理解を備えた高度なTransformer

Resolution

1080p(フルHD)

Frame Rate

24 FPS

Duration

5〜15秒(モード依存)

Aspect Ratios

16:9、9:16、1:1

Generation Modes

T2V、I2V、R2V

Audio

リップシンク付きネイティブ同期

Commercial Rights

完全な商用利用が含まれます

プロフェッショナルマルチショット動画生成を体験

Wan 2.6の画期的なマルチショットストーリーテリングとキャラクター一貫性機能で動画制作を革新している世界中のコンテンツクリエーター、マーケター、映画製作者に参加してください。

Wan 2.6 Spicy Image-to-Video

Wan 2.6 Spicy Image-to-Video turns a first-frame image into a short motion clip with expressive character movement and stable temporal detail. This AtlasCloud variant uses a dedicated Wan 2.6 image-to-video LoRA deployment for a more stylized motion profile.

Highlights

First-frame image-to-video: Use one starting image plus a text prompt to control movement and camera direction.
720p and 1080p output: 480p is not exposed because the underlying deployment does not support it.
Short-form generation: Supports 5s, 10s, and 15s clips.
Optional audio control: Provide an audio URL to guide motion, or disable generated audio for silent output.
Negative prompt support: Add optional constraints to reduce blur, distortion, or unwanted artifacts.

Parameters

Parameter	Required	Description
`model`	Yes	`atlascloud/wan-2.6-spicy/image-to-video`
`prompt`	Yes	Text prompt describing the desired motion.
`image`	Yes	First-frame image URL or Base64 image.
`audio`	No	Audio URL to guide the generated motion.
`negative_prompt`	No	Text describing what to avoid.
`resolution`	Yes	`720p` or `1080p`.
`duration`	No	`5`, `10`, or `15` seconds. Defaults to `5`.
`enable_prompt_expansion`	No	Enable upstream prompt expansion. Defaults to `false`.
`shot_type`	No	`single` or `multi`. Multi-shot mode requires prompt expansion. Defaults to `single`.
`generate_audio`	No	Whether to include generated audio. Defaults to `true`; set `false` for silent output.
`seed`	No	Random seed. `-1` means random.

How To Use

curl -X POST "https://api.atlascloud.ai/api/v1/model/generateVideo" \
  -H "Authorization: Bearer $AIP_API_KEY" \
  -H "Content-Type: application/json" \
  --data-raw '{
    "model": "atlascloud/wan-2.6-spicy/image-to-video",
    "prompt": "The woman turns toward the camera with a confident smile, hair moving naturally as the camera slowly pushes in.",
    "image": "https://static.atlascloud.ai/media/images/db548fe3bd5cafa4ef7e0141d69c8566.jpeg",
    "negative_prompt": "blurry, low quality, distorted hands, extra limbs",
    "duration": 5,
    "resolution": "720p",
    "generate_audio": true,
    "seed": -1
  }'

Pricing

Pricing matches Wan 2.6 Image-to-Video final user pricing.

Resolution	Multiplier	5s Price	10s Price	15s Price
720p	1.0x	`$0.35`	`$0.70`	`$1.05`
1080p	1.5x	`$0.525`	`$1.05`	`$1.575`

Formula:

effective_rate * max(5, duration) * (resolution == "1080p" || resolution == "1080P" ? 1.5 : 1)

effective_rate = $0.0700/s for 720p. 1080p uses a 1.5x multiplier.

Notes

This model is allowlist-enabled. Contact AtlasCloud if it is not visible or callable from your account.
480p is not exposed for this model.
This endpoint uses the input image as the first frame of the generated video.
shot_type: "multi" requires enable_prompt_expansion: true.
The underlying deployment accepts 720P and 1080P; AtlasCloud normalizes API input automatically.
Generation is asynchronous. Poll /api/v1/model/prediction/{request_id} for the final video URL.