Supports image editing and mixed text and image output to meet diverse generation and integration needs.
Supports image editing and mixed text and image output to meet diverse generation and integration needs.
Alibaba WAN 2.6 Image Edit enables you to upload an existing visual and specify the desired adjustments. The model preserves layout and subject structure while implementing high-quality updates based on natural language.
If you did not upload the image locally, please ensure that the image URL is accessible! A successfully accessible image will display a preview in the interface.
| Aspect Ratio | Exact (W×H) | Exact Pixels | Rounded (W×H, ÷64) | Rounded Pixels |
|---|---|---|---|---|
| 1:1 | 1448 × 1448 | 2,096,704 | 1408 × 1408 | 1,982,464 |
| 3:2 | 1773 × 1182 | 2,095,686 | 1728 × 1152 | 1,990,656 |
| 4:3 | 1672 × 1254 | 2,096,688 | 1664 × 1216 | 2,023,424 |
| 16:9 | 1936 × 1089 | 2,108,304 | 1920 × 1088 | 2,088,960 |
| 21:9 | 2212 × 948 | 2,096,976 | 2176 × 960 | 2,088,960 |
| 1:1 | 1024 × 1024 | 1,048,576 | 1024 × 1024 | 1,048,576 |
| 3:2 | 1254 × 836 | 1,048,344 | 1216 × 832 | 1,011,712 |
| 4:3 | 1182 × 887 | 1,048,434 | 1152 × 896 | 1,032,192 |
| 16:9 | 1365 × 768 | 1,048,320 | 1344 × 768 | 1,032,192 |
| 21:9 | 1564 × 670 | 1,047,880 | 1536 × 640 | 983,040 |
| 1:1 | 323 × 323 | 104,329 | 320 × 320 | 102,400 |
| 3:2 | 397 × 264 | 104,808 | 384 × 256 | 98,304 |
| 4:3 | 374 × 280 | 104,720 | 448 × 320 | 143,360 |
| 16:9 | 432 × 243 | 104,976 | 448 × 256 | 114,688 |
| 21:9 | 495 × 212 | 104,940 | 576 × 256 | 147,456 |
Alibabaの最新AI動画生成技術の飛躍的進化。マルチショットストーリーテリング、リファレンス駆動のキャラクター一貫性、ネイティブオーディオビジュアル同期を備えた最大15秒の1080p動画を作成。ストーリーボードロジックを真に理解した初のシネマティックナラティブモデル。
Wan 2.6がAI動画生成のゲームチェンジャーである理由
ストーリーボードロジックを理解する初のモデル。シーン変更を通じてキャラクターの外観と環境の一貫性を維持しながら、一貫したトランジションを持つ連続ショットを自動生成—単一の15秒生成で完全なストーリーアークを実現。
2〜30秒のリファレンス動画をアップロードして、キャラクターの外観、動きパターン、音声特性を抽出・保存。複数の動画にわたって前例のない精度で一貫したキャラクターパフォーマンスを作成。
製品パッケージ、看板、ブランドコンテンツ向けの業界最先端のテキストレンダリング機能。動画フレーム内に明瞭で読みやすいテキストを生成—マーケティングと商用アプリケーションに不可欠。
完全な「三幕構成」(設定→展開→解決)を持つ最大15秒の動画を生成
シネマティック品質と強化された視覚安定性を備えた24fpsのネイティブ1080p出力
口の動きとセリフが一致し、ペーシングに合わせた背景音楽、完璧にトリガーされる効果音
ショットと複数の動画を通じてキャラクターの外観、衣装、アイデンティティを維持
パン、ズーム、トラッキングショット、ドリー移動を含むプロフェッショナルカメラムーブメント
16:9(YouTube)、9:16(リール)、1:1(スクエア)—ポストプロダクションクロッピング不要のプラットフォーム最適化
最新リリースの新機能をご覧ください
クリエイティブワークフローに適したモードを選択
強化されたマルチショットセグメンテーションと改善されたプロンプト処理を備えたテキストプロンプトから完全な動画を生成。ストーリーテリングとクリエイティブ探求に最適。
モーションコヒーレンスを改善して静止画像をモーション動画に変換。製品ショーケース、写真アニメーション、ビジュアルストーリーテリングに最適。
リファレンス動画(2〜30秒)をアップロードして、キャラクターの外観、動きパターン、音声を保存。キャラクター駆動コンテンツの最強の一貫性保証。
テキストレンダリング付き製品デモ、キャラクター一貫性のあるブランドキャンペーン、プロモーション動画
YouTube動画、ソーシャルメディアリール、マルチショットストーリーテリング、動画編集ワークフロー
正確なテキスト付き製品ショーケース、チュートリアル動画、顧客証言の再現
教育コンテンツ、コース教材、マルチシーン教育ナラティブ
短編映画、キャラクター駆動ストーリー、シネマティックシーケンス、クリエイティブ実験
映画コンセプト開発、ストーリーボード作成、制作のシーンプランニング
テキストto動画、画像to動画、リファレンス動画変換の完全APIスイート
当社のWan 2.6 T2V APIは、テキストプロンプトを自動シーンセグメンテーション付きのマルチショットシネマティック動画に変換。ネイティブオーディオ同期を備えた最大15秒のプロフェッショナル1080p動画を生成。
当社のWan 2.6 I2V APIは、正確なモーションコントロールとテキストレンダリングで静止画像に命を吹き込みます。製品動画、写真アニメーション、ブランドコンテンツ制作に最適。
当社のWan 2.6 R2V APIは、リファレンス動画からキャラクターアイデンティティを保存。外観、音声、動きパターンを抽出して一貫したキャラクター生成を実現する2〜30秒のクリップをアップロード。
すべての3つのWan 2.6 APIモード(T2V API、I2V API、R2V API)は、包括的なドキュメントを備えたRESTfulアーキテクチャをサポート。Python、Node.jsなどのSDKで開始。各エンドポイントにはネイティブオーディオビジュアル同期と完全な商用利用権が含まれます。
2つのシンプルなパスで数分でプロフェッショナル動画作成を開始
アプリケーションを構築する開発者向け
Atlas Cloudアカウントを作成するか、ログインしてコンソールにアクセス
請求セクションでクレジットカードを紐付けてアカウントに入金
コンソール→APIキーに移動して認証キーを作成
T2V、I2V、またはR2V APIエンドポイントを使用してWan 2.6をアプリケーションに統合
クイックテストと実験向け
Atlas Cloudアカウントを作成するか、ログインしてプラットフォームにアクセス
請求セクションでクレジットカードを紐付けて開始
Wan 2.6 playgroundに移動し、T2V/I2V/R2Vモードを選択して即座に動画を生成
Wan 2.6は、ストーリーボードロジックを真に理解する初のモデルです。乱雑な「モーフィング」効果を生み出したWan 2.5とは異なり、Wan 2.6は単一のプロンプトを一貫したトランジションを持つ複数の明確なショットに自動的にセグメント化し、シーン変更を通じてキャラクターの一貫性を維持できます。
2〜30秒のリファレンス動画をアップロードすると、Wan 2.6はキャラクターの外観、動きパターン、音声特性を抽出します。その後、同じキャラクターをフィーチャーした新しい動画を一貫したアイデンティティで生成できます—キャラクター駆動のコンテンツシリーズの作成に最適です。
Wan 2.6は、5〜15秒の時間で24fpsの1080p動画を生成します。サポートされているアスペクト比には、16:9(YouTube)、9:16(Instagram Reels/TikTok)、1:1(スクエアフォーマット)が含まれ、各プラットフォーム向けに最適化されており、ポストプロダクションクロッピングは不要です。
はい!Wan 2.6は、製品パッケージ、看板、ブランドコンテンツ向けの業界最先端のテキストレンダリングを備えています。モデルは動画フレーム内に明瞭で読みやすいテキストを生成できます—これはSeedanceとほとんどの競合他社が欠いている重要な機能です。
T2V(テキストto動画)は、マルチショット機能を備えたテキストプロンプトから生成します。I2V(画像to動画)は、正確なテキストレンダリングで静止画像をアニメーション化します。R2V(リファレンス動画変換)は、動画リファレンスを使用して生成間でキャラクターアイデンティティを保存します。入力タイプと一貫性のニーズに基づいて選択してください。
はい!すべてのWan 2.6作成には完全な商用利用権が付属します。動画は、追加のライセンス要件なしに、マーケティングキャンペーン、クライアント成果物、ブランドコンテンツ、商用アプリケーション向けに本番レディです。
プロフェッショナル動画生成ワークフロー向けのエンタープライズグレードインフラストラクチャを活用
要求の厳しいAI動画ワークロード向けに特別に最適化されたインフラストラクチャにWan 2.6のマルチショット生成とR2V機能を展開。1080p 15秒生成の最大パフォーマンス。
1つの統一APIを通じて、Wan 2.6(T2V、I2V、R2V)と300以上のAIモデル(LLM、画像、動画、音声)にアクセス。一貫した認証ですべての生成AI ニーズに単一統合。
透明な従量課金制の価格でAWSと比較して最大70%節約。隠れた料金や契約なし—銀行を壊すことなくプロトタイプから本番にスケール。
SOC I & II認定とHIPAAコンプライアンスでリファレンス動画と生成コンテンツを保護。暗号化された伝送とストレージを備えたエンタープライズグレードのセキュリティ。
保証された99.9%稼働時間を備えたエンタープライズグレードの信頼性。Wan 2.6マルチショット動画生成は、本番キャンペーンと重要なコンテンツワークフローで常に利用可能。
REST APIと多言語SDK(Python、Node.js、Go)で数分で完全統合。統一されたエンドポイント構造でT2V、I2V、R2Vモード間をシームレスに切り替え。
Wan 2.6の画期的なマルチショットストーリーテリングとキャラクター一貫性機能で動画制作を革新している世界中のコンテンツクリエーター、マーケター、映画製作者に参加してください。
Atlas Cloudでのみ。