
Kuaishou’s flagship video generation suite, Kling 3.0, features two powerhouse models—Kling 3.0 (Upgraded from Kling 2.6) and Kling 3.0 Omni (Kling O3, Upgraded from Kling O1)—both offering high-fidelity native audio integration. While Kling 3.0 excels in intelligent cinematic storytelling, multilingual lip-syncing, and precision text rendering, Kling O3 sets a new standard for professional-grade subject consistency by supporting custom subjects and voice clones derived from video or image inputs. Together, these models provide a comprehensive solution tailored for cinematic narratives, global marketing campaigns, social media content, and digital skit production.
Atlas Cloudは、業界をリードする最新のクリエイティブモデルを提供します。
Atlas Cloudは、業界をリードする最新のクリエイティブモデルを提供します。

多言語および方言(CN、EN、JP、KR、ES)で正確なリップシンクを実現し、没入感のある体験を提供します。

内蔵の「AIディレクター」がカメラアングルとショットサイズを自動的に構成し、ワンクリックで映画のようなストーリーテリングを実現します。

Omniモデルはビデオインペインティングとキャラクター置換をサポートし、柔軟な修正と素材のバリエーション展開を可能にします。

ディープビジュアルアンカーリングにより、複雑な動作中でもキャラクター、小道具、シーンの安定性が保たれます。

時間制限を突破し、単一のサイクルで完全なプロットアークを持つ、完結したリズム感のある独自の物語を生成します。
最低コスト
| モダリティ | 説明 |
|---|---|
| Kling 3.0 Std T2V API(Text To Video) | Kling 3.0 Std T2V APIは、開発者がテキストプロンプトを映画のようなビデオクリップに変換することを可能にします。カメラ、シーン、動きを定義することで、プロフェッショナルな絵コンテ作成、ダイナミックなマーケティング、ソーシャルメディアでのストーリーテリング向けに最適化された、滑らかで音声同期されたコンテンツを生成します。 |
| Kling 3.0 Std I2V API(Image To Video) | Kling 3.0 Std I2V APIは、静止画とテキストプロンプトをビデオクリップに変換します。参照フレームと終了フレームの制御をサポートすることで、動きの軌跡をガイドし、視覚的な連続性と標準的なマーケティング素材のために、音声が同期したコンテンツを生成します。 |
| Kling 3.0 Pro T2V API(Text To Video) | Kling 3.0 Pro T2V APIは、高度な物理演算と映画のような質感を持つ高忠実度の動画をテキストプロンプトから生成します。マルチショットのストーリーテリングをサポートし、Standard版よりも高い詳細度と視覚的な複雑さを提供します。 |
| Kling 3.0 Pro I2V API(Image To Video) | Kling 3.0 Pro I2V APIは、画像の細部を高度に保持しつつ、高解像度の動画に変換します。ハイエンドな商用制作向けに、プロフェッショナルグレードのカメラ制御と正確なオーディオビジュアル同期を提供します。 |
| Kling Video O3 Std T2V API(Text To Video) | Kling Video O3 Std T2V APIはテキストから動画を生成します。ネイティブオーディオ生成をサポートしています。 |
| Kling Video O3 Std I2V API(Image To Video) | Kling Video O3 Std I2V APIは、画像とテキストを使用して、参照忠実度の高い動画を生成します。これは、標準解像度のワークフロー内で、キャラクターや製品の安定した表現を必要とするタスク向けに設計されています。 |
| Kling Video O3 Std R2V(Video To Video) | Kling Video O3 Std R2V APIは、キャラクター、小道具、またはシーンの参照を使用してクリエイティブな動画を生成します。最大7枚の参照画像とオプションの動画入力をサポートします。標準品質のソーシャルメディアや実験的なコンテンツ向けに、動画のスタイル変更や属性編集を可能にします。 |
| Kling Video O3 Std Video Edit API(Video To Video) | Kling Video O3 Std Video Edit API(Video To Video) は、自然言語による動画編集を可能にします。オブジェクトの削除や置換、背景の変更、エフェクトの追加などが行えます。 |
| Kling Video O3 Pro T2V API(Text To Video) | Kling Video O3 Pro T2V APIは、テキストから動画への生成(text-to-video)を提供します。複雑なシーンにおいてもプロ仕様のキャラクターの一貫性と映画のようなライティングを実現し、映画品質のストーリーテリングを可能にします。 |
| Kling Video O3 Pro I2V API(Image To Video) | Kling Video O3 Pro I2V APIは、リファレンスファースト・アーキテクチャを使用して、画像をプロ品質の動画に変換します。視覚的な詳細の高忠実度な保存と滑らかな動きを保証し、プレミアムなデジタルマーケティングや視覚効果に最適です。 |
| Kling Video O3 Pro R2V(Video To Video) | Kling Video O3 Pro R2Vは、動画の変換とスタイル変更を提供します。プロフェッショナルな動画編集やハイエンドな視覚効果の修正に向け、ピクセルレベルの制御とモーションの安定性を維持します。 |
| Kling Video O3 Pro Video Edit(Video To Video) | Kling Video O3 Pro Video Edit (Video To Video) は、自然言語プロンプトによる高品質な動画編集を可能にします。高度なオブジェクト削除、背景の置き換え、エフェクトの統合機能を提供し、プロフェッショナルグレードの精度とディテールの保持を実現します。 |
先進的なモデルと Atlas Cloud の GPU アクセラレーションプラットフォームを組み合わせ、画像・動画生成において比類のない速度、拡張性、クリエイティブコントロールを実現します。
Kling 3.0は、プロンプトから物語の流れを直感的に把握する「AIディレクター」を導入しており、ショットの構図やカメラアングルを自動的に調整して、ショット・リバース・ショット(切り返し)による会話シーンのような高度な映画技法を実現します。一度の生成で成熟したビジュアルストーリーテリングを提供し、あらゆるクリエイターが複雑な映画的表現を扱えるようにします。
Kling 3.0は、テキストと視覚文字の正確なマッピングを実現し、中国語、英語、日本語、韓国語、スペイン語などの混合言語による対話や方言を、自然で滑らかなリップシンクでサポートします。これにより、eコマースやグローバルマーケティングにおける高忠実度のテキスト表示やローカライズされたコンテンツ制作のニーズに直接応えます。
Kling O3は、アップロードまたは撮影された3〜8秒の動画から人物の特徴を抽出することに対応しており、その外見、体型、雰囲気を完全に再現します。「自分の映画で主演する」という創造的な興奮を解き放ち、高いキャラクターの一貫性が求められるショートドラマやシリーズコンテンツに最適です。
このモデルファミリーで構築できる実用的なユースケースとワークフローを発見 — コンテンツ作成や自動化から本番グレードのアプリケーションまで。
Kling 3.0は、高度な物理モデリングを利用して、流体力学、布の動き、構造的な衝突など、複雑なオブジェクト間のリアルな相互作用を生成します。現実世界の重力と物理的特性をシミュレートすることで、このAPIは、プロフェッショナルな視覚効果、リアルな製品CM、および精密な物理的正確さを必要とする技術的なデモンストレーションに適した高忠実度のモーションを生成します。
リファレンス駆動型技術を活用することで、Kling 3.0は生成された複数のクリップ間で厳密なキャラクターおよびスタイルの一貫性を維持します。この機能により、開発者は安定した顔の特徴と環境照明を備えた、まとまりのあるマルチショットシーケンスを構築できます。これは、視覚的な統一性を必要とするデジタルヒューマンの作成、連続的なストーリーテリング、およびブランドの一貫したマーケティングキャンペーンに理想的なソリューションです。
Kling 3.0 APIは、自然言語による指示を通じて複雑なVideo-to-Videoの修正を可能にし、シームレスな背景の置き換え、オブジェクトの削除、およびスタイル変換を実現します。特定の視覚的属性を変更しながら元の動きの構造を維持することで、本APIは、効率的かつ高解像度なコンテンツの反復を求めるクリエイティブエージェンシーやソーシャルメディアプラットフォームのポストプロダクションワークフローを合理化します。
異なるプロバイダーのモデルを比較 — パフォーマンス、料金、独自の強みを確認して最適な選択を。
| モデル | 入力タイプ | 出力時間 | 解像度 | 音声生成 |
|---|---|---|---|---|
| Kling 3.0 | テキスト、画像、動画 | 5s;10s | 720P | √ |
| Kling O1 | テキスト、画像 | 5s;10s | 720P | × |
| Kling 2.6 | テキスト、画像、動画 | 5s;10s | 720P | √ |
| Seedance 2.0 | テキスト、画像、動画、音声 | 4~15s | 2K, 1080P, 720P, 480P | √ |
| Veo 3.1 | テキスト、画像 | 4s, 6s, 8s | 1080P, 720P | √ |
| Wan 2.6 | テキスト、画像、動画、音声 | 5s, 10s, 15s | 1080P, 720P | √ |
| Hailuo 2.3 | テキスト、画像 | 5s | 1080P | × |
数分で始められます — 以下の簡単なステップに従って、Atlas Cloud プラットフォームでモデルを統合・デプロイしましょう。
atlascloud.ai でサインアップし、認証を完了します。新規ユーザーには無料クレジットが付与され、プラットフォームの探索やモデルのテストに使用できます。
高度なKling3.0 ModelsモデルとAtlas CloudのGPU加速プラットフォームを組み合わせることで、比類のないパフォーマンス、スケーラビリティ、開発者エクスペリエンスを提供。
低レイテンシ:
リアルタイム推論のためのGPU最適化推論。
統合API:
1つの統合でKling3.0 Models、GPT、Gemini、DeepSeekを実行。
透明な料金:
サーバーレスオプション付きの予測可能なtoken単位の課金。
開発者エクスペリエンス:
SDK、分析、ファインチューニングツール、テンプレート。
信頼性:
99.99%の稼働率、RBAC、コンプライアンス対応ロギング。
セキュリティとコンプライアンス:
SOC 2 Type II、HIPAA準拠、米国内のデータ主権。
動画被写体リファレンス、画像被写体リファレンス、そして音声/トーンリファレンスを統合することで。
Standard版は生成速度と品質のバランスが取れており、ソーシャルメディアコンテンツや迅速なプロトタイピングに適しています。Pro版はプロフェッショナルな映画や映像制作の要件向けに設計されており、よりリアルな物理ダイナミクスシミュレーションと、より精細なマテリアルテクスチャの出力を提供します。
R2Vは、実写映像を特定のアニメーションやリアルなアートスタイルに変換するといった「全体的な再構成(グローバル・リシェイピング)」に重点を置いています。対照的に、Video Editは「指示に基づく修正」に重点を置いており、映像内の特定の要素を追加、削除、または修正するといった精密なポストプロダクション操作を可能にします。
Join the Discord community for the latest model updates, prompts, and support.