Kling AI動画プロンプトガイド2026：フォーミュラと実例

Klingの動画制作がうまくいかないのは、モデルではなくプロンプトに原因があることがほとんどです。あるクリエイターがRedditのr/generativeAIスレッドで指摘したように、「AI動画を作り始めた時に知っておきたかったプロンプトガイド」として、Klingは「カメラワークの指示には優れているが、明確な指示が必要」であり、「シネマティックな動き」といった曖昧な指示では一貫した結果が得られません。このKling AI動画プロンプトガイドでは、公式のフォーミュラ、コピペで使える例、正確な文字数制限、そして推測による作業を再現可能なショットへと変えるためのカメラ用語を解説します。

重要なポイント

Klingの公式プロンプトフォーミュラは「被写体 + 被写体の動き + シーン + (カメラワーク + 照明 + 雰囲気)」です（Kling AI, 2025）。

Kling APIでは、プロンプトとネガティブプロンプトの両方がそれぞれ2,500文字に制限されています（Kling APIドキュメント, 2026）。

曖昧なカメラ指示は一貫性のない出力の最大の原因です。「スロー・ドリーイン（slow dolly-in）」といった明確な用語を使うことで解決できます。

開発者はこのフォーミュラをテンプレート化し、Atlas Cloud APIを通じて秒単位で呼び出すことが可能です。

Kling AI動画プロンプトガイド：基本のフォーミュラ

Klingの公式Text-to-Videoプロンプトガイドでは、プロンプトの構成を「被写体 + 被写体の動き + シーン + (カメラワーク + 照明 + 雰囲気)」と定義しています。この5つの要素を確実に押さえることで、モデルに触れる前の段階でほとんどの一貫性の問題は解消されます。

このガイドが公式情報と異なるのは、単にフォーミュラを示すだけでなく、クリエイターが実際に躓くポイントを網羅している点です。正確な文字数制限、曖昧なプロンプトを修正するための具体的なカメラ用語、コピペで使える例題ライブラリ、そしてAPIを通じた自動化の方法を解説します。フォーミュラは土台であり、残りはそれを再現可能にするためのものです。

Kling AI Text to Video Prompt Guide 2025

Kling AI動画生成プロンプトのガイドライン：5つの構成要素

Kling AIの動画生成プロンプトのガイドラインは、ショットに関する5つの問いに答える構成要素に集約されます（Kling AI, Text-to-Video Prompt Guide, 2025）。Klingはカメラワークを「カメラレンズの様々な応用」、照明を「ショットにムードを与える光と影」と説明しています。これら5つを埋めることで、モデルが推測すべき余地がなくなります。

構成要素	何を答えるか	例
被写体	画面上の人物や物	黄色いレインコートを着た風貌のある漁師
被写体の動き	被写体は何をするか	ボートの端で網を引き上げる
シーン	場所と時間	夜明けの嵐に照らされた桟橋
カメラワーク	カメラはどう動くか	スロー・ドリーイン、ローアングル
照明 + 雰囲気	ムードと光	冷たいバックライト、激しい雨、シネマティック

Kling自身の例では、「カフェで本を読んでいるジャイアントパンダ」という簡素な文を、動き、シーン、カメラ、照明の要素で充実させることで、ショットリストのように仕上げています（Kling AI, Text-to-Video Prompt Guide, 2025）。その充実化こそがプロンプト作成の全工程です。

Kling AIプロンプトの文字数制限は？

Kling APIドキュメントによると、Kling AIのプロンプト文字数制限は、プロンプトが2,500文字、ネガティブプロンプトが別途2,500文字です。これは十分に余裕があり、およそ400〜500語に相当するため、制限が制約になることは稀です。重要なのは「明瞭さ」です。

制限に注意: リクエストが失敗したり途中で切れたりする場合は、どちらのフィールドも2,500文字を超えていないか確認してください。長ければ良いというわけではなく、フォーミュラに基づいて60〜100語で要点を絞ったプロンプトの方が、モデルが優先順位をつけられない2,000文字の形容詞の羅列よりもはるかに良い結果を生みます。

したがって、2,500文字は上限であり、目標ではありません。5つの構成要素と明確なカメラ用語に文字を費やしたら、そこで止めましょう。Klingのバージョンによって長文プロンプトやクリップ長の扱いが異なるため、シーケンスを計画する前に、各バージョンの動画長制限を確認しておくことが役立ちます。

kling prompts building 5 blocks

Kling AI画像から動画生成（Image-to-Video）のプロンプトガイド

効果的なKling AIの画像から動画生成プロンプトには、「写真ではなく、アクションとカメラを説明せよ」という1つのルールがあります。画像から動画を作る場合、モデルはすでに開始フレームを見ているため、「赤いドレスを着た女性」といった説明を繰り返すのは無駄です。その分、何が動くか、カメラがどう動くかの説明に文字を使いましょう。

画像から動画を作る際は、画像がすでに提供している被写体やシーンの説明を省き、被写体の動きとカメラワークから始めます。「窓の方を向く、ゆっくりとズームイン（スロー・プッシュイン）、そよ風で髪が揺れる」といったプロンプトが、Klingが必要とする新しい情報です。フォーミュラの規律を守り、動きに重点を移すだけです。もし複数のショット間で同一のキャラクターを一貫させたい場合は、当社の「Kling 3.0キャラクター一貫性ガイド → 参照画像とCharacter ID」で詳しく解説しています。

曖昧なプロンプトを明確なカメラ用語で修正する

Redditでの不満にもある通り、最大の改善策は曖昧な指示を明確なカメラ用語に置き換えることです。「シネマティックな動き」という言葉はモデルにとっては何の意味も持ちませんが、「スロー・ドリーイン」は具体的な指示として伝わります。以下の表は、クリエイターが使いがちな曖昧な表現を、Klingが確実に実行できる用語に翻訳したものです。

曖昧なフレーズ	明確なカメラ用語
シネマティックな動き	スロー・ドリーイン、浅い被写界深度
ダイナミックにして	被写体を追う素早いホイップパン
良いアングルで	ローアングル・トラッキングショット、35mm
周りをズームして	左へ旋回、滑らかな180度アーク
動きを追加して	手持ちカメラでのプッシュイン、微かな揺れ

なぜこれが機能するのでしょうか？カメラ用語は学習データが理解できる実際の映画撮影技術と紐付いている一方、感情的な言葉はそうではないからです。これに、不要な要素を取り除くネガティブプロンプト（例：「ぼやけ、顔の歪み、手の変形、突然のカット、ちらつき」）を組み合わせましょう。精度の高い入力が、精度の高い出力をもたらします。

Kling AI動画生成プロンプトの例：シネマティック＆ダイナミック

以下のKling AI動画生成プロンプト例は、フォーミュラに基づいて作成されており、被写体を入れ替えるだけでそのまま利用可能です。これらは、多くのユーザーが求める「シネマティックかつダイナミック」な例や、その他の一般的なショットタイプをカバーしています。

シネマティック

一人の宇宙飛行士が赤い砂漠をゆっくりと歩く、ゴールデンアワーに地平線まで広がる広大な砂丘、スロー・ドリーイン、ローアングル、暖色系のバックライト、浅い被写界深度、シネマティック、35mmフィルムグレイン。

ダイナミック / アクション

モーターサイクリストが雨に濡れたネオン街をレースし、車の間を縫うように走る、横からの素早いトラッキングショット、水しぶき、反射、速いシャッタースピード、エネルギッシュ、夜。

ポートレート

若い女性が笑いながら顔にかかった髪を払う、後ろには居心地の良い日当たりの良いカフェ、クローズアップへのスロー・プッシュイン、窓からの柔らかな光、温かみのあるトーン、優しいボケ味、親密な雰囲気。

風景 / 自然

朝霧が松林の谷間に流れ込み、太陽が尾根を照らす、ゆっくりとしたドローンの前方移動、寒色から暖色への光の移り変わり、ボリュームのある天使の梯子、静穏、ワイドなエスタブリッシングショット。

プロダクト

ガラス製の香水ボトルが反射面の上でゆっくりと回転する、スタジオのシームレスな背景、滑らかな180度の旋回、リムハイライトの効いた柔らかなキーライト、クリーン、プレミアム、マクロ詳細。

スタイライズド / アニメ

剣士が満月の下で屋根から飛び降りる、マントが翻る、ジャンプを追うドラマチックなチルトアップ、セルシェーディングアニメスタイル、リムライティング、ダイナミック、高コントラスト。

スローモーション / マクロ

一滴の水が静かな黒い水面に落ちる、極端なマクロ、超スローモーション、同心円状に広がる波紋、鏡面反射を伴う柔らかなトップライト、ミニマル、高精細。

Vlog / トーキングヘッド

フレンドリーなシェフが料理を盛り付けながらカメラに向かって話す、モダンなキッチン背景、微かなプッシュインを伴う固定ミドルショット、窓からの柔らかい自然光、温かみのある、親しみやすい。

ファンタジー / エスタブリッシング

日没の雲海の上に浮かぶ城、塔を明らかにするゆっくりとした空中旋回、ボリュームライト、壮大なスケール、暖かいリムライト、シネマティックなワイドエスタブリッシングショット。

APIによるKling AI動画プロンプトの自動化

プロンプトがフォーミュラに従うようになれば、プログラムで入力可能なテンプレートになります。これこそが、WebアプリでショットごとにクリックするよりもAPIが優れている点です。Atlas CloudのカタログにはKling 3.0を含む300以上のモデルがあり、秒単位の課金で呼び出せるため、フォーミュラ主導のバッチ処理でもコストは一定です。

動画APIは、手動で入力するのと同じフォーミュラプロンプトを受け付けます。文字列を構築し、送信し、結果をポーリングします：

plaintext
1curl -X POST https://api.atlascloud.ai/api/v1/model/generateVideo \
2  -H "Authorization: Bearer $ATLAS_API_KEY" \
3  -H "Content-Type: application/json" \
4  -d '{
5    "model": "kling-v2.0",
6    "prompt": "A lone astronaut walks across a red desert, slow dolly-in, golden hour backlight, shallow depth of field, cinematic"
7  }'
8# 画像から動画を作る場合は "image_url" フィールドを追加してください。"model" はカタログ内の任意の動画モデルに入れ替え可能です。
9
10# 完成した動画をポーリング
11curl https://api.atlascloud.ai/api/v1/model/prediction/PREDICTION_ID \
12  -H "Authorization: Bearer $ATLAS_API_KEY"

プロンプトがテンプレート化されているため、バッチ内のすべての呼び出しで一貫性が保たれます。これは手動入力では困難なことです。大量のレンダリングを行うチームは、Atlas Cloud上で動画モデルのコストと品質を比較し、このフォーミュラを自社のパイプラインに組み込むことができます。

api bulk generation

よくある質問

Kling AIで良いプロンプトを書くには？

Klingのフォーミュラに従ってください：被写体 + 被写体の動き + シーン + カメラワーク + 照明と雰囲気（Kling AI, Text-to-Video Prompt Guide, 2025）。「シネマティック」のような曖昧な言葉を「スロー・ドリーイン」のような明確なカメラ用語に置き換え、ネガティブプロンプトでアーティファクトを除去します。

Kling AIのプロンプト文字数制限は？

KlingのAPIでは、プロンプトが2,500文字、ネガティブプロンプトが別途2,500文字に制限されています（Kling APIドキュメント, 2026）。約400〜500語に相当するため、明瞭さを重視しましょう。通常、60〜100語の凝縮されたプロンプトの方が、上限ギリギリまで書いたものよりも優れた結果を出します。

「プロンプトの5つのP」とは？

「プロンプトの5つのP」は人気のニーモニックですが、標準化されたものではなく、ソースによって言葉も異なるため、動画制作で頼るべきものではありません。Klingに関しては、独自に検証された5部構成（被写体、被写体の動き、シーン、カメラワーク、照明と雰囲気）を使用してください。

画像から動画生成（Image-to-Video）のプロンプトはどう違うのか？

画像から動画生成を行うプロンプトガイドのルールは、絵そのものではなく、動きとカメラを説明することです。モデルはすでに開始フレームを持っているため、被写体やシーンを繰り返すのではなく、「彼女が振り返る、ゆっくりズーム」のように、何が動くかを先頭に記述してください。

なぜKlingの動画が一貫しないのか？

多くの場合、プロンプトが曖昧すぎることが原因です。Redditのクリエイターが指摘するように、Klingには明確な指示が必要です。「シネマティックな動き」では結果がバラつきますが、「スロー・ドリーイン、ローアングル」なら安定します。正確なカメラ用語を使い、プロンプトを集中させ、固定されたフォーミュラを使い回してください。

結論

優れたKlingプロンプトとは、詩ではなくエンジニアリングです。被写体、動き、シーン、カメラワーク、照明というフォーミュラから始め、2,500文字の制限内に収め、曖昧な感情表現を明確なカメラ用語に置き換えましょう。上記の例を活用し、自分の被写体に適応させることで、多くのクリエイターを悩ませる試行錯誤の時間を削減できます。大量生成を行うチームであれば、Atlas Cloudのモデル料金ページからKlingや他の動画モデルへ秒単位でアクセスし、このフォーミュラを自動化された再現可能なパイプラインに変えてください。

一覧に戻る

Kling AI ビデオプロンプトガイド（2026年版）：構成式、具体例、およびカメラワークの専門用語

Kling AI動画プロンプトガイド：基本のフォーミュラ

Kling AI動画生成プロンプトのガイドライン：5つの構成要素

Kling AIプロンプトの文字数制限は？

Kling AI画像から動画生成（Image-to-Video）のプロンプトガイド

曖昧なプロンプトを明確なカメラ用語で修正する

Kling AI動画生成プロンプトの例：シネマティック＆ダイナミック

APIによるKling AI動画プロンプトの自動化

よくある質問

Kling AIで良いプロンプトを書くには？

Kling AIのプロンプト文字数制限は？

「プロンプトの5つのP」とは？

画像から動画生成（Image-to-Video）のプロンプトはどう違うのか？

なぜKlingの動画が一貫しないのか？

結論

最新モデル

MiniMax H3 Text-to-Video

MiniMax H3 Image-to-Video

MiniMax H3 Reference-to-Video

Reve 2.1 Remix

ひとつのAPIで、あらゆるメディアAIを。