
Shengshu API 上で動画制作パイプラインを構築:Vidu Q3 は、1回の呼び出しで、ネイティブオーディオとスマートなカメラカットを備えた16秒のシネマティッククリップを生成します。
Atlas Cloud の最新 AI 動画生成モデルで、テキストと画像からシネマティックで高精細な動画を生成しましょう。
Compare standard vs. our pricing across every ShengShu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Vidu Q3-Mix Reference to Video | $0.125 | Start from$0.106/s video | -15% | View |
| Vidu Q3 Reference to Video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Pro Start-end-to-video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Turbo Image-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Start-end-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Text-to-video | $0.04 | Start from$0.034/s video | -15% | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Vidu Q3の16秒クリップ、ネイティブオーディオ、およびマルチリファレンスの一貫性により、以前は制作チームが必要だったワークフローにおいて実用的なソリューションとなります。チームはプロバイダーを切り替えることなく、さまざまなQ3ティアを使用して高速なイテレーションから最終アセットへと移行しています。
スタジオやインディーズのクリエイターは、Vidu Q3-Mixを使用して、キャラクターがどのシーンでも同一に見える複数エピソードのアニメーションコンテンツを生成しています。キャラクターのリファレンスシートをアップロードすることで、新しい各クリップは、手作業によるフレームごとの一貫性調整を行うことなく、同じ顔の特徴、衣装、視覚的スタイルを引き継ぎます。ShengshuはSXSW 2026にて、アニメーションシリーズ制作のための初のAIソリューションとして、このワークフローのデモンストレーションを行いました。
マーケティングチームはブランドキャラクターのリファレンス画像を1回アップロードするだけで、Vidu Q3 Reference-to-Videoを使用して、TikTok、Reels、YouTube Shorts用の短い動画クリップを数十本生成できます。出力されたすべての動画でキャラクターの視覚的な一貫性が保たれるため、各アセットの個別指示や承認といったデザイン上のボトルネックが解消されます。Atlas Cloudでは1秒あたり0.042ドルであるため、10秒のクリップのバッチ全体を生成しても、1本あたりのコストは1ドル未満に収まります。
Eコマースチームは、複数の角度からの製品写真をリファレンス入力として提供し、ネイティブな環境音を伴う、製品が動く映画のようなマーケティングクリップを生成します。出力は同じ呼び出し内で同期された音声と共に提供されるため、ビデオ撮影や音声編集を行うことなく、広告や製品ページですぐに使用できます。開始・終了フレーム制御により、チームは各クリップで製品がどのように展開されるかを正確に指示できます。
監督は Vidu Q3-Pro のカメラコントロールを使用して、被写体へのプッシュイン、セットのパンニング、キャラクターを追従するトラッキングショットなど、特定の動きを伴うプレビズ(事前視覚化)クリップを生成します。ネイティブの16秒出力により、1回の呼び出しで完全な短いシーンをプレビズできます。これにより、初期段階の絵コンテ作業が、キャストやスタッフ向けの動きが正確なリファレンス素材に置き換わります。
開発チームは Vidu Q3-Turbo を使用してバッチ生成パイプラインを秒単位 0.034 ドルで実行し、テキストまたは画像の入力から1時間あたり数十本のショートクリップを作成しています。秒単位のコストが低いため、Q3-Pro でスケールアップするものを選択する前に、多くのクリエイティブなバリエーションを生成してテストすることが実用的になります。どちらのモデルも同じ Atlas Cloud API キーで実行され、階層間で1つのパラメーターを変更するだけで済みます。
観光局や旅行プラットフォームは、Vidu Q3-Proのテキスト動画生成機能を使用して、記述的なテキストプロンプトから自然な環境音を伴う雰囲気のある目的地のクリップを生成しています。風景、ランドマーク、または文化的な設定のシーンの記述を入力するだけで、一度のAPIコールで音声がマッチした16秒間のシネマティックなクリップが生成されます。これは、予約意欲を高めるコンテンツ制作において、ロケーション撮影に代わる費用対効果の高い選択肢を提供します。
Vidu Q3は、単一のAPI呼び出しで1080p、24fpsの連続動画を最大16秒間生成します。これは、同クラスの主要な動画モデルの中で最長のシングルパス生成ウィンドウです。クリップの長さは、その最大値の範囲内で呼び出しごとに設定可能です。
はい。Vidu Q3は、単一の推論パスでビデオフレームと同時に、セリフ、効果音、BGM、およびリップシンクを生成します。ポストプロダクションでの吹き替えや手動でのオーディオのアライメントのステップはありません。オーディオのタイミングと画面上のアクションは自動的に同期されます。
テキストプロンプトでカメラの動き(プッシュイン、パン、トラッキングショットなど)を直接指定すると、モデルが最初のフレームからそれらを実行します。個別のパラメータやコントロールレイヤーは必要ありません。これは、Atlas Cloud 上の text-to-video および image-to-video の両方のエンドポイントに適用されます。
Vidu Q3-Proは、Atlas Cloudにて秒単価0.042ドルで、滑らかな動きと豊かなディテールを備えたシネマティック品質の出力を提供します。Vidu Q3-Turboは、秒単価0.034ドルというより低いコストで高速に生成でき、ドラフトや迅速なイテレーションに適しています。両モデルとも同じ1080pの出力解像度とネイティブオーディオサポートを備えています。
Vidu Q3のReference-to-Videoエンドポイントは、1回の呼び出しにつき1〜4枚のリファレンス画像を受け付けます。単一の生成で、異なる画像からの被写体、環境、衣装、視覚的スタイルを組み合わせることができます。これは、複数のクリップにわたってキャラクターとシーンの一貫性を維持するための主要な方法です。
Vidu Q3-Mixは、Vidu Q3ラインナップにおける最高クラスのリファレンスモデルであり、Atlas Cloudでの価格は1秒あたり0.106ドルです。1回の生成で複数のリファレンス画像を組み合わせる際に、最も強力なマルチサブジェクト一貫性を提供します。これは、アニメーションシリーズの制作やブランドコンテンツなど、キャラクターのアイデンティティを多数のクリップ間で視覚的に完全に一致させる必要があるワークフロー向けに設計されています。
はい。Vidu Q3-ProとQ3-Turboはどちらも、Atlas Cloud上にStart-end-to-videoエンドポイントを備えています。開始フレームの画像を提供し、希望する動きや終了状態を記述すると、モデルがトランジションを生成します。これにより、各シーンの始まりと終わりに対して、監督のような正確なコントロールが可能になります。
Vidu Q3-Turboは1秒あたり0.034ドルからとなります。Vidu Q3-ProおよびReference-to-Videoエンドポイントは1秒あたり0.042ドルです。最高の一貫性を持つリファレンスモデルであるVidu Q3-Mixは、1秒あたり0.106ドルです。すべての階層の価格は標準のShengshu API料金より15%低く設定されており、従量課金制(pay-as-you-go)でご利用いただけます。
Join the Discord community for the latest model updates, prompts, and support.