ShengShu Models on AtlasCloud | Vidu

Shengshu API 上で動画制作パイプラインを構築：Vidu Q3 は、1回の呼び出しで、ネイティブオーディオとスマートなカメラカットを備えた16秒のシネマティッククリップを生成します。

AI Video Models by ShengShu

Atlas Cloud の最新 AI 動画生成モデルで、テキストと画像からシネマティックで高精細な動画を生成しましょう。

Vidu

Vidu APIは、Shengshu AIおよびTsinghua大学のビデオモデルへのアクセスを開発者に提供し、DiffusionおよびTransformerの設計を統合するU-ViTアーキテクチャ上に構築されています。1つから4つの参照画像を入力すると、Viduはショット全体で被写体の一貫性を保ち、インテリジェントなカメラ切り替えとスムーズでシネマティックなモーションを実現します。Atlas Cloudは、Day-0モデルアクセスと、ラインアップ全体に対応するOpenAI互換キーを追加します。今すぐ構築を開始してください。

25 モデルViduを探索

ShengShu Models API Pricing Details

Compare standard vs. our pricing across every ShengShu model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Vidu Q3-Mix Reference to Video	$0.125	Start from$0.106/s video	-15%	View
Vidu Q3 Reference to Video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Pro Start-end-to-video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Turbo Image-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Start-end-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Text-to-video	$0.04	Start from$0.034/s video	-15%	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Atlas Cloudで構築できるShengShu APIのユースケース

Vidu Q3の16秒クリップ、ネイティブオーディオ、およびマルチリファレンスの一貫性により、以前は制作チームが必要だったワークフローにおいて実用的なソリューションとなります。チームはプロバイダーを切り替えることなく、さまざまなQ3ティアを使用して高速なイテレーションから最終アセットへと移行しています。

一貫性のあるキャラクターのアニメシリーズ

スタジオやインディーズのクリエイターは、Vidu Q3-Mixを使用して、キャラクターがどのシーンでも同一に見える複数エピソードのアニメーションコンテンツを生成しています。キャラクターのリファレンスシートをアップロードすることで、新しい各クリップは、手作業によるフレームごとの一貫性調整を行うことなく、同じ顔の特徴、衣装、視覚的スタイルを引き継ぎます。ShengshuはSXSW 2026にて、アニメーションシリーズ制作のための初のAIソリューションとして、このワークフローのデモンストレーションを行いました。

大規模なブランドアバターとマスコットコンテンツ

マーケティングチームはブランドキャラクターのリファレンス画像を1回アップロードするだけで、Vidu Q3 Reference-to-Videoを使用して、TikTok、Reels、YouTube Shorts用の短い動画クリップを数十本生成できます。出力されたすべての動画でキャラクターの視覚的な一貫性が保たれるため、各アセットの個別指示や承認といったデザイン上のボトルネックが解消されます。Atlas Cloudでは1秒あたり0.042ドルであるため、10秒のクリップのバッチ全体を生成しても、1本あたりのコストは1ドル未満に収まります。

マルチアングル製品マーケティングビデオ

Eコマースチームは、複数の角度からの製品写真をリファレンス入力として提供し、ネイティブな環境音を伴う、製品が動く映画のようなマーケティングクリップを生成します。出力は同じ呼び出し内で同期された音声と共に提供されるため、ビデオ撮影や音声編集を行うことなく、広告や製品ページですぐに使用できます。開始・終了フレーム制御により、チームは各クリップで製品がどのように展開されるかを正確に指示できます。

映画のプリプロダクション向け指向型シーン生成

監督は Vidu Q3-Pro のカメラコントロールを使用して、被写体へのプッシュイン、セットのパンニング、キャラクターを追従するトラッキングショットなど、特定の動きを伴うプレビズ（事前視覚化）クリップを生成します。ネイティブの16秒出力により、1回の呼び出しで完全な短いシーンをプレビズできます。これにより、初期段階の絵コンテ作業が、キャストやスタッフ向けの動きが正確なリファレンス素材に置き換わります。

大量ソーシャルコンテンツパイプライン

開発チームは Vidu Q3-Turbo を使用してバッチ生成パイプラインを秒単位 0.034 ドルで実行し、テキストまたは画像の入力から1時間あたり数十本のショートクリップを作成しています。秒単位のコストが低いため、Q3-Pro でスケールアップするものを選択する前に、多くのクリエイティブなバリエーションを生成してテストすることが実用的になります。どちらのモデルも同じ Atlas Cloud API キーで実行され、階層間で1つのパラメーターを変更するだけで済みます。

文化観光と目的地コンテンツ

観光局や旅行プラットフォームは、Vidu Q3-Proのテキスト動画生成機能を使用して、記述的なテキストプロンプトから自然な環境音を伴う雰囲気のある目的地のクリップを生成しています。風景、ランドマーク、または文化的な設定のシーンの記述を入力するだけで、一度のAPIコールで音声がマッチした16秒間のシネマティックなクリップが生成されます。これは、予約意欲を高めるコンテンツ制作において、ロケーション撮影に代わる費用対効果の高い選択肢を提供します。

あなたの企業ビジョンを、Atlas Cloud AI で現実に。

営業に問い合わせる

ShengShuモデルに関するよくある質問

Vidu Q3は、単一のAPI呼び出しで1080p、24fpsの連続動画を最大16秒間生成します。これは、同クラスの主要な動画モデルの中で最長のシングルパス生成ウィンドウです。クリップの長さは、その最大値の範囲内で呼び出しごとに設定可能です。

はい。Vidu Q3は、単一の推論パスでビデオフレームと同時に、セリフ、効果音、BGM、およびリップシンクを生成します。ポストプロダクションでの吹き替えや手動でのオーディオのアライメントのステップはありません。オーディオのタイミングと画面上のアクションは自動的に同期されます。

テキストプロンプトでカメラの動き（プッシュイン、パン、トラッキングショットなど）を直接指定すると、モデルが最初のフレームからそれらを実行します。個別のパラメータやコントロールレイヤーは必要ありません。これは、Atlas Cloud 上の text-to-video および image-to-video の両方のエンドポイントに適用されます。

Vidu Q3-Proは、Atlas Cloudにて秒単価0.042ドルで、滑らかな動きと豊かなディテールを備えたシネマティック品質の出力を提供します。Vidu Q3-Turboは、秒単価0.034ドルというより低いコストで高速に生成でき、ドラフトや迅速なイテレーションに適しています。両モデルとも同じ1080pの出力解像度とネイティブオーディオサポートを備えています。

Vidu Q3のReference-to-Videoエンドポイントは、1回の呼び出しにつき1〜4枚のリファレンス画像を受け付けます。単一の生成で、異なる画像からの被写体、環境、衣装、視覚的スタイルを組み合わせることができます。これは、複数のクリップにわたってキャラクターとシーンの一貫性を維持するための主要な方法です。

Vidu Q3-Mixは、Vidu Q3ラインナップにおける最高クラスのリファレンスモデルであり、Atlas Cloudでの価格は1秒あたり0.106ドルです。1回の生成で複数のリファレンス画像を組み合わせる際に、最も強力なマルチサブジェクト一貫性を提供します。これは、アニメーションシリーズの制作やブランドコンテンツなど、キャラクターのアイデンティティを多数のクリップ間で視覚的に完全に一致させる必要があるワークフロー向けに設計されています。

はい。Vidu Q3-ProとQ3-Turboはどちらも、Atlas Cloud上にStart-end-to-videoエンドポイントを備えています。開始フレームの画像を提供し、希望する動きや終了状態を記述すると、モデルがトランジションを生成します。これにより、各シーンの始まりと終わりに対して、監督のような正確なコントロールが可能になります。

Vidu Q3-Turboは1秒あたり0.034ドルからとなります。Vidu Q3-ProおよびReference-to-Videoエンドポイントは1秒あたり0.042ドルです。最高の一貫性を持つリファレンスモデルであるVidu Q3-Mixは、1秒あたり0.106ドルです。すべての階層の価格は標準のShengshu API料金より15%低く設定されており、従量課金制（pay-as-you-go）でご利用いただけます。

さらにファミリーを探索

Seedance 2.0

Seedance 2.0 APIは、ByteDanceのマルチモーダルビデオモデルへのプロダクションアクセスを提供します。これには、クアッドモーダル入力（テキスト、画像、ビデオ、オーディオ）と、ショット間で構図、カメラワーク、キャラクターのアクションを固定する業界最高水準の「Universal Reference」システムが含まれます。1回のAPIコールでディレクターレベルの制御を統合でき、一律$0.09/秒、即時キー発行、順番待ちリストなしで利用可能です。これらはエンタープライズクラスの稼働率とコンプライアンスによって裏付けられています。Seedance 2.0 Native 4Kが提供開始されました！

ファミリーを表示

Grok Imagine

Grok Imagine API は、開発者に xAI の画像、動画、音声生成を1つのスイートで提供します。多言語テキストレンダリングを備えた最大 2K の画像に加え、ネイティブで同期された音声とリファレンスベースの編集を備えた最大15秒の動画を生成します。Atlas Cloud 上では、1つのキーで Grok Imagine のすべてのモードを実行できるため、個別の設定なしで画像、動画、音声の間を移行できます。料金は画像1枚あたり0.02ドル、1秒あたり0.05ドルからです。

ファミリーを表示

Gemini Omni Flash

Gemini Omni API は、Google I/O 2026 で発表された Google DeepMind のマルチモーダル動画生成・編集モデルを、あなたのスタックで利用可能にします。Gemini Omni は Gemini の推論エンジンと生成メディアを融合し、テキスト・画像・動画・音声を自由に組み合わせた入力から、一貫性があり知識に裏付けられた出力を生成します。自然な対話で結果を磨き上げましょう。オブジェクトの差し替え、シーンの書き換え、スタイルの変更を行っても、物理法則、キャラクター、連続性はそのまま保たれます。Atlas Cloud は、テキストからの動画生成、最大 7 枚の参照画像に対応した画像からの動画生成、そして参照ベースの動画生成という Gemini Omni Flash の全ラインアップを、単一の統合 API で提供します。料金は $0.112 からの秒単位の透明な従量課金で、サブスクリプションは不要です。今すぐ開発を始めましょう。

ファミリーを表示

GPT Image 2

GPT Image 2 API は、GPT Image 1.5 の後継となる OpenAI の最新画像モデルへのアクセスを開発者に提供します。ラテン文字およびCJKスクリプト全体で正確なテキストレンダリングを使用して画像を生成および編集できるほか、ポスター、モックアップ、インフォグラフィック向けの強力なコンポジション（構図）機能を備えています。Atlas Cloud では、300以上のモデルと並んで1つの統合 API を通じてアクセスでき、無料クレジット、99.99% のアップタイムが提供され、OpenAI の組織検証は不要です。

ファミリーを表示

Google

Googleの最も強力なクリエイティブモデルはすべてAtlas Cloudで利用可能です。Veo 3.1はシネマティックな動画生成を実現し、Nano Banana 2は高忠実度な画像作成を強化し、Geminiはあらゆるワークフローにマルチモーダルなインテリジェンスをもたらします。Day-0の可用性と従量課金制（pay-as-you-go）の料金体系を備えた単一のAPI keyを通じて、Googleモデルスイート全体にアクセスできます。

ファミリーを表示

Seedance 2.0 Mini

Seedance 2.0 Mini は、速度とコストが最も重視されるワークフローに ByteDance のマルチモーダル動画生成をもたらします。より軽量なフットプリントで Seedance 2.0 のコア機能を提供し、より高速な生成、動画あたりのコスト削減、そしてすでに使用しているものと同じ API 統合を実現します。大容量のパイプラインを運用したり、大規模なプロトタイピングを行ったりするチームにとって、Mini は実用的なデフォルトの選択肢です。

ファミリーを表示

ByteDance

シネマティックな動画生成から高忠実度の画像作成まで、ByteDanceの最も強力なモデルがAtlas Cloudで利用可能になりました。最低水準の推論価格とゼロのインフラストラクチャオーバーヘッドで、SeedanceとSeedreamを大規模に実行できます。

ファミリーを表示

Alibaba

Atlas Cloudは、Alibabaの全モデルラインナップを単一のAPIに統合します。言語および画像タスク用のQwen、最大1080pの動画生成用のWanが利用可能です。すべてのモデルはサブスクリプション不要の従量課金制（pay-as-you-go）でアクセスできます。Alibaba APIは、既存のOpenAI互換クライアントを使用し、単一のベースURLを介して利用可能です。

ファミリーを表示

OpenAI

Atlas Cloudは、画像生成用のGPT Image 2から動画用のSora 2まで、OpenAI APIの全ラインナップへのアクセスを提供します。すべてのモデルは、月額の固定コミットメントなしの従量課金制でご利用いただけます。OpenAI互換APIを使用し、ベースURLを一つ変更するだけで簡単に組み込むことができます。

ファミリーを表示

xAI

Atlas Cloud 上で xAI API を使用して、完全な画像および動画パイプラインを構築します。2K解像度での生成、参照画像を使用した編集、そして画像を音声同期クリップへとアニメーション化することが可能です。

ファミリーを表示

Kwaivgi

Kwaivgi APIを標準価格より15%オフで提供。Atlas Cloudは、新しいKlingリリースへのDay-0アクセスを、従量課金制（Pay-as-you-go）およびシート数無制限で提供します。1つのアカウント、1つのキーで、スタンダードからマスター階層まで、すべてのKlingモデルをご利用いただけます。

ファミリーを表示

Seedream 5.0 Pro

Seedream 5.0 Pro API は、開発者に Atlas Cloud 上で ByteDance の制御可能な画像編集モデルを提供します。アンカーと座標を使用して編集を正確に配置し、画像を編集可能なレイヤーに分離し、複数の参照を融合し、正確な色と素材を一致させ、2K および 3K での多言語テキストをサポートします。Atlas Cloud では、単一のキーでアクセスできます！

ファミリーを表示