
Veo3.1 Text-to-Video API by Google
Generate high-fidelity videos from text prompts with Google’s most advanced generative video model. Veo 3.1 delivers cinematic quality, dynamic camera motion, and lifelike detail for storytelling and creative production.
入力
出力
待機中各実行には$0.2かかります。$10で約50回実行できます。
次にできること:
コード例
import requests
import time
# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "google/veo3.1/text-to-video",
"prompt": "A beautiful sunset over the ocean with gentle waves",
"width": 512,
"height": 512,
"duration": 3,
"fps": 24,
}
generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]
# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
def check_status():
while True:
response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
result = response.json()
if result["data"]["status"] in ["completed", "succeeded"]:
print("Generated video:", result["data"]["outputs"][0])
return result["data"]["outputs"][0]
elif result["data"]["status"] == "failed":
raise Exception(result["data"]["error"] or "Generation failed")
else:
# Still processing, wait 2 seconds
time.sleep(2)
video_url = check_status()インストール
お使いの言語に必要なパッケージをインストールしてください。
pip install requests認証
すべての API リクエストには API キーによる認証が必要です。API キーは Atlas Cloud ダッシュボードから取得できます。
export ATLASCLOUD_API_KEY="your-api-key-here"HTTP ヘッダー
import os
API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {API_KEY}"
}API キーをクライアントサイドのコードや公開リポジトリに公開しないでください。代わりに環境変数またはバックエンドプロキシを使用してください。
リクエストを送信
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "your-model",
"prompt": "A beautiful landscape"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())リクエストを送信
非同期生成リクエストを送信します。API は予測 ID を返し、それを使用してステータスの確認や結果の取得ができます。
/api/v1/model/generateVideoリクエストボディ
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "google/veo3.1/text-to-video",
"input": {
"prompt": "A beautiful sunset over the ocean with gentle waves"
}
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")レスポンス
{
"id": "pred_abc123",
"status": "processing",
"model": "model-name",
"created_at": "2025-01-01T00:00:00Z"
}ステータスを確認
予測エンドポイントをポーリングして、リクエストの現在のステータスを確認します。
/api/v1/model/prediction/{prediction_id}ポーリング例
import requests
import time
prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
while True:
response = requests.get(url, headers=headers)
result = response.json()
status = result["data"]["status"]
print(f"Status: {status}")
if status in ["completed", "succeeded"]:
output_url = result["data"]["outputs"][0]
print(f"Output URL: {output_url}")
break
elif status == "failed":
print(f"Error: {result['data'].get('error', 'Unknown')}")
break
time.sleep(3)ステータス値
processingリクエストはまだ処理中です。completed生成が完了しました。出力が利用可能です。succeeded生成が成功しました。出力が利用可能です。failed生成に失敗しました。エラーフィールドを確認してください。完了レスポンス
{
"data": {
"id": "pred_abc123",
"status": "completed",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}
}ファイルをアップロード
Atlas Cloud ストレージにファイルをアップロードし、API リクエストで使用できる URL を取得します。multipart/form-data を使用してアップロードします。
/api/v1/model/uploadMediaアップロード例
import requests
url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
with open("image.png", "rb") as f:
files = {"file": ("image.png", f, "image/png")}
response = requests.post(url, headers=headers, files=files)
result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")レスポンス
{
"data": {
"download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
"file_name": "image.png",
"content_type": "image/png",
"size": 1024000
}
}入力 Schema
以下のパラメータがリクエストボディで使用できます。
利用可能なパラメータはありません。
リクエストボディの例
{
"model": "google/veo3.1/text-to-video"
}出力 Schema
API は生成された出力 URL を含む予測レスポンスを返します。
レスポンス例
{
"id": "pred_abc123",
"status": "completed",
"model": "model-name",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}Atlas Cloud Skills
Atlas Cloud Skills は 300 以上の AI モデルを AI コーディングアシスタントに直接統合します。ワンコマンドでインストールし、自然言語で画像・動画生成や LLM との対話が可能です。
対応クライアント
インストール
npx skills add AtlasCloudAI/atlas-cloud-skillsAPI キーの設定
Atlas Cloud ダッシュボードから API キーを取得し、環境変数として設定してください。
export ATLASCLOUD_API_KEY="your-api-key-here"機能
インストール後、AI アシスタントで自然言語を使用してすべての Atlas Cloud モデルにアクセスできます。
MCP Server
Atlas Cloud MCP Server は Model Context Protocol を通じて IDE と 300 以上の AI モデルを接続します。MCP 対応のあらゆるクライアントで動作します。
対応クライアント
インストール
npx -y atlascloud-mcp設定
以下の設定を IDE の MCP 設定ファイルに追加してください。
{
"mcpServers": {
"atlascloud": {
"command": "npx",
"args": [
"-y",
"atlascloud-mcp"
],
"env": {
"ATLASCLOUD_API_KEY": "your-api-key-here"
}
}
}
}利用可能なツール
APIスキーマ
スキーマが利用できませんGoogle Veo 3.1 — Text-to-Video (T2V) Model
Veo 3.1 T2V is the latest text-to-video model from Google DeepMind, designed to bring cinematic storytelling to life through text. It generates high-fidelity 1080p videos with synchronized, context-aware audio, realistic motion, and narrative consistency — making it one of the most advanced generative video systems ever released.
Why it stands out
-
Cinematic Realism
Produces natural lighting, smooth camera transitions, and accurate perspective for film-like motion.
-
Native Audio Generation
Generates synchronized ambient sound, dialogue, and music directly aligned with the visuals.
-
Dialogue & Lip-Sync
Supports speaking characters and realistic facial expressions — perfect for storytelling, marketing, or short-form content.
-
Subject Consistency (R2V)
Maintains a character’s or object’s identity across frames using 1–3 reference images.
-
Video Interpolation
Seamlessly animates transitions between two given frames — ideal for smooth start-to-end storytelling.
-
Flexible Output
Supports both 720p and 1080p, at 24 FPS, duration for 4s, 6s, 8s, and in both 16:9 (landscape) and 9:16 (portrait) formats.
Key Parameters
-
prompt — Describe your scene or story (e.g., “A drone shot flying over Las Vegas, transitioning from day to night with soft jazz in the background”).
-
durationSeconds — Choose video length (4s, 6s, or 8s).
-
resolution — 720p or 1080p.
-
aspectRatio — Landscape (16:9) or Portrait (9:16).
Pricing (Preview Stage)
| Model | Description | Input Type | Output | Price |
|---|---|---|---|---|
| Veo 3.1 (Video + Audio) | Generate videos with synchronized sound | Text / Image | Video + Audio | $0.40 / sec |
| Veo 3.1 (Video only) | Generate high-quality silent videos | Text / Image | Video | $0.20 / sec |
Minimum cost: ~$3.20 per clip (based on 8s @ 1080p).
How to Use
-
Write a Prompt
Describe the desired motion, camera style, lighting, and sound.
Example: “A cinematic sunset over the ocean, waves glimmering as seagulls fly across the horizon.”
-
Adjust Parameters
Select duration, resolution (720p/1080p), and aspect ratio.
-
Generate
Submit your request — Veo 3.1 will render motion, lighting, and synchronized audio.
-
Preview & Download
Review your video, refine your prompt if needed, then download the final MP4.
Pro Tips
-
Keep prompts focused on one main action or subject for better coherence.
-
Use camera verbs like “tracking,” “zoom out,” or “handheld” for cinematic control.
-
Mention lighting and mood cues (e.g., “under soft moonlight,” “golden-hour glow”).
-
Use R2V for character-based storytelling; Interpolation for smooth transitions.
-
Avoid conflicting instructions (e.g., “fast zoom” and “slow motion” together).
Notes & Limitations
-
Generation time: ~2–3 minutes for an 8-second 1080p clip.
-
Frame rate fixed at 24 FPS.
-
Advanced controls (R2V, I2V, Interpolation) are mutually exclusive — only one per generation.
-
If your prompt is blocked, rewrite it and resubmit (safety thresholds may adjust during preview).






