Veo3.1 Text-to-video
Text-zu-Video

Veo3.1 Text-to-Video API by Google

google/veo3.1/text-to-video
Text-to-video

Generate high-fidelity videos from text prompts with Google’s most advanced generative video model. Veo 3.1 delivers cinematic quality, dynamic camera motion, and lifelike detail for storytelling and creative production.

Eingabe

Parameterkonfiguration wird geladen...

Ausgabe

Inaktiv
Ihre generierten Videos erscheinen hier
Konfigurieren Sie Parameter und klicken Sie auf Ausführen, um mit der Generierung zu beginnen

Jede Ausführung kostet $0.2. Für $10 können Sie ca. 50 Mal ausführen.

Sie können fortfahren mit:

Parameter

Codebeispiel

import requests
import time

# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "google/veo3.1/text-to-video",
    "prompt": "A beautiful sunset over the ocean with gentle waves",
    "width": 512,
    "height": 512,
    "duration": 3,
    "fps": 24,
}

generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]

# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"

def check_status():
    while True:
        response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
        result = response.json()

        if result["data"]["status"] in ["completed", "succeeded"]:
            print("Generated video:", result["data"]["outputs"][0])
            return result["data"]["outputs"][0]
        elif result["data"]["status"] == "failed":
            raise Exception(result["data"]["error"] or "Generation failed")
        else:
            # Still processing, wait 2 seconds
            time.sleep(2)

video_url = check_status()

Installieren

Installieren Sie das erforderliche Paket für Ihre Programmiersprache.

bash
pip install requests

Authentifizierung

Alle API-Anfragen erfordern eine Authentifizierung über einen API-Schlüssel. Sie können Ihren API-Schlüssel über das Atlas Cloud Dashboard erhalten.

bash
export ATLASCLOUD_API_KEY="your-api-key-here"

HTTP-Header

python
import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}
Schützen Sie Ihren API-Schlüssel

Geben Sie Ihren API-Schlüssel niemals in clientseitigem Code oder öffentlichen Repositories preis. Verwenden Sie stattdessen Umgebungsvariablen oder einen Backend-Proxy.

Anfrage senden

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "prompt": "A beautiful landscape"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Anfrage senden

Senden Sie eine asynchrone Generierungsanfrage. Die API gibt eine Vorhersage-ID zurück, mit der Sie den Status prüfen und das Ergebnis abrufen können.

POST/api/v1/model/generateVideo

Anfragekörper

import requests

url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}

data = {
    "model": "google/veo3.1/text-to-video",
    "input": {
        "prompt": "A beautiful sunset over the ocean with gentle waves"
    }
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")

Antwort

{
  "id": "pred_abc123",
  "status": "processing",
  "model": "model-name",
  "created_at": "2025-01-01T00:00:00Z"
}

Status prüfen

Fragen Sie den Vorhersage-Endpunkt ab, um den aktuellen Status Ihrer Anfrage zu überprüfen.

GET/api/v1/model/prediction/{prediction_id}

Abfrage-Beispiel

import requests
import time

prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

while True:
    response = requests.get(url, headers=headers)
    result = response.json()
    status = result["data"]["status"]
    print(f"Status: {status}")

    if status in ["completed", "succeeded"]:
        output_url = result["data"]["outputs"][0]
        print(f"Output URL: {output_url}")
        break
    elif status == "failed":
        print(f"Error: {result['data'].get('error', 'Unknown')}")
        break

    time.sleep(3)

Statuswerte

processingDie Anfrage wird noch verarbeitet.
completedDie Generierung ist abgeschlossen. Ergebnisse sind verfügbar.
succeededDie Generierung war erfolgreich. Ergebnisse sind verfügbar.
failedDie Generierung ist fehlgeschlagen. Überprüfen Sie das Fehlerfeld.

Abgeschlossene Antwort

{
  "data": {
    "id": "pred_abc123",
    "status": "completed",
    "outputs": [
      "https://storage.atlascloud.ai/outputs/result.mp4"
    ],
    "metrics": {
      "predict_time": 45.2
    },
    "created_at": "2025-01-01T00:00:00Z",
    "completed_at": "2025-01-01T00:00:10Z"
  }
}

Dateien hochladen

Laden Sie Dateien in den Atlas Cloud Speicher hoch und erhalten Sie eine URL, die Sie in Ihren API-Anfragen verwenden können. Verwenden Sie multipart/form-data zum Hochladen.

POST/api/v1/model/uploadMedia

Upload-Beispiel

import requests

url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }

with open("image.png", "rb") as f:
    files = {"file": ("image.png", f, "image/png")}
    response = requests.post(url, headers=headers, files=files)

result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")

Antwort

{
  "data": {
    "download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
    "file_name": "image.png",
    "content_type": "image/png",
    "size": 1024000
  }
}

Eingabe-Schema

Die folgenden Parameter werden im Anfragekörper akzeptiert.

Gesamt: 0Erforderlich: 0Optional: 0

Keine Parameter verfügbar.

Beispiel-Anfragekörper

json
{
  "model": "google/veo3.1/text-to-video"
}

Ausgabe-Schema

Die API gibt eine Vorhersage-Antwort mit den generierten Ausgabe-URLs zurück.

idstringrequired
Unique identifier for the prediction.
statusstringrequired
Current status of the prediction.
processingcompletedsucceededfailed
modelstringrequired
The model used for generation.
outputsarray[string]
Array of output URLs. Available when status is "completed".
errorstring
Error message if status is "failed".
metricsobject
Performance metrics.
predict_timenumber
Time taken for video generation in seconds.
created_atstringrequired
ISO 8601 timestamp when the prediction was created.
Format: date-time
completed_atstring
ISO 8601 timestamp when the prediction was completed.
Format: date-time

Beispielantwort

json
{
  "id": "pred_abc123",
  "status": "completed",
  "model": "model-name",
  "outputs": [
    "https://storage.atlascloud.ai/outputs/result.mp4"
  ],
  "metrics": {
    "predict_time": 45.2
  },
  "created_at": "2025-01-01T00:00:00Z",
  "completed_at": "2025-01-01T00:00:10Z"
}

Atlas Cloud Skills

Atlas Cloud Skills integriert über 300 KI-Modelle direkt in Ihren KI-Coding-Assistenten. Ein Befehl zur Installation, dann verwenden Sie natürliche Sprache, um Bilder, Videos zu generieren und mit LLMs zu chatten.

Unterstützte Clients

Claude Code
OpenAI Codex
Gemini CLI
Cursor
Windsurf
VS Code
Trae
GitHub Copilot
Cline
Roo Code
Amp
Goose
Replit
40+ unterstützte clients

Installieren

bash
npx skills add AtlasCloudAI/atlas-cloud-skills

API-Schlüssel einrichten

Erhalten Sie Ihren API-Schlüssel über das Atlas Cloud Dashboard und setzen Sie ihn als Umgebungsvariable.

bash
export ATLASCLOUD_API_KEY="your-api-key-here"

Funktionen

Nach der Installation können Sie natürliche Sprache in Ihrem KI-Assistenten verwenden, um auf alle Atlas Cloud Modelle zuzugreifen.

BildgenerierungGenerieren Sie Bilder mit Modellen wie Nano Banana 2, Z-Image und mehr.
VideoerstellungErstellen Sie Videos aus Text oder Bildern mit Kling, Vidu, Veo usw.
LLM-ChatChatten Sie mit Qwen, DeepSeek und anderen großen Sprachmodellen.
Medien-UploadLaden Sie lokale Dateien für Bildbearbeitung und Bild-zu-Video-Workflows hoch.

MCP-Server

Der Atlas Cloud MCP-Server verbindet Ihre IDE mit über 300 KI-Modellen über das Model Context Protocol. Funktioniert mit jedem MCP-kompatiblen Client.

Unterstützte Clients

Cursor
VS Code
Windsurf
Claude Code
OpenAI Codex
Gemini CLI
Cline
Roo Code
100+ unterstützte clients

Installieren

bash
npx -y atlascloud-mcp

Konfiguration

Fügen Sie die folgende Konfiguration zur MCP-Einstellungsdatei Ihrer IDE hinzu.

json
{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

Verfügbare Werkzeuge

atlas_generate_imageGenerieren Sie Bilder aus Textbeschreibungen.
atlas_generate_videoErstellen Sie Videos aus Text oder Bildern.
atlas_chatChatten Sie mit großen Sprachmodellen.
atlas_list_modelsDurchsuchen Sie über 300 verfügbare KI-Modelle.
atlas_quick_generateInhaltserstellung in einem Schritt mit automatischer Modellauswahl.
atlas_upload_mediaLaden Sie lokale Dateien für API-Workflows hoch.

API-Schema

Schema nicht verfügbar

Anmelden, um Anfrageverlauf anzuzeigen

Sie müssen angemeldet sein, um auf Ihren Modellanfrageverlauf zuzugreifen.

Anmelden

Google Veo 3.1 — Text-to-Video (T2V) Model

Veo 3.1 T2V is the latest text-to-video model from Google DeepMind, designed to bring cinematic storytelling to life through text. It generates high-fidelity 1080p videos with synchronized, context-aware audio, realistic motion, and narrative consistency — making it one of the most advanced generative video systems ever released.


Why it stands out

  • Cinematic Realism

    Produces natural lighting, smooth camera transitions, and accurate perspective for film-like motion.

  • Native Audio Generation

    Generates synchronized ambient sound, dialogue, and music directly aligned with the visuals.

  • Dialogue & Lip-Sync

    Supports speaking characters and realistic facial expressions — perfect for storytelling, marketing, or short-form content.

  • Subject Consistency (R2V)

    Maintains a character’s or object’s identity across frames using 1–3 reference images.

  • Video Interpolation

    Seamlessly animates transitions between two given frames — ideal for smooth start-to-end storytelling.

  • Flexible Output

    Supports both 720p and 1080p, at 24 FPS, duration for 4s, 6s, 8s, and in both 16:9 (landscape) and 9:16 (portrait) formats.


Key Parameters

  • prompt — Describe your scene or story (e.g., “A drone shot flying over Las Vegas, transitioning from day to night with soft jazz in the background”).

  • durationSeconds — Choose video length (4s, 6s, or 8s).

  • resolution — 720p or 1080p.

  • aspectRatio — Landscape (16:9) or Portrait (9:16).


Pricing (Preview Stage)

ModelDescriptionInput TypeOutputPrice
Veo 3.1 (Video + Audio)Generate videos with synchronized soundText / ImageVideo + Audio$0.40 / sec
Veo 3.1 (Video only)Generate high-quality silent videosText / ImageVideo$0.20 / sec

Minimum cost: ~$3.20 per clip (based on 8s @ 1080p).


How to Use

  1. Write a Prompt

    Describe the desired motion, camera style, lighting, and sound.

    Example: “A cinematic sunset over the ocean, waves glimmering as seagulls fly across the horizon.”

  2. Adjust Parameters

    Select duration, resolution (720p/1080p), and aspect ratio.

  3. Generate

    Submit your request — Veo 3.1 will render motion, lighting, and synchronized audio.

  4. Preview & Download

    Review your video, refine your prompt if needed, then download the final MP4.


Pro Tips

  • Keep prompts focused on one main action or subject for better coherence.

  • Use camera verbs like “tracking,” “zoom out,” or “handheld” for cinematic control.

  • Mention lighting and mood cues (e.g., “under soft moonlight,” “golden-hour glow”).

  • Use R2V for character-based storytelling; Interpolation for smooth transitions.

  • Avoid conflicting instructions (e.g., “fast zoom” and “slow motion” together).


Notes & Limitations

  • Generation time: ~2–3 minutes for an 8-second 1080p clip.

  • Frame rate fixed at 24 FPS.

  • Advanced controls (R2V, I2V, Interpolation) are mutually exclusive — only one per generation.

  • If your prompt is blocked, rewrite it and resubmit (safety thresholds may adjust during preview).

Beginnen Sie mit 300+ Modellen,

Alle Modelle erkunden

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.