
Veo3.1 Reference-to-Video API by Google
Create richly detailed videos guided by visual references. Veo 3.1 Reference-to-Video preserves characters, style, and composition across scenes for consistent, visually coherent storytelling.
الإدخال
الإخراج
في انتظار التنفيذكل مرة ستكلف $0.2 مع $10 يمكنك التشغيل حوالي 50 مرة
يمكنك المتابعة بـ:
مثال الكود
import requests
import time
# Step 1: Start video generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "google/veo3.1/reference-to-video",
"prompt": "A beautiful sunset over the ocean with gentle waves",
"width": 512,
"height": 512,
"duration": 3,
"fps": 24,
}
generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]
# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
def check_status():
while True:
response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
result = response.json()
if result["data"]["status"] in ["completed", "succeeded"]:
print("Generated video:", result["data"]["outputs"][0])
return result["data"]["outputs"][0]
elif result["data"]["status"] == "failed":
raise Exception(result["data"]["error"] or "Generation failed")
else:
# Still processing, wait 2 seconds
time.sleep(2)
video_url = check_status()التثبيت
قم بتثبيت الحزمة المطلوبة للغة البرمجة الخاصة بك.
pip install requestsالمصادقة
تتطلب جميع طلبات API المصادقة عبر مفتاح API. يمكنك الحصول على مفتاح API الخاص بك من لوحة تحكم Atlas Cloud.
export ATLASCLOUD_API_KEY="your-api-key-here"ترويسات HTTP
import os
API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {API_KEY}"
}لا تكشف أبدًا مفتاح API الخاص بك في الكود من جانب العميل أو المستودعات العامة. استخدم متغيرات البيئة أو وكيل الخادم الخلفي بدلاً من ذلك.
إرسال طلب
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "your-model",
"prompt": "A beautiful landscape"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())إرسال طلب
أرسل طلب توليد غير متزامن. تُرجع API معرّف التنبؤ الذي يمكنك استخدامه للتحقق من الحالة واسترداد النتيجة.
/api/v1/model/generateVideoنص الطلب
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateVideo"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "google/veo3.1/reference-to-video",
"input": {
"prompt": "A beautiful sunset over the ocean with gentle waves"
}
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")الاستجابة
{
"id": "pred_abc123",
"status": "processing",
"model": "model-name",
"created_at": "2025-01-01T00:00:00Z"
}التحقق من الحالة
استعلم عن نقطة نهاية التنبؤ للتحقق من الحالة الحالية لطلبك.
/api/v1/model/prediction/{prediction_id}مثال الاستعلام
import requests
import time
prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
while True:
response = requests.get(url, headers=headers)
result = response.json()
status = result["data"]["status"]
print(f"Status: {status}")
if status in ["completed", "succeeded"]:
output_url = result["data"]["outputs"][0]
print(f"Output URL: {output_url}")
break
elif status == "failed":
print(f"Error: {result['data'].get('error', 'Unknown')}")
break
time.sleep(3)قيم الحالة
processingلا يزال الطلب قيد المعالجة.completedاكتمل التوليد. المخرجات متاحة.succeededنجح التوليد. المخرجات متاحة.failedفشل التوليد. تحقق من حقل الخطأ.استجابة مكتملة
{
"data": {
"id": "pred_abc123",
"status": "completed",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}
}رفع الملفات
ارفع الملفات إلى تخزين Atlas Cloud واحصل على URL يمكنك استخدامه في طلبات API الخاصة بك. استخدم multipart/form-data للرفع.
/api/v1/model/uploadMediaمثال الرفع
import requests
url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
with open("image.png", "rb") as f:
files = {"file": ("image.png", f, "image/png")}
response = requests.post(url, headers=headers, files=files)
result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")الاستجابة
{
"data": {
"download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
"file_name": "image.png",
"content_type": "image/png",
"size": 1024000
}
}Input Schema
المعاملات التالية مقبولة في نص الطلب.
لا توجد معاملات متاحة.
مثال على نص الطلب
{
"model": "google/veo3.1/reference-to-video"
}Output Schema
تُرجع API استجابة تنبؤ تحتوي على عناوين URL للمخرجات المولّدة.
مثال على الاستجابة
{
"id": "pred_abc123",
"status": "completed",
"model": "model-name",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.mp4"
],
"metrics": {
"predict_time": 45.2
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}Atlas Cloud Skills
يدمج Atlas Cloud Skills أكثر من 300 نموذج ذكاء اصطناعي مباشرة في مساعد البرمجة بالذكاء الاصطناعي الخاص بك. أمر واحد للتثبيت، ثم استخدم اللغة الطبيعية لتوليد الصور ومقاطع الفيديو والدردشة مع LLM.
العملاء المدعومون
التثبيت
npx skills add AtlasCloudAI/atlas-cloud-skillsإعداد مفتاح API
احصل على مفتاح API الخاص بك من لوحة تحكم Atlas Cloud وعيّنه كمتغير بيئة.
export ATLASCLOUD_API_KEY="your-api-key-here"الإمكانيات
بمجرد التثبيت، يمكنك استخدام اللغة الطبيعية في مساعد الذكاء الاصطناعي الخاص بك للوصول إلى جميع نماذج Atlas Cloud.
MCP Server
يربط Atlas Cloud MCP Server بيئة التطوير الخاصة بك بأكثر من 300 نموذج ذكاء اصطناعي عبر Model Context Protocol. يعمل مع أي عميل متوافق مع MCP.
العملاء المدعومون
التثبيت
npx -y atlascloud-mcpالتكوين
أضف التكوين التالي إلى ملف إعدادات MCP في بيئة التطوير الخاصة بك.
{
"mcpServers": {
"atlascloud": {
"command": "npx",
"args": [
"-y",
"atlascloud-mcp"
],
"env": {
"ATLASCLOUD_API_KEY": "your-api-key-here"
}
}
}
}الأدوات المتاحة
مخطط API
المخطط غير متاحGoogle Veo 3.1 — Reference-to-Video Model
Veo 3.1 Reference-to-Video brings static images to life by combining visual reference consistency with cinematic motion generation. Powered by Google DeepMind’s next-generation Veo 3.1 architecture, this model transforms up to three reference images into coherent 5-second videos with smooth motion, accurate visual alignment, and synchronized native audio.
🌟 Key Features
🧠 Multi-Image Reference Support
- Accepts up to three reference images to define the subject, environment, or style.
- Maintains consistent identity, lighting, and appearance across frames.
- Ideal for animating people, objects, or scenes with reliable fidelity.
🎬 Cinematic Video Generation
- Produces 5-second motion clips at 1080p or 720p resolution.
- Adds camera dynamics such as panning, zooming, or subtle perspective drift.
- Supports synchronized audio generation, matching dialogue or ambient context.
💡 Smart Prompt Adherence
- Interprets both text instructions and visual cues for precise motion storytelling.
- Automatically harmonizes character interactions, props, and backgrounds.
⚙️ Capabilities
-
Input:
- Up to 3 reference images (JPEG / PNG / WEBP)
- Text prompt describing motion, action, and scene context
-
Output:
- 8-second MP4 video (720p or 1080p)
- Optional synchronized audio
-
Negative Prompt (optional):
- Exclude unwanted artifacts or elements (e.g., “no text”, “no flicker”).
-
Seed (optional):
- Reproduce specific results for consistent creative control.
💰 Pricing
| Duration | Resolution | With Audio | Without Audio |
|---|---|---|---|
| 8 seconds | 720p | $3.20 | $1.60 |
| 8 seconds | 1080p | $3.20 | $1.60 |
✅ Commercial use allowed
🧩 How to Use
- Upload up to 3 reference images — define the subject, object, or visual style.
- Write a text prompt — describe the action, setting, and camera motion.
- (Optional) Add a negative prompt to remove unwanted details.
- Choose resolution (720p or 1080p).
- (Optional) Enable audio generation for synchronized sound.
- Click Run to generate your 5-second cinematic video.
💡 Best Practices
- Use clear, well-lit reference images with similar styles and proportions.
- Keep prompts concise but specific (e.g., “The man in image 1 waves to the penguins in image 2 under bright sunlight”).
- Avoid overly complex scenarios with many characters or fast movement.
- Enable audio for more immersive storytelling results.
📝 Notes
- Ensure uploaded images are valid and accessible URLs or uploaded locally.
- If the output looks unstable, reduce reference count or simplify the prompt.
- Follow Google’s content safety rules; modify the prompt if flagged.
- For best performance, prefer portrait-oriented subjects and balanced lighting.






