كيفية استخدام Gemini Omni API: دليل خطوة بخطوة (2026)

باختصار: يوضح لك هذا البرنامج التعليمي كيفية استخدام واجهة برمجة تطبيقات Gemini Omni Flash لإنشاء مقاطع فيديو من نصوص توجيهية (text prompts) وصور مرجعية. باستخدام واجهة برمجة التطبيقات الموحدة من Atlas Cloud، سيكون لديك نص برمجي فعال لإنشاء الفيديو في غضون 15 دقيقة تقريبًا. لا يلزم الحصول على موافقة من حساب Google — يكفي فقط الحصول على مفتاح API من Atlas Cloud.

لا تغطي أدلة البدء السريع الرسمية لواجهة برمجة تطبيقات Gemini من Google نموذج Gemini Omni Flash بشكل خاص. يستخدم هذا البرنامج التعليمي نقطة النهاية الموحدة لواجهة برمجة تطبيقات Atlas Cloud، والتي توفر وصولاً مباشراً إلى Gemini Omni Flash دون الحاجة إلى تطبيق منفصل من Google AI Studio.

developer editorial style terminal

ظهر موضوع على r/GeminiAI بعنوان "الوصول إلى واجهة برمجة تطبيقات Gemini Omni Flash: تم اختبار 5 مزودين، وتصنيفهم حسب حالة الاستخدام" قبل ستة أيام، وسرعان ما أصبح المرجع الأساسي للمطورين الذين يقيمون خياراتهم. كان التعليق الأبرز مباشراً: Google AI Studio هو الطريقة الأسرع للبدء، لكنك ستصطدم بحدود الاستخدام (rate limits) بسرعة. المطورون الذين يبحثون عن مسار جاهز للإنتاج يحتاجون إلى نقطة دخول مختلفة.

Gemini Omni Flash هو نموذج Google متعدد الوسائط لتوليد الفيديو، يقبل أي مزيج من النصوص والصور والصوت والفيديو كمدخلات. يقوم بإنشاء مقاطع فيديو سينمائية تصل مدتها إلى 10 ثوانٍ وبدقة تتراوح من 720p إلى 4K. يوضح هذا البرنامج التعليمي كيفية استخدام واجهة برمجة تطبيقات Gemini Omni Flash عبر Atlas Cloud، والتي توفر نقطة نهاية موحدة، ودفعاً حسب الاستخدام، ولا توجد حدود استخدام مرتبطة بحساب Google.

يغطي هذا البرنامج التعليمي واجهة برمجة تطبيقات Gemini Omni لنوعين من أوضاع التوليد: تحويل النص إلى فيديو وتحويل الصورة إلى فيديو. تم اختبار جميع أمثلة الأكواد باستخدام واجهة برمجة تطبيقات Atlas Cloud المباشرة.

متطلبات واجهة برمجة تطبيقات Gemini Omni Flash

ستحتاج إلى:

Python 3.9+ أو Node.js 18+
حساب Atlas Cloud ومفتاح API (التسجيل مجاني)
مكتبة requests لـ Python، أو axios لـ Node.js
إلمام أساسي بـ REST APIs
حوالي 15 دقيقة لإكمال العمل

تم الاختبار على: macOS 14، Ubuntu 22.04، Windows 11 (WSL2)

مرجع التسعير (مأخوذ من تسعير Atlas Cloud، بتاريخ 2026-06-02):

720p / 1080p: دولار أمريكي 0.20 كرسوم أساسية + دولار أمريكي 0.10 لكل ثانية. تكلفة فيديو 720p مدته 8 ثوانٍ هي دولار أمريكي 1.00.
4K: دولار أمريكي 1.00 كرسوم أساسية + دولار أمريكي 0.10 لكل ثانية. تكلفة فيديو 4K مدته 8 ثوانٍ هي دولار أمريكي 1.80.

ما الذي نبنيه باستخدام واجهة برمجة تطبيقات Gemini Omni

بنهاية هذا البرنامج التعليمي، سيكون لديك نصان برمجيان يعملان: أحدهما ينشئ فيديو من نص توجيهي، والآخر يحول صورة مرجعية إلى فيديو. يشترك كلا النصين في نفس منطق المصادقة والاستعلام (polling logic). البنية مباشرة:

plaintext
1Your Script → Atlas Cloud API → Gemini Omni Flash → Video URL
2               (auth + queue)     (generation)      (output)

ما الذي تفعله النصوص النهائية:

إرسال طلب التوليد والحصول على prediction_id
الاستعلام عن نقطة نهاية الحالة كل 3 ثوانٍ حتى يصبح الفيديو جاهزاً
طباعة رابط الفيديو الناتج عند اكتمال عملية التوليد

الخطوة 1: الحصول على مفتاح الـ API الخاص بـ Gemini Omni Flash

في هذه الخطوة، ستقوم بإنشاء حساب على Atlas Cloud وتوليد مفتاح API لكي تتمكن نصوصك البرمجية من المصادقة مع واجهة برمجة تطبيقات Gemini Omni Flash.

اذهب إلى atlascloud.ai وقم بالتسجيل للحصول على حساب مجاني.
من لوحة التحكم، انتقل إلى API Keys.
انقر على Create new key، وقم بنسخ المفتاح وتخزينه بشكل آمن.

قم بتعيين المفتاح كمتغير بيئة (environment variable) حتى لا تضعه برمجياً بشكل ثابت (hard-code) داخل نصوصك:

plaintext
1# macOS / Linux
2export ATLASCLOUD_API_KEY="your_api_key_here"
3
4# Windows (PowerShell)
5$env:ATLASCLOUD_API_KEY="your_api_key_here"

تحقق من تعيينه بشكل صحيح:

plaintext
1echo $ATLASCLOUD_API_KEY

المخرج المتوقع:

plaintext
1your_api_key_here

تنبيه: لا تقم أبداً برفع مفتاح الـ API الخاص بك إلى أنظمة التحكم في الإصدار (مثل GitHub). أضف ATLASCLOUD_API_KEY إلى ملف .gitignore عبر ملف .env إذا كنت تستخدم python-dotenv أو dotenv لـ Node.js.

الخطوة 2: تنفيذ طلبك الأول لواجهة برمجة تطبيقات Gemini Omni Flash

في هذه الخطوة، ستقوم بإرسال طلب "تحويل نص إلى فيديو" إلى واجهة برمجة تطبيقات Gemini Omni Flash واستلام prediction_id لمتابعة المهمة.

نقطة النهاية لجميع عمليات توليد الفيديو على Atlas Cloud هي:

plaintext
1POST https://api.atlascloud.ai/api/v1/model/generateVideo

معرف النموذج لـ Gemini Omni Flash (تحويل نص إلى فيديو) هو:

plaintext
1google/gemini-omni-flash/text-to-video-developer

Python

plaintext
1# gemini_omni_t2v.py
2import requests
3import os
4
5API_KEY = os.environ["ATLASCLOUD_API_KEY"]
6BASE_URL = "https://api.atlascloud.ai/api/v1/model"
7
8headers = {
9    "Content-Type": "application/json",
10    "Authorization": f"Bearer {API_KEY}"
11}
12
13payload = {
14    "model": "google/gemini-omni-flash/text-to-video-developer",
15    "prompt": "A young woman walks slowly through a rainy Tokyo street at night, neon reflections on wet pavement, cinematic slow motion, realistic lighting, 4K, film grain",
16    "duration": 8,          # seconds: 4, 6, 8, or 10
17    "aspect_ratio": "16:9", # "16:9" or "9:16"
18    "resolution": "1080p",  # "720p", "1080p", or "4k"
19    "seed": -1              # -1 for random; set an integer for reproducible output
20}
21
22response = requests.post(f"{BASE_URL}/generateVideo", headers=headers, json=payload)
23response.raise_for_status()
24
25prediction_id = response.json()["data"]["id"]
26print(f"Job submitted. Prediction ID: {prediction_id}")

Node.js

plaintext
1// geminiOmniT2V.js
2const axios = require("axios");
3
4const API_KEY = process.env.ATLASCLOUD_API_KEY;
5const BASE_URL = "https://api.atlascloud.ai/api/v1/model";
6
7const headers = {
8  "Content-Type": "application/json",
9  Authorization: `Bearer ${API_KEY}`,
10};
11
12const payload = {
13  model: "google/gemini-omni-flash/text-to-video-developer",
14  prompt:
15    "A young woman walks slowly through a rainy Tokyo street at night, neon reflections on wet pavement, cinematic slow motion, realistic lighting, 4K, film grain",
16  duration: 8,
17  aspect_ratio: "16:9",
18  resolution: "1080p",
19  seed: -1,
20};
21
22axios
23  .post(`${BASE_URL}/generateVideo`, payload, { headers })
24  .then((res) => {
25    const predictionId = res.data.data.id;
26    console.log(`Job submitted. Prediction ID: ${predictionId}`);
27  })
28  .catch((err) => console.error(err.response?.data || err.message));

المخرج المتوقع:

plaintext
1Job submitted. Prediction ID: pred_abc123xyz

تنبيه: تعيد الواجهة الـ prediction_id فوراً. الفيديو ليس جاهزاً بعد. يجب عليك الاستعلام عن نقطة نهاية الحالة (status endpoint) في الخطوة 3 لاسترداد رابط الفيديو الناتج.

الخطوة 3: الاستعلام عن نتيجة فيديو Gemini Omni Flash

في هذه الخطوة، ستقوم بالاستعلام عن نقطة نهاية الحالة بشكل متكرر حتى تكتمل عملية توليد الفيديو ويصبح رابط المخرجات متاحاً.

توليد الفيديو باستخدام Gemini Omni Flash هو عملية غير متزامنة (asynchronous). وقت الاكتمال النموذجي يتراوح بين 30 ثانية إلى 3 دقائق اعتماداً على الدقة وحمل الخادم. نقطة نهاية الحالة هي:

plaintext
1GET https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}

قيم الحالة الممكنة: processing، completed، succeeded، failed.

Python

plaintext
1# poll_result.py
2import requests
3import time
4import os
5
6API_KEY = os.environ["ATLASCLOUD_API_KEY"]
7BASE_URL = "https://api.atlascloud.ai/api/v1/model"
8
9headers = {
10    "Authorization": f"Bearer {API_KEY}"
11}
12
13def poll_video(prediction_id: str, timeout: int = 360) -> str:
14    """Poll until the video is ready, then return the output URL."""
15    elapsed = 0
16    while elapsed < timeout:
17        response = requests.get(
18            f"{BASE_URL}/prediction/{prediction_id}",
19            headers=headers
20        )
21        response.raise_for_status()
22        data = response.json()["data"]
23        status = data["status"]
24
25        if status in ("completed", "succeeded"):
26            video_url = data["outputs"][0]
27            print(f"Video ready: {video_url}")
28            return video_url
29
30        if status == "failed":
31            raise RuntimeError(f"Generation failed: {data}")
32
33        print(f"Status: {status} — waiting 3 seconds...")
34        time.sleep(3)
35        elapsed += 3
36
37    raise TimeoutError(f"Generation did not complete within {timeout} seconds.")
38
39# Replace with your actual prediction_id from Step 2
40video_url = poll_video("pred_abc123xyz")

Node.js

plaintext
1// pollResult.js
2const axios = require("axios");
3
4const API_KEY = process.env.ATLASCLOUD_API_KEY;
5const BASE_URL = "https://api.atlascloud.ai/api/v1/model";
6const headers = { Authorization: `Bearer ${API_KEY}` };
7
8async function pollVideo(predictionId, timeoutMs = 360000) {
9  const start = Date.now();
10  while (Date.now() - start < timeoutMs) {
11    const res = await axios.get(`${BASE_URL}/prediction/${predictionId}`, { headers });
12    const data = res.data.data;
13
14    if (data.status === "completed" || data.status === "succeeded") {
15      console.log("Video ready:", data.outputs[0]);
16      return data.outputs[0];
17    }
18    if (data.status === "failed") throw new Error(`Generation failed: {JSON.stringify(data)}`);
19
20    console.log(`Status: ${data.status} — waiting 3 seconds...`);
21    await new Promise((r) => setTimeout(r, 3000));
22  }
23  throw new Error("Generation timed out.");
24}
25
26pollVideo("pred_abc123xyz");

المخرج المتوقع:

plaintext
1Status: processing — waiting 3 seconds...
2Status: processing — waiting 3 seconds...
3Video ready: https://storage.atlascloud.ai/outputs/result.mp4

اجعل الفاصل الزمني للاستعلام 3 ثوانٍ بدلاً من ثانية واحدة. فالاستعلام كل ثانية يضيف طلبات API غير ضرورية دون تقليل وقت الانتظار بشكل ملحوظ، حيث نادراً ما تكتمل مهام Gemini Omni Flash في أقل من 30 ثانية بدقة 1080p.

تنبيه: يتم تخزين مقاطع الفيديو الناتجة على خوادم Atlas Cloud لمدة 48 ساعة. قم بتحميل الملف إلى مساحة التخزين الخاصة بك فوراً بعد التوليد إذا كنت بحاجة للاحتفاظ به.

الخطوة 4: تحويل الصورة إلى فيديو باستخدام Gemini Omni Flash

في هذه الخطوة، ستقوم برفع صورة محلية إلى Atlas Cloud واستخدامها كمرجع لإنشاء فيديو باستخدام واجهة برمجة تطبيقات Gemini Omni Flash.

تستخدم عملية إنشاء "صورة إلى فيديو" نفس نقطة النهاية ولكنها تتطلب معرّف نموذج مختلف ومصفوفة images. معرّف النموذج هو:

plaintext
1google/gemini-omni-flash/image-to-video-developer

يقبل نموذج Gemini Omni Flash (صورة إلى فيديو) من صورة واحدة إلى 7 صور مرجعية (PNG، JPEG، JPG، أو WebP؛ بحد أقصى 20 ميجابايت لكل صورة، وبحد أدنى 128×128 بكسل). يحافظ النموذج على الهوية البصرية عبر الفيديو المُنشأ، مما يحافظ على اتساق الشخصيات والأجسام طوال الفيديو.

the video of showing a person is moving

الخطوة 4 أ: رفع صورتك

plaintext
1# upload_image.py
2import requests
3import os
4
5API_KEY = os.environ["ATLASCLOUD_API_KEY"]
6UPLOAD_URL = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
7
8headers = {"Authorization": f"Bearer {API_KEY}"}
9
10with open("reference.jpg", "rb") as f:
11    response = requests.post(UPLOAD_URL, headers=headers, files={"file": f})
12
13response.raise_for_status()
14image_url = response.json()["data"]["url"]
15print(f"Uploaded image URL: {image_url}")

الخطوة 4 ب: إرسال طلب "صورة إلى فيديو"

plaintext
1# gemini_omni_i2v.py
2import requests
3import os
4
5API_KEY = os.environ["ATLASCLOUD_API_KEY"]
6BASE_URL = "https://api.atlascloud.ai/api/v1/model"
7
8headers = {
9    "Content-Type": "application/json",
10    "Authorization": f"Bearer {API_KEY}"
11}
12
13payload = {
14    "model": "google/gemini-omni-flash/image-to-video-developer",
15    "prompt": "The character walks forward slowly, natural lighting, cinematic depth of field",
16    "images": [image_url],  # use the URL returned in Step 4a
17    "duration": 8,
18    "aspect_ratio": "16:9",
19    "resolution": "1080p",
20    "seed": -1
21}
22
23response = requests.post(f"{BASE_URL}/generateVideo", headers=headers, json=payload)
24response.raise_for_status()
25
26prediction_id = response.json()["data"]["id"]
27print(f"Job submitted. Prediction ID: {prediction_id}")
28# Then poll using the poll_video() function from Step 3

للحصول على أفضل النتائج مع نموذج "صورة إلى فيديو" من Gemini Omni Flash، استخدم صورة مرجعية نظيفة ومضاءة جيداً مع خلفية محايدة أو بسيطة. يحافظ النموذج على تفاصيل الوجه والملابس بشكل أكثر اتساقاً عندما يكون الهدف مفصولاً بوضوح عن الخلفية. الصور ذات الأنماط المعقدة أو المعالجة الثقيلة تميل إلى إنتاج نتائج غير متسقة عبر الإطارات.

تنبيه: صيغ الصور المقبولة هي PNG و JPEG و JPG و WebP فقط. الملفات التي تزيد عن 20 ميجابايت سيتم رفضها مع خطأ 400.

الخطوة 5: التبديل بين النماذج بتغيير معامل واحد

إحدى المزايا العملية للوصول إلى واجهة Gemini Omni من خلال Atlas Cloud هي أن كل نموذج لتوليد الفيديو على المنصة يشترك في نفس نقطة النهاية ومنطق الاستعلام. التبديل من Gemini Omni Flash إلى نموذج آخر لا يتطلب سوى تغيير معرّف النموذج (model parameter).

plaintext
1# Switch to Seedance 2.0 Text-to-Video (priced at $0.096/s on Atlas Cloud)
2payload["model"] = "bytedance/seedance-2-0/text-to-video"
3
4# Switch to Veo 3.1 Lite
5payload["model"] = "google/veo-3-1/lite-text-to-video"

هذا يجعل اختبار A/B عبر النماذج أمراً مباشراً. يمكنك تشغيل نفس النص التوجيهي عبر نماذج متعددة ومقارنة جودة المخرجات قبل اعتماد نموذج معين للإنتاج.

استكشاف أخطاء واجهة برمجة تطبيقات Gemini Omni Flash وإصلاحها

إليك المشكلات الخمس الأكثر شيوعاً عند استخدام واجهة برمجة تطبيقات Gemini Omni Flash وكيفية حلها.

المشكلة	العرض	الحل
401 Unauthorized	{"error": "Invalid API key"}	تأكد من تعيين متغير البيئة ATLASCLOUD_API_KEY وأنه لم تنته صلاحيته
400 Bad Request	{"error": "Invalid prompt"}	من المحتمل أن النص التوجيهي ينتهك سياسة المحتوى؛ أعد صياغته أو احذف المحتوى المقيد
المهمة عالقة في `processing`	لا توجد حالة اكتمال بعد 6 دقائق	أعد إرسال الطلب؛ هذا نادر ولكنه قد يحدث أثناء ذروة التحميل
رابط الفيديو يعيد خطأ 404	الرابط لم يعد متاحاً	تنتهي صلاحية ملفات المخرجات بعد 48 ساعة؛ قم بتحميلها فوراً بعد التوليد
429 Too Many Requests	تجاوزت حد الاستخدام	أضف تأخيراً بين الطلبات؛ استخدم استراتيجية التراجع الأسي (exponential backoff) عند إعادة المحاولة

لا تزال عالقاً؟ قم بزيارة توثيق Atlas Cloud أو تواصل عبر قناة الدعم في المنصة.

الخطوات التالية

الآن بعد أن أصبح لديك نصوص برمجية تعمل لكل من "نص إلى فيديو" و "صورة إلى فيديو"، إليك كيفية تطويرها.

تطوير هذا المشروع:

أضف "مرجع إلى فيديو" مع مدخلات صوتية باستخدام Seedance 2.0، الذي يدعم ما يصل إلى 7 صور مرجعية مدمجة مع مقطع صوتي
بناء خط إنتاج (pipeline) للتوليد الجماعي يرسل نصوصاً توجيهية متعددة بالتوازي ويجمع النتائج بشكل غير متزامن
أضف مقدراً للتكلفة إلى نصك البرمجي: التكلفة = 0.20 + (المدة * 0.10) لدقة 720p/1080p

موارد ذات صلة:

كتالوج نماذج الفيديو في Atlas Cloud — جميع نماذج توليد الفيديو المتاحة
صفحة تسعير Atlas Cloud — التسعير الكامل لكل نموذج
توثيق API لـ Atlas Cloud — المرجع الكامل للـ API

أسئلة مكررة

ما هي واجهة برمجة تطبيقات Gemini Omni Flash؟

واجهة برمجة تطبيقات Gemini Omni Flash هي واجهة توليد الفيديو متعددة الوسائط من Google، والتي تقبل أي مزيج من النصوص والصور والصوت والفيديو كمدخلات وتخرج مقاطع فيديو سينمائية. تدعم مدداً تتراوح من 4 إلى 10 ثوانٍ، ودقة من 720p إلى 4K، وتدعم كلاً من تنسيقي العرض الأفقي والرأسي. يمكنك الوصول إليها عبر Atlas Cloud دون الحاجة إلى عملية موافقة من Google.

كم تكلفة واجهة برمجة تطبيقات Gemini Omni Flash؟

على Atlas Cloud، يتم تسعير Gemini Omni Flash بسعر 0.20 دولار أمريكي كرسوم أساسية + 0.10 دولار أمريكي لكل ثانية لمخرجات 720p و 1080p. المقطع القياسي بطول 8 ثوانٍ وبدقة 1080p يكلف 1.00 دولار أمريكي. أما بالنسبة لمخرجات 4K، فالرسوم الأساسية هي 1.00 دولار أمريكي + 0.10 دولار أمريكي لكل ثانية، مما يجعل تكلفة مقطع 4K بطول 8 ثوانٍ 1.80 دولار أمريكي. جميع الأسعار تعتمد على الدفع حسب الاستخدام بدون حد أدنى للإنفاق (تسعير Atlas Cloud، بتاريخ 2026-06-02).

ما الفرق بين Google AI Studio و Atlas Cloud للوصول إلى واجهة Gemini Omni Flash؟

يوفر Google AI Studio وصولاً مباشراً إلى نماذج Gemini ولكنه يتطلب حساب Google ويخضع لحصص استخدام فردية قد تنفد بسرعة. توفر Atlas Cloud نفس نموذج Gemini Omni Flash عبر نقطة نهاية API موحدة مع فوترة شفافة لكل ثانية، بدون طابور موافقة، وإمكانية الوصول إلى أكثر من 300 نموذج فيديو وصورة أخرى باستخدام نفس مفتاح الـ API. للاستخدام في بيئة الإنتاج، تلغي واجهة API الموحدة لـ Atlas Cloud الحاجة إلى إدارة اعتمادات منفصلة لكل مزود نموذج.

كم يستغرق Gemini Omni Flash لتوليد فيديو؟

وقت التوليد النموذجي لفيديو بدقة 1080p ومدته 8 ثوانٍ يتراوح بين 30 ثانية إلى 3 دقائق اعتماداً على حمل الخادم. الـ API غير متزامن: يرسل النص البرمجي الخاص بك مهمة ويستلم prediction_id فوراً، ثم يستعلم عن نقطة نهاية الحالة حتى يصبح الفيديو جاهزاً. اجعل تعاملك مع وقت المهلة (timeout) مرتبطاً بحد أقصى قدره 6 دقائق لمراعاة فترات ذروة التحميل.

هل يمكنني استخدام واجهة برمجة تطبيقات Gemini Omni Flash مجاناً؟

تقدم Atlas Cloud أرصدة مجانية للحسابات الجديدة، والتي يمكنك تطبيقها على التوليد باستخدام Gemini Omni Flash. بعد نفاد الأرصدة المجانية، تكون الفوترة بنظام الدفع حسب الاستخدام ولا يلزم وجود اشتراك. قم بالتسجيل في atlascloud.ai للبدء.

العودة إلى القائمة

كيفية استخدام Gemini Omni Flash API لإنشاء الفيديو (2026)

متطلبات واجهة برمجة تطبيقات Gemini Omni Flash

ما الذي نبنيه باستخدام واجهة برمجة تطبيقات Gemini Omni

الخطوة 1: الحصول على مفتاح الـ API الخاص بـ Gemini Omni Flash

الخطوة 2: تنفيذ طلبك الأول لواجهة برمجة تطبيقات Gemini Omni Flash

الخطوة 3: الاستعلام عن نتيجة فيديو Gemini Omni Flash

الخطوة 4: تحويل الصورة إلى فيديو باستخدام Gemini Omni Flash

الخطوة 5: التبديل بين النماذج بتغيير معامل واحد

استكشاف أخطاء واجهة برمجة تطبيقات Gemini Omni Flash وإصلاحها

الخطوات التالية

أسئلة مكررة

ما هي واجهة برمجة تطبيقات Gemini Omni Flash؟

كم تكلفة واجهة برمجة تطبيقات Gemini Omni Flash؟

ما الفرق بين Google AI Studio و Atlas Cloud للوصول إلى واجهة Gemini Omni Flash؟

كم يستغرق Gemini Omni Flash لتوليد فيديو؟

هل يمكنني استخدام واجهة برمجة تطبيقات Gemini Omni Flash مجاناً؟

أحدث النماذج

MiniMax H3 Text-to-Video

MiniMax H3 Image-to-Video

MiniMax H3 Reference-to-Video

Reve 2.1 Remix

واجهة برمجية واحدة لكل وسائط الذكاء الاصطناعي.