كيفية استخدام Gemini Omni API: دليل خطوة بخطوة (2026)

كيفية استخدام واجهة برمجة تطبيقات Gemini Omni Flash في 15 دقيقة. رمز برمجي كامل بلغتي Python و Node.js لتحويل النص إلى فيديو والصورة إلى فيديو عبر Atlas Cloud. الأسعار: تبدأ من USD1.00 لكل مقطع.

خلاصة: يوضح هذا الدليل كيفية استخدام واجهة برمجة تطبيقات Gemini Omni Flash لإنشاء فيديوهات انطلاقاً من نصوص وصفية وصور مرجعية. باستخدام واجهة برمجة التطبيقات الموحدة من Atlas Cloud، سيكون لديك سكربت جاهز لإنشاء الفيديوهات في حوالي 15 دقيقة. لا يتطلب الأمر الحصول على موافقة من حساب Google — يكفي فقط الحصول على مفتاح API من Atlas Cloud.

لا تغطي وثائق البدء السريع الرسمية لواجهة Gemini API من Google نموذج Gemini Omni Flash بشكل خاص. يستخدم هذا الدليل نقطة النهاية الموحدة لواجهة API الخاصة بـ Atlas Cloud، والتي توفر وصولاً مباشراً إلى Gemini Omni Flash دون الحاجة إلى استخدام Google AI Studio بشكل منفصل.

developer editorial style terminal

ظهر نقاش على r/GeminiAI بعنوان "الوصول إلى Gemini Omni Flash API: تم اختبار 5 مزودين وتصنيفهم حسب حالات الاستخدام" قبل ستة أيام، وسرعان ما أصبح المرجع الأساسي للمطورين الذين يقيمون خياراتهم. كان التعليق الأبرز مباشراً: Google AI Studio هو أسرع طريقة للبدء، لكنك ستصطدم بحدود الاستخدام (rate limits) بسرعة. المطورون الذين يبحثون عن مسار جاهز للإنتاج يحتاجون إلى نقطة دخول مختلفة.

نموذج Gemini Omni Flash هو نموذج Google متعدد الوسائط لإنشاء الفيديوهات، حيث يقبل أي مزيج من النصوص، والصور، والصوت، والفيديو كمدخلات. وهو يولد فيديوهات سينمائية تصل مدتها إلى 10 ثوانٍ وبدقة تتراوح من 720p إلى 4K. يوضح هذا الدليل كيفية استخدام واجهة Gemini Omni Flash API عبر Atlas Cloud، التي توفر نقطة نهاية موحدة، ودفعاً حسب الاستخدام، وبدون حدود للاستخدام مرتبطة بحساب Google.

يغطي هذا الدليل واجهة Gemini Omni API لوضعين من أوضاع الإنشاء: النص إلى فيديو (Text-to-Video) والصورة إلى فيديو (Image-to-Video). جميع أمثلة الأكواد تم اختبارها مع واجهة API الحية لـ Atlas Cloud.

متطلبات Gemini Omni Flash API

ستحتاج إلى:

  • إصدار Python 3.9+ أو Node.js 18+
  • حساب Atlas Cloud ومفتاح API (التسجيل مجاني)
  • مكتبة requests لـ Python، أو axios لـ Node.js
  • معرفة أساسية بواجهات REST API
  • حوالي 15 دقيقة لإكمال الخطوات

تم الاختبار على: macOS 14، Ubuntu 22.04، Windows 11 (عبر WSL2)

مرجع التسعير (مأخوذ من تسعير Atlas Cloud، بتاريخ 2026-06-02):

  • 720p / 1080p: أساس USD0.20 + USD0.10 لكل ثانية. فيديو مدته 8 ثوانٍ بدقة 720p يكلف USD1.00.
  • 4K: أساس USD1.00 + USD0.10 لكل ثانية. فيديو مدته 8 ثوانٍ بدقة 4K يكلف USD1.80.

ما الذي سنقوم ببنائه باستخدام Gemini Omni API

بحلول نهاية هذا الدليل، سيكون لديك سكربتان يعملان: أحدهما يولد فيديو من نص وصفي، والآخر يحول صورة مرجعية إلى فيديو. يشترك كلا السكربتين في نفس منطق المصادقة والاستعلام. البنية بسيطة ومباشرة:

plaintext
1Your Script → Atlas Cloud API → Gemini Omni Flash → Video URL
2               (auth + queue)     (generation)      (output)

ما تقوم به السكربتات الجاهزة:

  • إرسال طلب إنشاء والحصول على prediction_id
  • الاستعلام عن حالة الطلب كل 3 ثوانٍ حتى يصبح الفيديو جاهزاً
  • طباعة رابط الفيديو الناتج عند اكتمال الإنشاء

الخطوة 1: احصل على مفتاح API الخاص بـ Gemini Omni Flash

في هذه الخطوة، ستنشئ حساباً على Atlas Cloud وتولد مفتاح API ليتمكن السكربت الخاص بك من المصادقة مع واجهة Gemini Omni Flash API.

  1. توجه إلى atlascloud.ai وقم بالتسجيل للحصول على حساب مجاني.
  2. من لوحة التحكم، انتقل إلى API Keys.
  3. انقر على Create new key، انسخ المفتاح، واحفظه في مكان آمن.

قم بتعيين المفتاح كمتغير بيئة (environment variable) حتى لا تضطر لكتابته داخل السكربتات:

plaintext
1# macOS / Linux
2export ATLASCLOUD_API_KEY="your_api_key_here"
3
4# Windows (PowerShell)
5$env:ATLASCLOUD_API_KEY="your_api_key_here"

تحقق من تعيينه بشكل صحيح:

plaintext
1echo $ATLASCLOUD_API_KEY

المخرجات المتوقعة:

plaintext
1your_api_key_here

تنبيه: لا تقم أبداً برفع مفتاح API الخاص بك إلى أنظمة التحكم في الإصدار (مثل Git). أضف ATLASCLOUD_API_KEY إلى ملف .gitignore عبر ملف .env إذا كنت تستخدم python-dotenv أو dotenv لـ Node.js.

الخطوة 2: قم بإرسال طلبك الأول لـ Gemini Omni Flash API

في هذه الخطوة، ستُرسل طلباً لإنشاء فيديو من نص إلى Gemini Omni Flash API وستحصل على prediction_id لتتبع المهمة.

نقطة النهاية لجميع عمليات إنشاء الفيديو على Atlas Cloud هي:

plaintext
1POST https://api.atlascloud.ai/api/v1/model/generateVideo

معرف النموذج لـ Gemini Omni Flash (نص إلى فيديو) هو:

plaintext
1google/gemini-omni-flash/text-to-video-developer

Python

plaintext
1# gemini_omni_t2v.py
2import requests
3import os
4
5API_KEY = os.environ["ATLASCLOUD_API_KEY"]
6BASE_URL = "https://api.atlascloud.ai/api/v1/model"
7
8headers = {
9    "Content-Type": "application/json",
10    "Authorization": f"Bearer {API_KEY}"
11}
12
13payload = {
14    "model": "google/gemini-omni-flash/text-to-video-developer",
15    "prompt": "A young woman walks slowly through a rainy Tokyo street at night, neon reflections on wet pavement, cinematic slow motion, realistic lighting, 4K, film grain",
16    "duration": 8,          # seconds: 4, 6, 8, or 10
17    "aspect_ratio": "16:9", # "16:9" or "9:16"
18    "resolution": "1080p",  # "720p", "1080p", or "4k"
19    "seed": -1              # -1 for random; set an integer for reproducible output
20}
21
22response = requests.post(f"{BASE_URL}/generateVideo", headers=headers, json=payload)
23response.raise_for_status()
24
25prediction_id = response.json()["data"]["id"]
26print(f"Job submitted. Prediction ID: {prediction_id}")

Node.js

plaintext
1// geminiOmniT2V.js
2const axios = require("axios");
3
4const API_KEY = process.env.ATLASCLOUD_API_KEY;
5const BASE_URL = "https://api.atlascloud.ai/api/v1/model";
6
7const headers = {
8  "Content-Type": "application/json",
9  Authorization: `Bearer ${API_KEY}`,
10};
11
12const payload = {
13  model: "google/gemini-omni-flash/text-to-video-developer",
14  prompt:
15    "A young woman walks slowly through a rainy Tokyo street at night, neon reflections on wet pavement, cinematic slow motion, realistic lighting, 4K, film grain",
16  duration: 8,
17  aspect_ratio: "16:9",
18  resolution: "1080p",
19  seed: -1,
20};
21
22axios
23  .post(`${BASE_URL}/generateVideo`, payload, { headers })
24  .then((res) => {
25    const predictionId = res.data.data.id;
26    console.log(`Job submitted. Prediction ID: ${predictionId}`);
27  })
28  .catch((err) => console.error(err.response?.data || err.message));

المخرجات المتوقعة:

plaintext
1Job submitted. Prediction ID: pred_abc123xyz

تنبيه: تُرجع واجهة API معرف prediction_id فوراً. الفيديو ليس جاهزاً بعد. يجب عليك الاستعلام عن حالة الطلب في الخطوة 3 للحصول على رابط النتيجة.

الخطوة 3: الاستعلام عن نتيجة فيديو Gemini Omni Flash

في هذه الخطوة، ستقوم بالاستعلام عن نقطة نهاية الحالة بشكل متكرر حتى تكتمل عملية إنشاء الفيديو ويكون رابط الفيديو متاحاً.

عملية إنشاء الفيديو باستخدام Gemini Omni Flash هي عملية غير متزامنة (asynchronous). الوقت المستغرق عادةً يتراوح بين 30 ثانية و3 دقائق اعتماداً على الدقة وضغط الخادم. نقطة نهاية الحالة هي:

plaintext
1GET https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}

قيم الحالة الممكنة: processing، completed، succeeded، failed.

Python

plaintext
1# poll_result.py
2import requests
3import time
4import os
5
6API_KEY = os.environ["ATLASCLOUD_API_KEY"]
7BASE_URL = "https://api.atlascloud.ai/api/v1/model"
8
9headers = {
10    "Authorization": f"Bearer {API_KEY}"
11}
12
13def poll_video(prediction_id: str, timeout: int = 360) -> str:
14    """Poll until the video is ready, then return the output URL."""
15    elapsed = 0
16    while elapsed < timeout:
17        response = requests.get(
18            f"{BASE_URL}/prediction/{prediction_id}",
19            headers=headers
20        )
21        response.raise_for_status()
22        data = response.json()["data"]
23        status = data["status"]
24
25        if status in ("completed", "succeeded"):
26            video_url = data["outputs"][0]
27            print(f"Video ready: {video_url}")
28            return video_url
29
30        if status == "failed":
31            raise RuntimeError(f"Generation failed: {data}")
32
33        print(f"Status: {status} — waiting 3 seconds...")
34        time.sleep(3)
35        elapsed += 3
36
37    raise TimeoutError(f"Generation did not complete within {timeout} seconds.")
38
39# Replace with your actual prediction_id from Step 2
40video_url = poll_video("pred_abc123xyz")

Node.js

plaintext
1// pollResult.js
2const axios = require("axios");
3
4const API_KEY = process.env.ATLASCLOUD_API_KEY;
5const BASE_URL = "https://api.atlascloud.ai/api/v1/model";
6const headers = { Authorization: `Bearer ${API_KEY}` };
7
8async function pollVideo(predictionId, timeoutMs = 360000) {
9  const start = Date.now();
10  while (Date.now() - start < timeoutMs) {
11    const res = await axios.get(`${BASE_URL}/prediction/${predictionId}`, { headers });
12    const data = res.data.data;
13
14    if (data.status === "completed" || data.status === "succeeded") {
15      console.log("Video ready:", data.outputs[0]);
16      return data.outputs[0];
17    }
18    if (data.status === "failed") throw new Error(`Generation failed: {JSON.stringify(data)}`);
19
20    console.log(`Status: ${data.status} — waiting 3 seconds...`);
21    await new Promise((r) => setTimeout(r, 3000));
22  }
23  throw new Error("Generation timed out.");
24}
25
26pollVideo("pred_abc123xyz");

المخرجات المتوقعة:

plaintext
1Status: processing — waiting 3 seconds...
2Status: processing — waiting 3 seconds...
3Video ready: https://storage.atlascloud.ai/outputs/result.mp4

اضبط فترة الاستعلام (polling interval) على 3 ثوانٍ بدلاً من ثانية واحدة. الاستعلام كل ثانية يضيف طلبات API غير ضرورية دون تقليل وقت الانتظار بشكل ملحوظ، نظراً لأن مهام Gemini Omni Flash نادراً ما تكتمل في أقل من 30 ثانية بدقة 1080p.

تنبيه: يتم تخزين الفيديوهات الناتجة على خوادم Atlas Cloud لمدة 48 ساعة. قم بتحميل الملف إلى مساحة التخزين الخاصة بك فوراً بعد الإنشاء إذا كنت بحاجة للاحتفاظ به.

الخطوة 4: الصورة إلى فيديو مع Gemini Omni Flash API

في هذه الخطوة، ستقوم برفع صورة محلية إلى Atlas Cloud واستخدامها كمرجع لإنشاء فيديو (Image-to-Video) باستخدام واجهة Gemini Omni Flash API.

استخدام "الصورة إلى فيديو" يستخدم نفس نقطة النهاية ولكن يتطلب معرف نموذج مختلف ومصفوفة

text
1images
. معرف النموذج هو:

plaintext
1google/gemini-omni-flash/image-to-video-developer

تقبل خدمة Gemini Omni Flash Image-to-Video من 1 إلى 7 صور مرجعية (صيغ PNG، JPEG، JPG، أو WebP؛ بحد أقصى 20 ميجابايت لكل صورة، وبحد أدنى 128×128 بكسل). تحافظ هذه الخدمة على الهوية البصرية عبر الفيديو المولد، مما يضمن ثبات الشخصيات والكائنات طوال العرض.

the video of showing a person is moving

الخطوة 4أ: رفع صورتك

plaintext
1# upload_image.py
2import requests
3import os
4
5API_KEY = os.environ["ATLASCLOUD_API_KEY"]
6UPLOAD_URL = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
7
8headers = {"Authorization": f"Bearer {API_KEY}"}
9
10with open("reference.jpg", "rb") as f:
11    response = requests.post(UPLOAD_URL, headers=headers, files={"file": f})
12
13response.raise_for_status()
14image_url = response.json()["data"]["url"]
15print(f"Uploaded image URL: {image_url}")

الخطوة 4ب: إرسال طلب الصورة إلى فيديو

plaintext
1# gemini_omni_i2v.py
2import requests
3import os
4
5API_KEY = os.environ["ATLASCLOUD_API_KEY"]
6BASE_URL = "https://api.atlascloud.ai/api/v1/model"
7
8headers = {
9    "Content-Type": "application/json",
10    "Authorization": f"Bearer {API_KEY}"
11}
12
13payload = {
14    "model": "google/gemini-omni-flash/image-to-video-developer",
15    "prompt": "The character walks forward slowly, natural lighting, cinematic depth of field",
16    "images": [image_url],  # use the URL returned in Step 4a
17    "duration": 8,
18    "aspect_ratio": "16:9",
19    "resolution": "1080p",
20    "seed": -1
21}
22
23response = requests.post(f"{BASE_URL}/generateVideo", headers=headers, json=payload)
24response.raise_for_status()
25
26prediction_id = response.json()["data"]["id"]
27print(f"Job submitted. Prediction ID: {prediction_id}")
28# Then poll using the poll_video() function from Step 3

للحصول على أفضل النتائج مع Gemini Omni Flash Image-to-Video، استخدم صورة مرجعية واضحة ومضاءة جيداً بخلفية بسيطة. يحافظ النموذج على تفاصيل الوجه والملابس بشكل أكثر اتساقاً عندما يكون الموضوع مفصولاً بوضوح عن الخلفية. الصور ذات الأنماط المعقدة أو المعالجة المفرطة قد تؤدي إلى نتائج غير متسقة عبر الإطارات.

تنبيه: الصيغ المقبولة هي فقط PNG، JPEG، JPG، و WebP. الملفات التي يتجاوز حجمها 20 ميجابايت سيتم رفضها مع رمز الخطأ 400.

الخطوة 5: تبديل النماذج بتغيير معامل واحد

إحدى المزايا العملية للوصول إلى Gemini Omni API عبر Atlas Cloud هي أن كل نموذج إنشاء فيديو على المنصة يشترك في نفس نقطة النهاية ومنطق الاستعلام. التبديل من Gemini Omni Flash إلى نموذج آخر يتطلب فقط تغيير معامل النموذج (model parameter).

plaintext
1# Switch to Seedance 2.0 Text-to-Video (priced at $0.096/s on Atlas Cloud)
2payload["model"] = "bytedance/seedance-2-0/text-to-video"
3
4# Switch to Veo 3.1 Lite
5payload["model"] = "google/veo-3-1/lite-text-to-video"

هذا يجعل اختبار A/B عبر النماذج أمراً سهلاً. يمكنك تشغيل نفس النص عبر نماذج متعددة ومقارنة جودة المخرجات قبل اعتماد نموذج معين للإنتاج.

استكشاف أخطاء Gemini Omni Flash API وإصلاحها

إليك أكثر خمس مشاكل شيوعاً عند استخدام Gemini Omni Flash API وكيفية حلها.

المشكلةالعرضالحل
401 Unauthorized{"error": "Invalid API key"}تحقق من أن متغير البيئة ATLASCLOUD_API_KEY مضبوط وصحيح ولم ينتهِ
400 Bad Request{"error": "Invalid prompt"}النص الوصفي ربما يخالف سياسة المحتوى؛ أعد صياغته أو أزل المحتوى المقيد
المهمة عالقة في
text
1processing
لا توجد حالة اكتمال بعد 6 دقائقأعد إرسال الطلب؛ هذا نادر ولكنه قد يحدث أثناء فترات الضغط العالي
رابط الفيديو يرجع 404الرابط لم يعد متاحاًملفات المخرجات تنتهي صلاحيتها بعد 48 ساعة؛ حملها فوراً بعد الإنشاء
429 Too Many Requestsتم تجاوز حد الاستخدامأضف تأخيراً بين الطلبات؛ استخدم التراجع الأسي (exponential backoff) عند إعادة المحاولة

هل لا تزال تواجه مشكلة؟ تفضل بزيارة وثائق Atlas Cloud أو تواصل عبر قناة الدعم في المنصة.

الخطوات التالية

الآن بعد أن أصبحت لديك سكربتات تعمل لكل من النص إلى فيديو والصورة إلى فيديو، إليك كيفية توسيعها.

توسيع هذا المشروع:

  • أضف ميزة Reference-to-Video مع إدخال صوتي باستخدام Seedance 2.0، الذي يدعم حتى 7 صور مرجعية مدمجة مع مسار صوتي
  • ابنِ خط معالجة (pipeline) للإنشاء الجماعي يُرسل نصوصاً متعددة بالتوازي ويجمع النتائج بشكل غير متزامن
  • أضف مقدّر تكلفة إلى السكربت الخاص بك: التكلفة = 0.20 + (المدة * 0.10) لدقة 720p/1080p

موارد ذات صلة:

الأسئلة الشائعة

ما هي واجهة Gemini Omni Flash API؟

واجهة Gemini Omni Flash API هي واجهة Google متعددة الوسائط لإنشاء الفيديوهات التي تقبل أي مزيج من النصوص، والصور، والصوت، والفيديو كمدخلات وتنتج مقاطع فيديو سينمائية. تدعم مدد زمنية من 4 إلى 10 ثوانٍ، وبدقة من 720p إلى 4K، ونسب أبعاد أفقية وعمودية. يمكنك الوصول إليها عبر Atlas Cloud دون الحاجة لعملية موافقة منفصلة من Google.

ما تكلفة استخدام Gemini Omni Flash API؟

على Atlas Cloud، يتم تسعير Gemini Omni Flash بمبلغ USD0.20 كأساس بالإضافة إلى USD0.10 لكل ثانية لدقة 720p و 1080p. المقطع القياسي الذي مدته 8 ثوانٍ بدقة 1080p يكلف USD1.00. بالنسبة لدقة 4K، الرسوم الأساسية هي USD1.00 زائد USD0.10 لكل ثانية، مما يجعل مقطع 4K مدته 8 ثوانٍ يكلف USD1.80. جميع الأسعار تعتمد على نظام الدفع حسب الاستخدام بدون حد أدنى للإنفاق (تسعير Atlas Cloud، 2026-06-02).

ما الفرق بين Google AI Studio و Atlas Cloud للوصول إلى Gemini Omni Flash API؟

يوفر Google AI Studio وصولاً مباشراً إلى نماذج Gemini ولكنه يتطلب حساب Google ويخضع لحصص استخدام فردية قد تنفد بسرعة. يوفر Atlas Cloud نفس نموذج Gemini Omni Flash عبر نقطة نهاية API موحدة مع فوترة شفافة بالثانية، وبدون طوابير موافقة، ووصول إلى أكثر من 300 نموذج فيديو وصورة أخرى بنفس مفتاح API. للاستخدام في الإنتاج، تلغي الواجهة الموحدة لـ Atlas Cloud الحاجة إلى إدارة اعتمادات منفصلة لكل مزود نموذج.

كم تستغرق Gemini Omni Flash لإنشاء فيديو؟

الوقت النموذجي للإنشاء لفيديو مدته 8 ثوانٍ وبدقة 1080p يتراوح بين 30 ثانية و3 دقائق اعتماداً على حمل الخادم. الواجهة غير متزامنة: يُرسل السكربت الخاص بك مهمة ويستقبل prediction_id فوراً، ثم يستعلم عن نقطة نهاية الحالة حتى يصبح الفيديو جاهزاً. اجعل معالجة وقت الانتظار لديك مبنية على حد أقصى قدره 6 دقائق لمراعاة فترات الذروة.

هل يمكنني استخدام Gemini Omni Flash API مجاناً؟

يوفر Atlas Cloud رصيداً مجانياً للحسابات الجديدة، يمكنك تطبيقه على إنشاء الفيديوهات باستخدام Gemini Omni Flash. بعد نفاد الرصيد المجاني، تكون الفوترة حسب الاستخدام ولا تتطلب اشتراكاً. سجل في atlascloud.ai للبدء.

أحدث النماذج

واجهة برمجية واحدة لكل وسائط الذكاء الاصطناعي.

استكشف جميع النماذج

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.