Comment utiliser l'API Gemini Omni : Guide étape par étape (2026)

Comment utiliser l'API Gemini Omni Flash en 15 minutes. Code complet en Python et Node.js pour la conversion texte-vidéo et image-vidéo via Atlas Cloud. Tarification : à partir de USD1.00 par clip.

TL;DR : Ce tutoriel vous montre comment utiliser l'API Gemini Omni Flash pour générer des vidéos à partir de prompts texte et d'images de référence. Grâce à l'API unifiée d'Atlas Cloud, vous disposerez d'un script de génération vidéo fonctionnel en environ 15 minutes. Aucune approbation de compte Google n'est requise — seule une clé API Atlas Cloud est nécessaire.

Le guide de démarrage officiel de l'API Gemini de Google ne couvre pas spécifiquement Gemini Omni Flash. Ce tutoriel utilise le point de terminaison d'API unifié d'Atlas Cloud, qui permet un accès direct à Gemini Omni Flash sans passer par une application Google AI Studio distincte.

terminal style éditorial développeur

Un fil de discussion sur r/GeminiAI intitulé "Accès à l'API Gemini Omni Flash : 5 fournisseurs testés, classés par cas d'usage" est apparu il y a six jours et est rapidement devenu la référence incontournable pour les développeurs évaluant leurs options. Le commentaire principal allait droit au but : Google AI Studio est le moyen le plus rapide pour démarrer, mais on atteint rapidement les limites de débit. Les développeurs à la recherche d'une solution prête pour la production ont besoin d'un autre point d'entrée.

Gemini Omni Flash est le modèle multimodal de génération vidéo de Google qui accepte toute combinaison de texte, d'images, d'audio et de vidéo en entrée. Il génère des vidéos cinématographiques allant jusqu'à 10 secondes, avec des résolutions allant du 720p au 4K. Ce tutoriel vous montre comment utiliser l'API Gemini Omni Flash via Atlas Cloud, qui fournit un point de terminaison d'API unifié, une facturation à l'usage et aucune limite de débit liée à un compte Google.

Ce tutoriel couvre l'API Gemini Omni pour 2 modes de génération : Texte vers Vidéo (Text-to-Video) et Image vers Vidéo (Image-to-Video). Tous les exemples de code sont testés avec l'API Atlas Cloud en conditions réelles.

Prérequis pour l'API Gemini Omni Flash

Vous aurez besoin de :

  • Python 3.9+ ou Node.js 18+
  • Un compte Atlas Cloud et une clé API (inscription gratuite)
  • La bibliothèque requests pour Python, ou axios pour Node.js
  • Une familiarité de base avec les API REST
  • Environ 15 minutes pour terminer

Testé sur : macOS 14, Ubuntu 22.04, Windows 11 (WSL2)

Référence tarifaire (source tarifs Atlas Cloud, 02/06/2026) :

  • 720p / 1080p : base de USD0.20 + USD0.10 par seconde. Une vidéo 720p de 8 secondes coûte USD1.00.
  • 4K : base de USD1.00 + USD0.10 par seconde. Une vidéo 4K de 8 secondes coûte USD1.80.

Ce que nous allons construire avec l'API Gemini Omni

À la fin de ce tutoriel, vous aurez deux scripts fonctionnels : l'un qui génère une vidéo à partir d'un prompt texte, et l'autre qui anime une image de référence en une vidéo. Les deux scripts partagent la même logique d'authentification et de sondage (polling). L'architecture est simple :

plaintext
1Votre Script → API Atlas Cloud → Gemini Omni Flash → URL de la vidéo
2               (auth + file d'attente)   (génération)      (sortie)

Ce que font les scripts terminés :

  • Soumettent une demande de génération et reçoivent un
    text
    1prediction_id
  • Interrogent le point de terminaison de statut toutes les 3 secondes jusqu'à ce que la vidéo soit prête
  • Affichent l'URL de la vidéo générée une fois le processus terminé

Étape 1 : Obtenir votre clé API pour Gemini Omni Flash

Dans cette étape, vous allez créer un compte Atlas Cloud et générer une clé API afin que vos scripts puissent s'authentifier auprès de l'API Gemini Omni Flash.

  1. Allez sur atlascloud.ai et créez un compte gratuit.
  2. Dans le tableau de bord, accédez à API Keys.
  3. Cliquez sur Create new key, copiez la clé et conservez-la en lieu sûr.

Définissez la clé comme variable d'environnement afin de ne pas la coder en dur dans vos scripts :

plaintext
1# macOS / Linux
2export ATLASCLOUD_API_KEY="votre_clé_api_ici"
3
4# Windows (PowerShell)
5$env:ATLASCLOUD_API_KEY="votre_clé_api_ici"

Vérifiez qu'elle est correctement définie :

plaintext
1echo $ATLASCLOUD_API_KEY

Sortie attendue :

plaintext
1votre_clé_api_ici

Attention : Ne committez jamais votre clé API dans le contrôle de version. Ajoutez ATLASCLOUD_API_KEY à votre .gitignore via un fichier .env si vous utilisez python-dotenv ou dotenv pour Node.js.

Étape 2 : Effectuer votre première requête API Gemini Omni Flash

Dans cette étape, vous allez soumettre une demande de Text-to-Video à l'API Gemini Omni Flash et recevoir un

text
1prediction_id
pour suivre le travail.

Le point de terminaison pour toute génération vidéo sur Atlas Cloud est :

plaintext
1POST https://api.atlascloud.ai/api/v1/model/generateVideo

L'identifiant du modèle pour Gemini Omni Flash Text-to-Video est :

plaintext
1google/gemini-omni-flash/text-to-video-developer

Python

plaintext
1# gemini_omni_t2v.py
2import requests
3import os
4
5API_KEY = os.environ["ATLASCLOUD_API_KEY"]
6BASE_URL = "https://api.atlascloud.ai/api/v1/model"
7
8headers = {
9    "Content-Type": "application/json",
10    "Authorization": f"Bearer {API_KEY}"
11}
12
13payload = {
14    "model": "google/gemini-omni-flash/text-to-video-developer",
15    "prompt": "A young woman walks slowly through a rainy Tokyo street at night, neon reflections on wet pavement, cinematic slow motion, realistic lighting, 4K, film grain",
16    "duration": 8,          # secondes : 4, 6, 8 ou 10
17    "aspect_ratio": "16:9", # "16:9" ou "9:16"
18    "resolution": "1080p",  # "720p", "1080p" ou "4k"
19    "seed": -1              # -1 pour aléatoire ; définissez un entier pour une sortie reproductible
20}
21
22response = requests.post(f"{BASE_URL}/generateVideo", headers=headers, json=payload)
23response.raise_for_status()
24
25prediction_id = response.json()["data"]["id"]
26print(f"Travail soumis. ID de prédiction : {prediction_id}")

Node.js

plaintext
1// geminiOmniT2V.js
2const axios = require("axios");
3
4const API_KEY = process.env.ATLASCLOUD_API_KEY;
5const BASE_URL = "https://api.atlascloud.ai/api/v1/model";
6
7const headers = {
8  "Content-Type": "application/json",
9  Authorization: `Bearer ${API_KEY}`,
10};
11
12const payload = {
13  model: "google/gemini-omni-flash/text-to-video-developer",
14  prompt:
15    "A young woman walks slowly through a rainy Tokyo street at night, neon reflections on wet pavement, cinematic slow motion, realistic lighting, 4K, film grain",
16  duration: 8,
17  aspect_ratio: "16:9",
18  resolution: "1080p",
19  seed: -1,
20};
21
22axios
23  .post(`${BASE_URL}/generateVideo`, payload, { headers })
24  .then((res) => {
25    const predictionId = res.data.data.id;
26    console.log(`Travail soumis. ID de prédiction : ${predictionId}`);
27  })
28  .catch((err) => console.error(err.response?.data || err.message));

Sortie attendue :

plaintext
1Travail soumis. ID de prédiction : pred_abc123xyz

Attention : L'API renvoie immédiatement un

text
1prediction_id
. La vidéo n'est pas encore prête. Vous devez interroger le point de terminaison de statut à l'étape 3 pour récupérer l'URL de sortie.

Étape 3 : Sondage pour le résultat vidéo de Gemini Omni Flash

Dans cette étape, vous allez interroger le point de terminaison de statut à plusieurs reprises jusqu'à ce que la génération vidéo soit terminée et que l'URL de sortie soit disponible.

La génération vidéo avec Gemini Omni Flash est asynchrone. Le temps de réalisation typique est de 30 secondes à 3 minutes selon la résolution et la charge du serveur. Le point de terminaison de statut est :

plaintext
1GET https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}

Valeurs de statut possibles : processing, completed, succeeded, failed.

Python

plaintext
1# poll_result.py
2import requests
3import time
4import os
5
6API_KEY = os.environ["ATLASCLOUD_API_KEY"]
7BASE_URL = "https://api.atlascloud.ai/api/v1/model"
8
9headers = {
10    "Authorization": f"Bearer {API_KEY}"
11}
12
13def poll_video(prediction_id: str, timeout: int = 360) -> str:
14    """Sonder jusqu'à ce que la vidéo soit prête, puis retourner l'URL de sortie."""
15    elapsed = 0
16    while elapsed < timeout:
17        response = requests.get(
18            f"{BASE_URL}/prediction/{prediction_id}",
19            headers=headers
20        )
21        response.raise_for_status()
22        data = response.json()["data"]
23        status = data["status"]
24
25        if status in ("completed", "succeeded"):
26            video_url = data["outputs"][0]
27            print(f"Vidéo prête : {video_url}")
28            return video_url
29
30        if status == "failed":
31            raise RuntimeError(f"La génération a échoué : {data}")
32
33        print(f"Statut : {status} — attente de 3 secondes...")
34        time.sleep(3)
35        elapsed += 3
36
37    raise TimeoutError(f"La génération n'a pas été terminée dans les {timeout} secondes.")
38
39# Remplacez par votre prediction_id réel de l'étape 2
40video_url = poll_video("pred_abc123xyz")

Node.js

plaintext
1// pollResult.js
2const axios = require("axios");
3
4const API_KEY = process.env.ATLASCLOUD_API_KEY;
5const BASE_URL = "https://api.atlascloud.ai/api/v1/model";
6const headers = { Authorization: `Bearer ${API_KEY}` };
7
8async function pollVideo(predictionId, timeoutMs = 360000) {
9  const start = Date.now();
10  while (Date.now() - start < timeoutMs) {
11    const res = await axios.get(`${BASE_URL}/prediction/${predictionId}`, { headers });
12    const data = res.data.data;
13
14    if (data.status === "completed" || data.status === "succeeded") {
15      console.log("Vidéo prête :", data.outputs[0]);
16      return data.outputs[0];
17    }
18    if (data.status === "failed") throw new Error(`La génération a échoué : {JSON.stringify(data)}`);
19
20    console.log(`Statut : ${data.status} — attente de 3 secondes...`);
21    await new Promise((r) => setTimeout(r, 3000));
22  }
23  throw new Error("Délai de génération dépassé.");
24}
25
26pollVideo("pred_abc123xyz");

Sortie attendue :

plaintext
1Statut : processing — attente de 3 secondes...
2Statut : processing — attente de 3 secondes...
3Vidéo prête : https://storage.atlascloud.ai/outputs/result.mp4

Réglez votre intervalle de sondage sur 3 secondes plutôt que 1 seconde. Le sondage toutes les secondes ajoute des appels API inutiles sans réduire de manière significative le temps d'attente, car les travaux Gemini Omni Flash sont rarement terminés en moins de 30 secondes en 1080p.

Attention : Les vidéos de sortie sont stockées sur les serveurs Atlas Cloud pendant 48 heures. Téléchargez le fichier sur votre propre stockage immédiatement après la génération si vous devez le conserver.

Étape 4 : Image vers Vidéo avec l'API Gemini Omni Flash

Dans cette étape, vous allez télécharger une image locale vers Atlas Cloud et l'utiliser comme référence pour la génération Image-to-Video avec l'API Gemini Omni Flash.

La génération Image-to-Video utilise le même point de terminaison mais nécessite un ID de modèle différent et un tableau

text
1images
. L'identifiant du modèle est :

plaintext
1google/gemini-omni-flash/image-to-video-developer

Gemini Omni Flash Image-to-Video accepte de 1 à 7 images de référence (PNG, JPEG, JPG ou WebP ; maximum 20 Mo chacune, minimum 128×128 px). Il préserve l'identité visuelle à travers la vidéo générée, en maintenant la cohérence des personnages et des objets.

la vidéo montre une personne en mouvement

Étape 4a : Téléchargez votre image

plaintext
1# upload_image.py
2import requests
3import os
4
5API_KEY = os.environ["ATLASCLOUD_API_KEY"]
6UPLOAD_URL = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
7
8headers = {"Authorization": f"Bearer {API_KEY}"}
9
10with open("reference.jpg", "rb") as f:
11    response = requests.post(UPLOAD_URL, headers=headers, files={"file": f})
12
13response.raise_for_status()
14image_url = response.json()["data"]["url"]
15print(f"URL de l'image téléchargée : {image_url}")

Étape 4b : Soumettre la demande Image-to-Video

plaintext
1# gemini_omni_i2v.py
2import requests
3import os
4
5API_KEY = os.environ["ATLASCLOUD_API_KEY"]
6BASE_URL = "https://api.atlascloud.ai/api/v1/model"
7
8headers = {
9    "Content-Type": "application/json",
10    "Authorization": f"Bearer {API_KEY}"
11}
12
13payload = {
14    "model": "google/gemini-omni-flash/image-to-video-developer",
15    "prompt": "The character walks forward slowly, natural lighting, cinematic depth of field",
16    "images": [image_url],  # utilisez l'URL renvoyée à l'étape 4a
17    "duration": 8,
18    "aspect_ratio": "16:9",
19    "resolution": "1080p",
20    "seed": -1
21}
22
23response = requests.post(f"{BASE_URL}/generateVideo", headers=headers, json=payload)
24response.raise_for_status()
25
26prediction_id = response.json()["data"]["id"]
27print(f"Travail soumis. ID de prédiction : {prediction_id}")
28# Puis sondez en utilisant la fonction poll_video() de l'étape 3

Pour de meilleurs résultats avec Gemini Omni Flash Image-to-Video, utilisez une image de référence propre, bien éclairée, avec un arrière-plan neutre ou simple. Le modèle préserve les détails du visage et des vêtements de manière plus cohérente lorsque le sujet est clairement séparé de l'arrière-plan. Les images avec des motifs complexes ou un post-traitement important ont tendance à produire des résultats incohérents entre les images.

Attention : Les formats d'image acceptés sont uniquement PNG, JPEG, JPG et WebP. Les fichiers supérieurs à 20 Mo seront rejetés avec une erreur 400.

Étape 5 : Changer de modèle avec un changement de paramètre

L'un des avantages pratiques de l'accès à l'API Gemini Omni via Atlas Cloud est que chaque modèle de génération vidéo sur la plateforme partage le même point de terminaison et la même logique de sondage. Passer de Gemini Omni Flash à un autre modèle ne nécessite qu'un changement de paramètre de modèle.

plaintext
1# Passer à Seedance 2.0 Text-to-Video (facturé USD0.096/s sur Atlas Cloud)
2payload["model"] = "bytedance/seedance-2-0/text-to-video"
3
4# Passer à Veo 3.1 Lite
5payload["model"] = "google/veo-3-1/lite-text-to-video"

Cela simplifie les tests A/B entre les modèles. Vous pouvez exécuter le même prompt à travers plusieurs modèles et comparer la qualité de sortie avant de vous engager sur un modèle spécifique pour la production.

Dépannage de l'API Gemini Omni Flash

Voici les cinq problèmes les plus courants lors de l'utilisation de l'API Gemini Omni Flash et comment les résoudre.

ProblèmeSymptômeSolution
401 Unauthorized{"error": "Invalid API key"}Vérifiez que votre variable d'environnement ATLASCLOUD_API_KEY est définie et non expirée
400 Bad Request{"error": "Invalid prompt"}Le prompt viole probablement la politique de contenu ; reformulez ou supprimez le contenu restreint
Tâche bloquée sur
text
1processing
Pas de statut terminé après 6 minutesRecommencez la demande ; c'est rare mais cela peut se produire pendant les pics de charge
L'URL vidéo renvoie 404URL non accessibleLes fichiers de sortie expirent après 48 heures ; téléchargez immédiatement après la génération
429 Too Many RequestsLimite de débit dépasséeAjoutez un délai entre les demandes ; utilisez une stratégie d'attente exponentielle (exponential backoff) lors des tentatives

Toujours bloqué ? Visitez la documentation Atlas Cloud ou contactez le support via le canal dédié de la plateforme.

Prochaines étapes

Maintenant que vous disposez de scripts Text-to-Video et Image-to-Video fonctionnels, voici comment les étendre.

Étendre ce projet :

  • Ajoutez le Reference-to-Video avec entrée audio en utilisant Seedance 2.0, qui prend en charge jusqu'à 7 images de référence combinées avec une piste audio
  • Construisez un pipeline de génération par lots qui soumet plusieurs prompts en parallèle et collecte les résultats de manière asynchrone
  • Ajoutez un estimateur de coût à votre script : coût = 0.20 + (durée * 0.10) pour le 720p/1080p

Ressources associées :

Foire aux questions (FAQ)

Qu'est-ce que l'API Gemini Omni Flash ?

L'API Gemini Omni Flash est l'interface de génération vidéo multimodale de Google qui accepte toute combinaison de texte, d'images, d'audio et de vidéo en entrée et produit des clips vidéo cinématographiques. Elle prend en charge des durées de 4 à 10 secondes, des résolutions de 720p à 4K, et des formats d'image paysage et portrait. Accédez-y via Atlas Cloud sans processus d'approbation Google séparé.

Combien coûte l'API Gemini Omni Flash ?

Sur Atlas Cloud, Gemini Omni Flash est facturé USD0.20 de base plus USD0.10 par seconde pour une sortie 720p et 1080p. Un clip standard de 8 secondes en 1080p coûte USD1.00. Pour une sortie 4K, les frais de base sont de USD1.00 plus USD0.10 par seconde, ce qui porte un clip 4K de 8 secondes à USD1.80. Toute la tarification est à l'usage sans dépense minimale (tarification Atlas Cloud, 02/06/2026).

Quelle est la différence entre Google AI Studio et Atlas Cloud pour l'accès à l'API Gemini Omni Flash ?

Google AI Studio fournit un accès direct aux modèles Gemini mais nécessite un compte Google et est soumis à des quotas d'utilisation individuels qui peuvent être atteints rapidement. Atlas Cloud fournit le même modèle Gemini Omni Flash via un point de terminaison d'API unifié avec une facturation transparente à la seconde, sans file d'attente d'approbation, et avec un accès à plus de 300 autres modèles vidéo et image sous la même clé API. Pour une utilisation en production, l'API unifiée d'Atlas Cloud élimine le besoin de gérer des identifiants distincts par fournisseur de modèle.

Combien de temps faut-il à Gemini Omni Flash pour générer une vidéo ?

Le temps de génération typique pour une vidéo 1080p de 8 secondes est de 30 secondes à 3 minutes selon la charge du serveur. L'API est asynchrone : votre script soumet un travail et reçoit immédiatement un

text
1prediction_id
, puis interroge le point de terminaison de statut jusqu'à ce que la vidéo soit prête. Basez votre gestion des délais sur une limite supérieure de 6 minutes pour tenir compte des périodes de forte charge.

Puis-je utiliser l'API Gemini Omni Flash gratuitement ?

Atlas Cloud offre des crédits gratuits pour les nouveaux comptes, que vous pouvez appliquer à la génération avec Gemini Omni Flash. Une fois les crédits gratuits épuisés, la facturation se fait à l'usage, sans abonnement requis. Inscrivez-vous sur atlascloud.ai pour commencer.

Modèles récents

Une seule API pour toute l'IA multimédia.

Explorer tous les modèles

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.