Comment utiliser l'API Gemini Omni : guide étape par étape (2026)

TL;DR : Ce tutoriel vous montre comment utiliser l'API Gemini Omni Flash pour générer des vidéos à partir de prompts textuels et d'images de référence. Grâce à l'API unifiée d'Atlas Cloud, vous disposerez d'un script de génération vidéo fonctionnel en environ 15 minutes. Aucune approbation de compte Google n'est requise — seule une clé API Atlas Cloud est nécessaire.

Le guide de démarrage officiel de l'API Gemini de Google ne couvre pas spécifiquement Gemini Omni Flash. Ce tutoriel utilise le point de terminaison de l'API unifiée d'Atlas Cloud, qui permet d'accéder directement à Gemini Omni Flash sans avoir à passer par une application Google AI Studio distincte.

terminal style éditorial développeur

Une discussion sur r/GeminiAI intitulée "Accès à l'API Gemini Omni Flash : 5 fournisseurs testés et classés par cas d'usage" a fait surface il y a six jours et est rapidement devenue la référence pour les développeurs évaluant leurs options. Le commentaire le plus pertinent allait droit au but : Google AI Studio est le moyen le plus rapide de démarrer, mais on atteint rapidement les limites de débit. Les développeurs à la recherche d'une solution prête pour la production ont besoin d'un point d'entrée différent.

Gemini Omni Flash est le modèle multimodal de génération vidéo de Google qui accepte toute combinaison de texte, d'images, d'audio et de vidéo en entrée. Il génère des vidéos cinématiques allant jusqu'à 10 secondes, avec des résolutions de 720p à 4K. Ce tutoriel vous explique comment utiliser l'API Gemini Omni Flash via Atlas Cloud, qui propose un point de terminaison d'API unifié, une tarification à l'usage et aucune limite de débit liée à un compte Google.

Ce tutoriel couvre l'API Gemini Omni pour 2 modes de génération : Text-to-Video et Image-to-Video. Tous les exemples de code sont testés avec l'API en direct d'Atlas Cloud.

Prérequis pour l'API Gemini Omni Flash

Vous aurez besoin de :

Python 3.9+ ou Node.js 18+
Un compte et une clé API Atlas Cloud (inscription gratuite)
La bibliothèque requests pour Python, ou axios pour Node.js
Une familiarité de base avec les API REST
Environ 15 minutes pour terminer

Testé sur : macOS 14, Ubuntu 22.04, Windows 11 (WSL2)

Référence tarifaire (source tarifs Atlas Cloud, 02/06/2026) :

720p / 1080p : USD0.20 de base + USD0.10 par seconde. Une vidéo de 8 secondes en 720p coûte USD1.00.
4K : USD1.00 de base + USD0.10 par seconde. Une vidéo de 8 secondes en 4K coûte USD1.80.

Ce que nous allons construire avec l'API Gemini Omni

À la fin de ce tutoriel, vous disposerez de deux scripts fonctionnels : l'un générant une vidéo à partir d'un prompt textuel, et l'autre animant une image de référence pour en faire une vidéo. Les deux scripts partagent la même logique d'authentification et d'interrogation (polling). L'architecture est simple :

plaintext
1Votre Script → API Atlas Cloud → Gemini Omni Flash → URL Vidéo
2               (auth + file)     (génération)      (sortie)

Ce que font les scripts terminés :

Soumettre une requête de génération et recevoir un prediction_id
Interroger le point de terminaison de statut toutes les 3 secondes jusqu'à ce que la vidéo soit prête
Afficher l'URL de la vidéo générée une fois la génération terminée

Étape 1 : Obtenir votre clé API pour Gemini Omni Flash

Dans cette étape, vous allez créer un compte Atlas Cloud et générer une clé API pour que vos scripts puissent s'authentifier auprès de l'API Gemini Omni Flash.

Allez sur atlascloud.ai et créez un compte gratuit.
Dans le tableau de bord, accédez à API Keys.
Cliquez sur Create new key, copiez la clé et stockez-la en toute sécurité.

Définissez la clé en tant que variable d'environnement pour ne pas l'insérer en dur dans vos scripts :

plaintext
1# macOS / Linux
2export ATLASCLOUD_API_KEY="votre_cle_api_ici"
3
4# Windows (PowerShell)
5$env:ATLASCLOUD_API_KEY="votre_cle_api_ici"

Vérifiez qu'elle est correctement définie :

plaintext
1echo $ATLASCLOUD_API_KEY

Sortie attendue :

plaintext
1votre_cle_api_ici

Attention : Ne committez jamais votre clé API dans un système de contrôle de version. Ajoutez ATLASCLOUD_API_KEY à votre .gitignore via un fichier .env si vous utilisez python-dotenv ou dotenv pour Node.js.

Étape 2 : Effectuer votre première requête API Gemini Omni Flash

Dans cette étape, vous allez soumettre une requête Text-to-Video à l'API Gemini Omni Flash et recevoir un prediction_id pour suivre le travail.

Le point de terminaison pour toute génération vidéo sur Atlas Cloud est :

plaintext
1POST https://api.atlascloud.ai/api/v1/model/generateVideo

L'identifiant du modèle pour Gemini Omni Flash Text-to-Video est :

plaintext
1google/gemini-omni-flash/text-to-video-developer

Python

plaintext
1# gemini_omni_t2v.py
2import requests
3import os
4
5API_KEY = os.environ["ATLASCLOUD_API_KEY"]
6BASE_URL = "https://api.atlascloud.ai/api/v1/model"
7
8headers = {
9    "Content-Type": "application/json",
10    "Authorization": f"Bearer {API_KEY}"
11}
12
13payload = {
14    "model": "google/gemini-omni-flash/text-to-video-developer",
15    "prompt": "Une jeune femme marche lentement dans une rue pluvieuse de Tokyo la nuit, reflets néon sur le trottoir mouillé, ralenti cinématique, éclairage réaliste, 4K, grain de film",
16    "duration": 8,          # secondes : 4, 6, 8, ou 10
17    "aspect_ratio": "16:9", # "16:9" ou "9:16"
18    "resolution": "1080p",  # "720p", "1080p", ou "4k"
19    "seed": -1              # -1 pour aléatoire ; définissez un entier pour une sortie reproductible
20}
21
22response = requests.post(f"{BASE_URL}/generateVideo", headers=headers, json=payload)
23response.raise_for_status()
24
25prediction_id = response.json()["data"]["id"]
26print(f"Travail soumis. ID de prédiction : {prediction_id}")

Node.js

plaintext
1// geminiOmniT2V.js
2const axios = require("axios");
3
4const API_KEY = process.env.ATLASCLOUD_API_KEY;
5const BASE_URL = "https://api.atlascloud.ai/api/v1/model";
6
7const headers = {
8  "Content-Type": "application/json",
9  Authorization: `Bearer ${API_KEY}`,
10};
11
12const payload = {
13  model: "google/gemini-omni-flash/text-to-video-developer",
14  prompt:
15    "Une jeune femme marche lentement dans une rue pluvieuse de Tokyo la nuit, reflets néon sur le trottoir mouillé, ralenti cinématique, éclairage réaliste, 4K, grain de film",
16  duration: 8,
17  aspect_ratio: "16:9",
18  resolution: "1080p",
19  seed: -1,
20};
21
22axios
23  .post(`${BASE_URL}/generateVideo`, payload, { headers })
24  .then((res) => {
25    const predictionId = res.data.data.id;
26    console.log(`Travail soumis. ID de prédiction : ${predictionId}`);
27  })
28  .catch((err) => console.error(err.response?.data || err.message));

Sortie attendue :

plaintext
1Travail soumis. ID de prédiction : pred_abc123xyz

Attention : L'API renvoie immédiatement un prediction_id. La vidéo n'est pas encore prête. Vous devez interroger le point de terminaison de statut à l'étape 3 pour récupérer l'URL de sortie.

Étape 3 : Interroger le résultat vidéo de Gemini Omni Flash

Dans cette étape, vous allez interroger le point de terminaison de statut à plusieurs reprises jusqu'à ce que la génération de la vidéo soit terminée et que l'URL de sortie soit disponible.

La génération vidéo avec Gemini Omni Flash est asynchrone. Le temps d'exécution typique est de 30 secondes à 3 minutes selon la résolution et la charge du serveur. Le point de terminaison de statut est :

plaintext
1GET https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}

Valeurs de statut possibles : processing, completed, succeeded, failed.

Python

plaintext
1# poll_result.py
2import requests
3import time
4import os
5
6API_KEY = os.environ["ATLASCLOUD_API_KEY"]
7BASE_URL = "https://api.atlascloud.ai/api/v1/model"
8
9headers = {
10    "Authorization": f"Bearer {API_KEY}"
11}
12
13def poll_video(prediction_id: str, timeout: int = 360) -> str:
14    """Interroger jusqu'à ce que la vidéo soit prête, puis retourner l'URL de sortie."""
15    elapsed = 0
16    while elapsed < timeout:
17        response = requests.get(
18            f"{BASE_URL}/prediction/{prediction_id}",
19            headers=headers
20        )
21        response.raise_for_status()
22        data = response.json()["data"]
23        status = data["status"]
24
25        if status in ("completed", "succeeded"):
26            video_url = data["outputs"][0]
27            print(f"Vidéo prête : {video_url}")
28            return video_url
29
30        if status == "failed":
31            raise RuntimeError(f"Échec de la génération : {data}")
32
33        print(f"Statut : {status} — attente de 3 secondes...")
34        time.sleep(3)
35        elapsed += 3
36
37    raise TimeoutError(f"La génération n'a pas abouti dans les {timeout} secondes.")
38
39# Remplacez par votre vrai prediction_id de l'étape 2
40video_url = poll_video("pred_abc123xyz")

Node.js

plaintext
1// pollResult.js
2const axios = require("axios");
3
4const API_KEY = process.env.ATLASCLOUD_API_KEY;
5const BASE_URL = "https://api.atlascloud.ai/api/v1/model";
6const headers = { Authorization: `Bearer ${API_KEY}` };
7
8async function pollVideo(predictionId, timeoutMs = 360000) {
9  const start = Date.now();
10  while (Date.now() - start < timeoutMs) {
11    const res = await axios.get(`${BASE_URL}/prediction/${predictionId}`, { headers });
12    const data = res.data.data;
13
14    if (data.status === "completed" || data.status === "succeeded") {
15      console.log("Vidéo prête :", data.outputs[0]);
16      return data.outputs[0];
17    }
18    if (data.status === "failed") throw new Error(`Échec de la génération : {JSON.stringify(data)}`);
19
20    console.log(`Statut : ${data.status} — attente de 3 secondes...`);
21    await new Promise((r) => setTimeout(r, 3000));
22  }
23  throw new Error("Délai de génération dépassé.");
24}
25
26pollVideo("pred_abc123xyz");

Sortie attendue :

plaintext
1Statut : processing — attente de 3 secondes...
2Statut : processing — attente de 3 secondes...
3Vidéo prête : https://storage.atlascloud.ai/outputs/result.mp4

Réglez votre intervalle d'interrogation sur 3 secondes plutôt que 1 seconde. Interroger chaque seconde ajoute des appels API inutiles sans réduire significativement le temps d'attente, car les travaux Gemini Omni Flash se terminent rarement en moins de 30 secondes en 1080p.

Attention : Les vidéos de sortie sont stockées sur les serveurs Atlas Cloud pendant 48 heures. Téléchargez le fichier sur votre propre stockage immédiatement après la génération si vous devez le conserver.

Étape 4 : Image-to-Video avec l'API Gemini Omni Flash

Dans cette étape, vous allez télécharger une image locale sur Atlas Cloud et l'utiliser comme référence pour la génération Image-to-Video avec l'API Gemini Omni Flash.

La génération Image-to-Video utilise le même point de terminaison mais nécessite un ID de modèle différent et un tableau images. L'identifiant du modèle est :

plaintext
1google/gemini-omni-flash/image-to-video-developer

Gemini Omni Flash Image-to-Video accepte de 1 à 7 images de référence (PNG, JPEG, JPG, ou WebP ; maximum 20 Mo chacune, minimum 128×128 px). Elle préserve l'identité visuelle à travers la vidéo générée, en maintenant la cohérence des personnages et des objets.

vidéo montrant une personne en mouvement

Étape 4a : Téléchargez votre image

plaintext
1# upload_image.py
2import requests
3import os
4
5API_KEY = os.environ["ATLASCLOUD_API_KEY"]
6UPLOAD_URL = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
7
8headers = {"Authorization": f"Bearer {API_KEY}"}
9
10with open("reference.jpg", "rb") as f:
11    response = requests.post(UPLOAD_URL, headers=headers, files={"file": f})
12
13response.raise_for_status()
14image_url = response.json()["data"]["url"]
15print(f"URL de l'image téléchargée : {image_url}")

Étape 4b : Soumettre la requête Image-to-Video

plaintext
1# gemini_omni_i2v.py
2import requests
3import os
4
5API_KEY = os.environ["ATLASCLOUD_API_KEY"]
6BASE_URL = "https://api.atlascloud.ai/api/v1/model"
7
8headers = {
9    "Content-Type": "application/json",
10    "Authorization": f"Bearer {API_KEY}"
11}
12
13payload = {
14    "model": "google/gemini-omni-flash/image-to-video-developer",
15    "prompt": "Le personnage avance lentement, éclairage naturel, profondeur de champ cinématique",
16    "images": [image_url],  # utilisez l'URL renvoyée à l'étape 4a
17    "duration": 8,
18    "aspect_ratio": "16:9",
19    "resolution": "1080p",
20    "seed": -1
21}
22
23response = requests.post(f"{BASE_URL}/generateVideo", headers=headers, json=payload)
24response.raise_for_status()
25
26prediction_id = response.json()["data"]["id"]
27print(f"Travail soumis. ID de prédiction : {prediction_id}")
28# Ensuite, interrogez en utilisant la fonction poll_video() de l'étape 3

Pour de meilleurs résultats avec Gemini Omni Flash Image-to-Video, utilisez une image de référence propre, bien éclairée, avec un arrière-plan neutre ou simple. Le modèle préserve les détails du visage et des vêtements de manière plus cohérente lorsque le sujet est clairement séparé de l'arrière-plan. Les images avec des motifs complexes ou un traitement intensif tendent à produire des résultats incohérents d'une image à l'autre.

Attention : Les formats d'image acceptés sont PNG, JPEG, JPG et WebP uniquement. Les fichiers de plus de 20 Mo seront rejetés avec une erreur 400.

Étape 5 : Changer de modèle en modifiant un seul paramètre

L'un des avantages pratiques de l'accès à l'API Gemini Omni via Atlas Cloud est que chaque modèle de génération vidéo sur la plateforme partage le même point de terminaison et la même logique d'interrogation. Passer de Gemini Omni Flash à un autre modèle ne nécessite que la modification d'un paramètre de modèle.

plaintext
1# Passer à Seedance 2.0 Text-to-Video (au prix de USD0.096/s sur Atlas Cloud)
2payload["model"] = "bytedance/seedance-2-0/text-to-video"
3
4# Passer à Veo 3.1 Lite
5payload["model"] = "google/veo-3-1/lite-text-to-video"

Cela simplifie les tests A/B entre les modèles. Vous pouvez exécuter le même prompt à travers plusieurs modèles et comparer la qualité de sortie avant de vous engager sur un modèle spécifique pour la production.

Dépannage de l'API Gemini Omni Flash

Voici les cinq problèmes les plus courants lors de l'utilisation de l'API Gemini Omni Flash et comment les résoudre.

Problème	Symptôme	Solution
401 Unauthorized	{"error": "Invalid API key"}	Vérifiez que votre variable d'environnement ATLASCLOUD_API_KEY est définie et non expirée
400 Bad Request	{"error": "Invalid prompt"}	Le prompt viole probablement la politique de contenu ; reformulez ou supprimez le contenu restreint
Tâche bloquée sur `processing`	Pas de statut completed après 6 minutes	Re-soumettez la requête ; c'est rare mais peut survenir lors de pics de charge
L'URL vidéo renvoie 404	URL plus accessible	Les fichiers de sortie expirent après 48 heures ; téléchargez-les immédiatement après la génération
429 Too Many Requests	Limite de débit dépassée	Ajoutez un délai entre les requêtes ; utilisez un repli exponentiel (exponential backoff) lors des tentatives

Toujours bloqué ? Consultez la documentation d'Atlas Cloud ou contactez le support de la plateforme.

Étapes suivantes

Maintenant que vous avez des scripts Text-to-Video et Image-to-Video fonctionnels, voici comment les étendre.

Étendre ce projet :

Ajoutez Reference-to-Video avec une entrée audio utilisant Seedance 2.0, qui prend en charge jusqu'à 7 images de référence combinées à une piste audio
Construisez un pipeline de génération par lots qui soumet plusieurs prompts en parallèle et collecte les résultats de manière asynchrone
Ajoutez un estimateur de coût à votre script : coût = 0.20 + (durée * 0.10) pour 720p/1080p

Ressources connexes :

Catalogue des modèles vidéo Atlas Cloud — tous les modèles de génération vidéo disponibles
Page tarifaire Atlas Cloud — tarification complète pour chaque modèle
Documentation de l'API Atlas Cloud — référence complète de l'API

Foire aux questions (FAQ)

Qu'est-ce que l'API Gemini Omni Flash ?

L'API Gemini Omni Flash est l'interface de génération vidéo multimodale de Google qui accepte toute combinaison de texte, d'images, d'audio et de vidéo en entrée et produit des clips vidéo cinématiques. Elle prend en charge des durées de 4 à 10 secondes, des résolutions de 720p à 4K, et des formats paysage ou portrait. Accédez-y via Atlas Cloud sans processus d'approbation Google distinct.

Combien coûte l'API Gemini Omni Flash ?

Sur Atlas Cloud, Gemini Omni Flash est facturé USD0.20 de base plus USD0.10 par seconde pour une sortie 720p et 1080p. Un clip standard de 8 secondes en 1080p coûte USD1.00. Pour une sortie 4K, les frais de base sont de USD1.00 plus USD0.10 par seconde, ce qui porte un clip 4K de 8 secondes à USD1.80. Toute la tarification se fait à l'usage, sans montant minimum requis (tarifs Atlas Cloud, 02/06/2026).

Quelle est la différence entre Google AI Studio et Atlas Cloud pour l'accès à l'API Gemini Omni Flash ?

Google AI Studio offre un accès direct aux modèles Gemini mais nécessite un compte Google et est soumis à des quotas d'utilisation individuels qui peuvent être atteints rapidement. Atlas Cloud fournit le même modèle Gemini Omni Flash via un point de terminaison d'API unifié avec une facturation transparente à la seconde, aucune file d'attente d'approbation, et un accès à plus de 300 autres modèles vidéo et image sous la même clé API. Pour une utilisation en production, l'API unifiée d'Atlas Cloud élimine le besoin de gérer des identifiants distincts par fournisseur de modèle.

Combien de temps faut-il à Gemini Omni Flash pour générer une vidéo ?

Le temps de génération typique pour une vidéo 1080p de 8 secondes est de 30 secondes à 3 minutes, selon la charge du serveur. L'API est asynchrone : votre script soumet un travail et reçoit immédiatement un prediction_id, puis interroge le point de terminaison de statut jusqu'à ce que la vidéo soit prête. Basez votre gestion des délais sur une limite supérieure de 6 minutes pour tenir compte des périodes de forte charge.

Puis-je utiliser l'API Gemini Omni Flash gratuitement ?

Atlas Cloud offre des crédits gratuits pour les nouveaux comptes, que vous pouvez appliquer à la génération Gemini Omni Flash. Une fois les crédits gratuits épuisés, la facturation est à l'usage, sans aucun abonnement requis. Inscrivez-vous sur atlascloud.ai pour commencer.

RETOUR À LA LISTE

Comment utiliser l'API Gemini Omni Flash pour la génération de vidéo (2026)

Prérequis pour l'API Gemini Omni Flash

Ce que nous allons construire avec l'API Gemini Omni

Étape 1 : Obtenir votre clé API pour Gemini Omni Flash

Étape 2 : Effectuer votre première requête API Gemini Omni Flash

Étape 3 : Interroger le résultat vidéo de Gemini Omni Flash

Étape 4 : Image-to-Video avec l'API Gemini Omni Flash

Étape 5 : Changer de modèle en modifiant un seul paramètre

Dépannage de l'API Gemini Omni Flash

Étapes suivantes

Foire aux questions (FAQ)

Qu'est-ce que l'API Gemini Omni Flash ?

Combien coûte l'API Gemini Omni Flash ?

Quelle est la différence entre Google AI Studio et Atlas Cloud pour l'accès à l'API Gemini Omni Flash ?

Combien de temps faut-il à Gemini Omni Flash pour générer une vidéo ?

Puis-je utiliser l'API Gemini Omni Flash gratuitement ?

Modèles récents

MiniMax H3 Text-to-Video

MiniMax H3 Image-to-Video

MiniMax H3 Reference-to-Video

Reve 2.1 Remix

Une seule API pour toute l'IA multimédia.