Grok API: xAI Reasoning and Coding Models

Grok, développé par xAI, est une série de grands modèles de langage construits autour d'une conscience en temps réel et d'un raisonnement de pointe. Grok 4.3 est le modèle conversationnel avancé de xAI, optimisé pour le dialogue naturel, l'exploration des connaissances et le raisonnement en plusieurs étapes sur une fenêtre de contexte de 1 000 000 de tokens. Grok Build 0.1 prend une direction différente : il est spécialement conçu pour le développement de logiciels, avec des capacités axées sur la génération de code, le débogage et la refactorisation à travers des flux de travail de développeurs complexes. Les deux modèles sont disponibles sur Atlas Cloud via des endpoints d'API compatibles avec OpenAI, à partir de 1 $ par million de tokens.

Explorez les Modèles Leaders

Atlas Cloud vous offre les derniers modèles créatifs de pointe de l'industrie.

NEW

HOT

Flagship conversational model built for real-time knowledge exploration, sharp reasoning, and highly engaging AI interactions.

LLM

Grok 4.5

Specialized coding model optimized for software development, code generation, debugging, refactoring, and developer workflows.

LLM

Grok Build 0.1

Advanced conversational AI model optimized for natural dialogue, knowledge exploration, reasoning, and interactive chat experiences.

LLM

Grok 4.3

Entrée :$1.25/M tokens

Sortie :$2.5/M tokens

Sortie Max :1000.00K

$1.25/2.5M entrée/sortie

NEW

texte-vers-audio

xAI TTS v1

xAI TTS v1 is a high-fidelity text-to-speech model that converts text into natural, expressive speech with sub-second latency, supporting 20 languages and 80+ voices with fine-grained delivery control.

xAI STT v1

xAI STT v1 is a production-grade speech-to-text model that transcribes audio into accurate, formatted text. It supports 24+ languages with automatic language detection, word-level timestamps, speaker diarization, multichannel transcription, and inverse text normalization.

From

$0.002/minute

Comparer les modèles de l'API Grok

Match each job to the right model: Grok 4.3 for reasoning across a 1M token context and Grok Build 0.1 for agentic coding, both reachable through one OpenAI-compatible key on Atlas Cloud.

Model	Type	Best For	Context	Inputs	Function Calling	Structured Outputs	Prompt Caching	Status
Grok 4.3	Flagship reasoning model	Logic, analysis, multi-step agents, long-document work	1M tokens	Text, image	Yes	Yes	Yes	Flagship, GA
Grok Build 0.1	Coding-focused model	Code generation, debugging, refactoring, coding agents	256K tokens	Text, image	Yes	Yes	Yes	Early access

Grok API Features

The Grok API brings xAI's reasoning and coding models to Atlas Cloud with a 1M token context window, always-on reasoning, function calling, structured outputs, vision input, and prompt caching, all behind one OpenAI-compatible key.

1M Token Context Window

Grok 4.3 handles up to one million tokens in a single request, enough for full contract sets, large codebases, or long multi-turn agent sessions. The wide context removes chunked retrieval and preserves cross-document reasoning that shorter models lose.

Always-On Reasoning with the Grok API

The Grok API runs Grok 4.3 with built-in step-by-step reasoning, tuned for accuracy-critical work like logic, math, and multi-step analysis. The model thinks before it answers, which lifts factual reliability and instruction following on complex prompts.

Agentic Tool Calling

Grok 4.3 is built for agents: it plans, calls functions in sequence, and adjusts on intermediate results. Native function calling lets it trigger tools and APIs mid-task, the foundation for research agents, support bots, and automation that runs without a human in the loop.

Structured Outputs and Vision with the Grok API

The Grok API returns structured JSON that matches your schema, so extracted data flows straight into downstream code. Grok 4.3 also accepts images alongside text, handling diagrams, screenshots, and UI mockups in the same call.

Coding with Grok Build 0.1

Grok Build 0.1 is xAI's coding-tuned model for code generation, debugging, and refactoring across developer workflows, with a 256K token context. It targets interactive coding agents and multi-step development tasks rather than general chat.

Prompt Caching on the Grok API

The Grok API supports prompt caching, which reuses a shared system prompt or context prefix at a lower token rate. For agentic loops that send the same instructions across many calls, this cuts repeated input cost without changing your code.

Un prompt de construction unique à travers les modèles

Soumettez le même prompt de construction à Grok et aux autres modèles sur Atlas Cloud, et observez chacun générer une page web complète et exécutable, afin de pouvoir comparer côte à côte le style de codage et le résultat final.

Prompt

Créez un seul fichier HTML autonome présentant un système solaire 3D interactivo utilisant Three.js à partir d'un CDN. Rendez le soleil et les huit planètes en orbite avec des textures approximées par des couleurs et des lueurs, des orbites animées et un fond d'étoiles. Permettez à l'utilisateur de faire pivoter et de zoomer la caméra avec la souris, et de cliquer sur une planète pour faire voler doucement la caméra vers elle et afficher ses statistiques. Incluez un titre superposé élégant et un contrôle pour accélérer ou ralentir le temps. Conservez tout dans un seul fichier HTML avec l'importation CDN de Three.js. Donnez la priorité à un rendu cinématographique époustouflant.

Grok 4.3

GLM 5

Grok Build 0.1

Prompt

Créez un seul fichier HTML autonome qui soit un tableau de bord d'analyse animé. Incluez un graphique à barres animé, un graphique linéaire qui se dessine au chargement, un graphique en anneau et des cartes de statistiques récapitulatives avec un comptage croissant. Utilisez des exemples de données codés en dur, des animations d'entrée fluides et une présentation de tableau de bord sombre, moderne et épurée. Ajoutez une subtile info-bulle au survol sur chaque élément du graphique. Utilisez uniquement du CSS en ligne et du JavaScript natif avec canvas ou SVG, sans aucune bibliothèque externe. Faites en sorte qu'il ressemble à un tableau de bord SaaS premium.

Grok 4.3

GLM 5

Grok Build 0.1

Ce que vous pouvez faire avec l'API Grok LLM sur Atlas Cloud

Grok 4.3 combine une fenêtre de contexte de 1 million de tokens avec une recherche web et sur X en temps réel, le rendant pratique pour les flux de travail de production qui nécessitent des informations actualisées ainsi qu'un raisonnement profond.

Pipelines de recherche et d'intelligence en temps réel

Les équipes développant des outils de recherche utilisent les modules complémentaires Web Search et X Search de Grok 4.3 pour extraire des données en temps réel du web et de X directement dans la génération, sans couche de récupération distincte. Cela est utile pour l'analyse concurrentielle, le résumé d'actualités et les flux de travail d'intelligence économique où la réponse dépend d'informations publiées après la date limite d'entraînement du modèle. Web Search et X Search sont facturés 5 $ pour 1 000 appels sur l'API xAI.

Backend LLM de production rentable

Les équipes d'ingénierie qui passent de GPT-4.1 ou Claude Sonnet utilisent Grok 4.3 comme un remplacement direct via le endpoint de Atlas Cloud compatible avec OpenAI. À 1,25 $ par million de tokens d'entrée, Grok 4.3 est environ 37 % moins cher que GPT-4.1 et 58 % moins cher que Claude Sonnet 4.6 en entrée. La migration ne nécessite qu'un changement de la base URL et de la clé API dans le code SDK existant.

Analyse de documents longs avec un contexte de 1M

Les équipes juridiques, financières et de recherche utilisent la fenêtre de contexte de 1 million de tokens de Grok 4.3 pour traiter des ensembles complets de contrats, des déclarations financières ou de la documentation technique en un seul appel API. Ce large contexte élimine le besoin de pipelines d'extraction fragmentés et préserve le raisonnement inter-documents que les modèles à contexte plus court brisent. La mise en cache des prompts réduit encore les coûts lorsque le même contexte de document est réutilisé lors de multiples appels d'analyse.

Codage Multimodal et Analyse Visuelle

Les développeurs utilisent la compréhension d'images de Grok 4.3 pour transmettre des diagrammes, des captures d'écran, des maquettes d'interface utilisateur et des journaux d'erreurs en même temps que du texte dans le même appel d'API. Cela s'avère utile pour les flux de travail de débogage où la capture d'écran d'une erreur ou le diagramme d'architecture d'un système fournit un contexte que le texte seul ne peut pas offrir. L'appel de fonction et les sorties structurées sont pris en charge lors du même appel, de sorte que les données visuelles extraites peuvent être renvoyées dans un schéma prêt pour un traitement en aval.

Exécution Agéntique de Tâches Multi-étapes

Les équipes produit utilisent l'optimisation agentique de Grok 4.3 pour créer des agents qui planifient, exécutent et itèrent à travers plusieurs étapes sans invite humaine entre elles. Le modèle est spécifiquement paramétré pour la décomposition de tâches complexes — divisant un objectif de haut niveau en sous-tâches, appelant des outils en séquence et s'ajustant en fonction des résultats intermédiaires. Associé à l'appel de fonctions et à l'extension Web Search, cela couvre des flux de travail allant de la recherche à la production, tels que "trouver des concurrents, analyser les prix, rédiger un rapport comparatif" en une seule exécution de l'agent.

Exécution de code en contexte pour l'analyse de données

Les équipes de données et d'analyse utilisent Grok 4.3 avec le module complémentaire Code Execution pour exécuter Python directement dans l'appel d'inférence, traiter les données et renvoyer les résultats calculés aux côtés du raisonnement du modèle. Cela élimine le besoin d'un environnement d'exécution de code séparé lors de la création d'outils d'analyse de données ou de pipelines de reporting automatisés. Code Execution est facturé 5 $ pour 1 000 appels sur la xAI API, indépendamment des coûts des tokens.

Comparatif de l'API Grok

Découvrez comment la Grok API se compare aux autres LLMs de premier plan sur Atlas Cloud en matière de contexte, d'entrées et de focalisation, afin que vous puissiez acheminer chaque tâche vers le modèle approprié, le tout sous une seule clé.

Model	Provider	Context Window	Inputs	Best For
Grok 4.3	xAI	1M tokens	Text	Agentic reasoning, long-document analysis, high factual accuracy
Grok Build 0.1	xAI	256K tokens	Text	Code generation, debugging, refactoring
DeepSeek V4 Pro	DeepSeek	1M tokens	Text	Cost-efficient reasoning and agentic tool use at scale
Kimi K2.6	Moonshot	262K tokens	Text, image	Long-horizon coding agents and multimodal workflows
GLM 5.2	Z.ai	202.8K tokens	Text	Long-horizon agentic engineering and project-scale coding

Comment utiliser Grok sur Atlas Cloud

Soyez opérationnel en quelques minutes — suivez ces étapes simples pour intégrer et déployer des modèles via la plateforme Atlas Cloud.

Créer un compte Atlas Cloud

Inscrivez-vous sur atlascloud.ai et complétez la vérification. Les nouveaux utilisateurs reçoivent des crédits gratuits pour explorer la plateforme et tester les modèles.

Pourquoi Utiliser Grok sur Atlas Cloud

Combiner les modèles Grok avancés avec la plateforme accélérée par GPU d'Atlas Cloud offre des performances, une évolutivité et une expérience développeur inégalées.

Performance et Flexibilité

Faible Latence :
Inférence optimisée par GPU pour un raisonnement en temps réel.

API Unifiée :
Exécutez Grok, GPT, Gemini et DeepSeek avec une seule intégration.

Tarification Transparente :
Facturation prévisible par token avec options serverless.

Entreprise et Échelle

Expérience Développeur :
SDK, analytiques, outils de fine-tuning et modèles.

Fiabilité :
99,99% de disponibilité, RBAC et journalisation conforme.

Sécurité et Conformité :
SOC 2 Type II, alignement HIPAA, souveraineté des données aux États-Unis.

Foire aux questions sur Grok LLM

Atlas Cloud héberge Grok 4.3, le LLM phare actuel de xAI, disponible à 1,25 $ par million de tokens en entrée. Le modèle prend en charge le chat, le raisonnement, l'appel de fonctions, les sorties structurées et la compréhension d'images dans une seule API. Consultez la page de collection xAI d'Atlas Cloud pour toute version supplémentaire de Grok au fur et à mesure de leur ajout.

Grok 4.3 prend en charge une fenêtre de contexte d'un million de tokens. C'est suffisamment grand pour traiter des bases de code complètes, de longs documents de recherche ou des sessions d'agents multi-tours prolongées en un seul appel. La limite de contexte s'applique aux entrées de texte et d'image combinées.

Oui. L'API xAI prend en charge Web Search et X Search en tant que modules complémentaires optionnels, facturés séparément à 5 $ pour 1 000 appels. Cela permet à Grok de récupérer des informations en temps réel sur le web ou sur X lors d'une génération. Accédez à ces fonctionnalités via le endpoint API standard en parallèle de vos appels API réguliers.

Oui. L'API xAI prend en charge la mise en cache des prompts, ce qui réduit le coût des requêtes qui réutilisent le même prompt système ou préfixe de contexte. Les tokens d'entrée mis en cache sont facturés à un tarif nettement inférieur à celui des tokens non mis en cache. Cela est particulièrement utile pour les flux de travail d'agents qui envoient les mêmes instructions à travers de nombreux appels.

Oui. Grok 4.3 prend en charge l'entrée multimodale, acceptant les images en plus du texte dans le même appel API. Vous pouvez transmettre des URL d'images ou des images encodées en base64 via le format de messages standard. Cela permet des cas d'utilisation tels que la réponse aux questions visuelles, l'analyse de documents et la génération de code guidée par l'image.

Oui. Grok 4.3 prend en charge l'appel de fonctions, les sorties structurées et les réponses en continu. Ces fonctionnalités fonctionnent avec le schéma de fonctions standard compatible avec OpenAI, de sorte que les définitions d'outils existantes provenant d'intégrations basées sur GPT sont directement transférables. L'exécution de code est également disponible en tant que module complémentaire optionnel au prix de 5 $ pour 1 000 appels.

La mise en cache de prompts réutilise un préfixe de contexte répété, tel qu'un long prompt système ou des instructions partagées, à un tarif de tokens d'entrée réduit lors des appels ultérieurs. Pour les chatbots et les agents qui renvoient la même configuration à chaque requête, cela réduit le coût des entrées répétées sans modifier votre code. Placez le contenu statique au début du prompt et le contenu utilisateur variable à la fin pour que le cache s'applique.

Les limites de taux et la simultanéité varient selon le niveau du compte, ajoutez donc un recul exponentiel et une nouvelle tentative lors d'une réponse 429, et mettez les requêtes en file d'attente pendant les pics de trafic. Pour les tâches hors ligne importantes, le traitement par lots permet d'éviter que le travail de masse n'affecte vos limites en temps réel. Un coût caché courant à grande échelle est le renvoi de l'historique complet de la conversation à chaque appel, transmettez donc un résumé compact au lieu du fil de discussion entier, et contactez le support pour augmenter les limites au fur et à mesure de votre croissance.

L'API Grok utilise une facturation à l'usage (pay-as-you-go) basée sur l'utilisation de tokens, les tokens d'entrée et de sortie étant mesurés par requête, sans aucun abonnement requis. Exécuter Grok aux côtés de plus de 300 autres modèles sur Atlas Cloud implique un seul compte et une seule facture, au lieu de contrats séparés par fournisseur. La mise en cache des prompts et le traitement par lots peuvent réduire le coût effectif sur les charges de travail répétitives ou hors ligne.

Créez un compte sur Atlas Cloud, générez une clé API et dirigez votre client compatible OpenAI existant vers le point de terminaison Atlas avec le nom du modèle Grok. Envoyez votre première requête à Grok 4.3 pour le raisonnement ou à Grok Build 0.1 pour le codage, puis évoluez selon vos besoins. Étant donné que la même clé permet d'accéder à plus de 300 modèles, vous pouvez tester d'autres modèles sans aucune configuration supplémentaire.

Explorer Plus de Familles

Seedance 2.0

L'API Seedance 2.0 vous donne un accès en production au modèle vidéo multimodal de ByteDance — des entrées quadrimodales (texte, image, vidéo, audio) et un système « Universal Reference » leader du secteur qui verrouille la composition, les mouvements de caméra et les actions des personnages à travers les plans. Intégrez un contrôle de niveau réalisateur avec un seul appel d'API, un tarif fixe de 0,09 $/s, une clé instantanée et aucune liste d'attente — le tout soutenu par une disponibilité et une conformité de niveau entreprise. Seedance 2.0 Native 4K est désormais disponible !

Voir la Famille

Grok Imagine

La Grok Imagine API offre aux développeurs la génération d'images, de vidéos et d'audio de xAI dans une seule suite. Elle produit des images jusqu'à 2K avec un rendu de texte multilingue, ainsi que des vidéos allant jusqu'à 15 secondes avec un audio natif synchronisé et une édition basée sur des références. Sur Atlas Cloud, une seule clé exécute chaque mode Grok Imagine, ce qui vous permet de passer d'une image, d'une vidéo et d'un audio à l'autre sans configuration distincte, à partir de 0,02 $ par image et 0,05 $ par seconde.

Voir la Famille

Gemini Omni Flash

La Gemini Omni API apporte à votre stack le modèle multimodal de génération et d'édition vidéo de Google DeepMind, présenté à Google I/O 2026. Gemini Omni fusionne le moteur de raisonnement de Gemini avec les médias génératifs : il accepte n'importe quelle combinaison de texte, d'images, de vidéo et d'audio pour produire des résultats cohérents et ancrés dans la connaissance. Affinez vos résultats par simple conversation — remplacez des objets, réécrivez des scènes, changez de style — tandis que la physique, les personnages et la continuité restent intacts. Atlas Cloud propose toute la gamme Gemini Omni Flash — texte vers vidéo, image vers vidéo avec jusqu'à 7 images de référence, et référence vers vidéo — via une API unifiée, avec une tarification transparente à la seconde à partir de $0.112 et sans abonnement. Commencez à développer dès aujourd'hui.

Voir la Famille

GPT Image 2

L'API GPT Image 2 offre aux développeurs un accès au dernier modèle d'image d'OpenAI, le successeur de GPT Image 1.5. Elle génère et modifie des images avec un rendu de texte précis pour les caractères latins et CJK, ainsi qu'une composition solide pour les affiches, les maquettes et les infographies. Sur Atlas Cloud, vous y accédez via une API unifiée aux côtés de plus de 300 modèles, avec des crédits gratuits, une disponibilité de 99,99 % et sans aucune vérification d'organisation OpenAI requise.

Voir la Famille

Google

Les modèles créatifs les plus puissants de Google sont tous disponibles sur Atlas Cloud. Veo 3.1 offre une génération de vidéos cinématographiques, Nano Banana 2 permet de créer des images haute fidélité, et Gemini apporte une intelligence multimodale à chaque flux de travail. Accédez à la suite complète de modèles Google via une seule API key avec une disponibilité Day-0 et une tarification à l'usage (pay-as-you-go).

Voir la Famille

Seedance 2.0 Mini

Seedance 2.0 Mini apporte la génération de vidéos multimodale de ByteDance aux flux de travail où la vitesse et les coûts sont primordiaux. Il offre les capacités de base de Seedance 2.0 avec une empreinte plus légère — une génération plus rapide, un coût par vidéo réduit et la même intégration API que celle que vous utilisez déjà. Pour les équipes qui gèrent des pipelines à haut volume ou du prototypage à grande échelle, Mini est le choix par défaut pratique.

Voir la Famille

ByteDance

De la génération de vidéos cinématiques à la création d'images haute fidélité, les modèles les plus puissants de ByteDance sont disponibles sur Atlas Cloud. Exécutez Seedance et Seedream à grande échelle avec les prix d'inférence les plus bas et aucune surcharge d'infrastructure.

Voir la Famille

Alibaba

Atlas Cloud rassemble l'ensemble de la gamme de modèles d'Alibaba sous une seule API : Qwen pour les tâches linguistiques et d'imagerie, et Wan pour la génération de vidéos jusqu'en 1080p. Accédez à chaque modèle avec une tarification à l'usage (pay-as-you-go) sans abonnement. L'API Alibaba est disponible via une URL de base unique en utilisant votre client existant compatible avec OpenAI.

Voir la Famille

OpenAI

Atlas Cloud vous donne accès à l'ensemble de la gamme de l'API OpenAI, de GPT Image 2 pour la génération d'images à Sora 2 pour la vidéo. Chaque modèle est disponible en paiement à l'usage sans engagement mensuel. Intégrez-le en remplaçant simplement l'URL de base à l'aide de l'API compatible OpenAI.

Voir la Famille

xAI

Créez des pipelines complets d'images et de vidéos en utilisant la xAI API sur Atlas Cloud. Générez en 2K, éditez avec des images de référence et animez des images en clips synchronisés avec l'audio.

Voir la Famille

Kwaivgi

L'API Kwaivgi à 15 % en dessous du tarif standard. Atlas Cloud offre un accès Day-0 aux nouvelles versions de Kling avec une tarification à l'usage et sans limite de postes. Un seul compte, une seule clé, tous les modèles Kling du niveau standard au niveau master.

Voir la Famille

Seedream 5.0 Pro

L'API Seedream 5.0 Pro offre aux développeurs le modèle d'édition d'images contrôlable de ByteDance sur Atlas Cloud. Elle positionne les modifications avec précision à l'aide d'ancrages et de coordonnées, sépare les images en calques modifiables, fusionne de multiples références et fait correspondre les couleurs et matériaux exacts, avec du texte multilingue en 2K et 3K. Sur Atlas Cloud, vous y accédez via une seule clé !

Voir la Famille

Une seule API pour toute l'IA multimédia.

Explorer tous les modèles