Grok API: xAI Reasoning and Coding Models

Grok, entwickelt von xAI, ist eine Reihe großer Sprachmodelle, die auf Echtzeit-Wahrnehmung und zukunftsweisendem logischen Denken aufbauen. Grok 4.3 ist das fortschrittliche Konversationsmodell von xAI, das für natürliche Dialoge, Wissenserkundung und mehrstufiges Schlussfolgern über ein Kontextfenster von 1.000.000 Tokens hinweg optimiert ist. Grok Build 0.1 schlägt eine andere Richtung ein – es wurde speziell für die Softwareentwicklung entwickelt und konzentriert sich auf die Codegenerierung, das Debugging und das Refactoring in komplexen Entwickler-Workflows. Beide Modelle sind in der Atlas Cloud über OpenAI-kompatible API-Endpunkte verfügbar, beginnend bei 1 US-Dollar pro Million Tokens.

Erkunden Sie die Führenden Modelle

Atlas Cloud bietet Ihnen die neuesten branchenführenden kreativen Modelle.

NEW

HOT

Flagship conversational model built for real-time knowledge exploration, sharp reasoning, and highly engaging AI interactions.

LLM

Grok 4.5

Specialized coding model optimized for software development, code generation, debugging, refactoring, and developer workflows.

LLM

Grok Build 0.1

Advanced conversational AI model optimized for natural dialogue, knowledge exploration, reasoning, and interactive chat experiences.

LLM

Grok 4.3

Eingabe:$1.25/M Tokens

Ausgabe:$2.5/M Tokens

Max. Ausgabe:1000.00K

$1.25/2.5M ein/aus

NEW

Text-zu-Audio

xAI TTS v1

xAI TTS v1 is a high-fidelity text-to-speech model that converts text into natural, expressive speech with sub-second latency, supporting 20 languages and 80+ voices with fine-grained delivery control.

xAI STT v1

xAI STT v1 is a production-grade speech-to-text model that transcribes audio into accurate, formatted text. It supports 24+ languages with automatic language detection, word-level timestamps, speaker diarization, multichannel transcription, and inverse text normalization.

From

$0.002/Minute

Vergleich der Grok API-Modelle

Match each job to the right model: Grok 4.3 for reasoning across a 1M token context and Grok Build 0.1 for agentic coding, both reachable through one OpenAI-compatible key on Atlas Cloud.

Model	Type	Best For	Context	Inputs	Function Calling	Structured Outputs	Prompt Caching	Status
Grok 4.3	Flagship reasoning model	Logic, analysis, multi-step agents, long-document work	1M tokens	Text, image	Yes	Yes	Yes	Flagship, GA
Grok Build 0.1	Coding-focused model	Code generation, debugging, refactoring, coding agents	256K tokens	Text, image	Yes	Yes	Yes	Early access

Grok API Features

The Grok API brings xAI's reasoning and coding models to Atlas Cloud with a 1M token context window, always-on reasoning, function calling, structured outputs, vision input, and prompt caching, all behind one OpenAI-compatible key.

1M Token Context Window

Grok 4.3 handles up to one million tokens in a single request, enough for full contract sets, large codebases, or long multi-turn agent sessions. The wide context removes chunked retrieval and preserves cross-document reasoning that shorter models lose.

Always-On Reasoning with the Grok API

The Grok API runs Grok 4.3 with built-in step-by-step reasoning, tuned for accuracy-critical work like logic, math, and multi-step analysis. The model thinks before it answers, which lifts factual reliability and instruction following on complex prompts.

Agentic Tool Calling

Grok 4.3 is built for agents: it plans, calls functions in sequence, and adjusts on intermediate results. Native function calling lets it trigger tools and APIs mid-task, the foundation for research agents, support bots, and automation that runs without a human in the loop.

Structured Outputs and Vision with the Grok API

The Grok API returns structured JSON that matches your schema, so extracted data flows straight into downstream code. Grok 4.3 also accepts images alongside text, handling diagrams, screenshots, and UI mockups in the same call.

Coding with Grok Build 0.1

Grok Build 0.1 is xAI's coding-tuned model for code generation, debugging, and refactoring across developer workflows, with a 256K token context. It targets interactive coding agents and multi-step development tasks rather than general chat.

Prompt Caching on the Grok API

The Grok API supports prompt caching, which reuses a shared system prompt or context prefix at a lower token rate. For agentic loops that send the same instructions across many calls, this cuts repeated input cost without changing your code.

Ein einziger Build-Prompt über alle Modelle hinweg

Übergeben Sie denselben Build-Prompt an Grok und die anderen Modelle auf Atlas Cloud und beobachten Sie, wie jedes eine vollständige, ausführbare Webseite generiert, sodass Sie Programmierstil und Ausgabe direkt miteinander vergleichen können.

Prompt

Erstellen Sie eine einzige, eigenständige HTML-Datei, die ein interaktives 3D-Sonnensystem unter Verwendung von Three.js aus einem CDN zeigt. Rendern Sie die Sonne und acht kreisende Planeten mit durch Farben und Leuchten angenäherten Texturen, animierten Umlaufbahnen und einem Sternenfeld-Hintergrund. Lassen Sie den Benutzer die Kamera mit der Maus drehen und zoomen und auf einen Planeten klicken, um die Kamera sanft dorthin fliegen zu lassen und seine Statistiken anzuzeigen. Fügen Sie einen eleganten Overlay-Titel und eine Steuerung zum Beschleunigen oder Verlangsamen der Zeit hinzu. Behalten Sie alles in einer einzigen HTML-Datei mit dem Three.js-CDN-Import. Priorisieren Sie einen atemberaubenden, filmischen Look.

Grok 4.3

GLM 5

Grok Build 0.1

Prompt

Erstellen Sie eine einzelne, in sich geschlossene HTML-Datei, die ein animiertes Analyse-Dashboard darstellt. Fügen Sie ein animiertes Balkendiagramm, ein Liniendiagramm, das sich beim Laden selbst zeichnet, ein Ringdiagramm und zusammenfassende Statistikkarten, die hochzählen, hinzu. Verwenden Sie fest codierte Beispieldaten, fließende Eingangsanimationen und ein sauberes, modernes, dunkles Dashboard-Layout. Fügen Sie jedem Diagrammelement einen dezenten Hover-Tooltip hinzu. Verwenden Sie nur Inline-CSS und reines JavaScript (Vanilla JS) mit canvas oder SVG, keine externen Bibliotheken. Sorgen Sie dafür, dass es wie ein Premium-SaaS-Dashboard aussieht.

Grok 4.3

GLM 5

Grok Build 0.1

Was Sie mit der Grok LLM API auf Atlas Cloud tun können

Grok 4.3 kombiniert ein Kontextfenster von 1 Million Token mit Echtzeit-Web- und X-Suche, was es praktisch für Produktions-Workflows macht, die aktuelle Informationen in Verbindung mit tiefgreifendem logischen Denken benötigen.

Echtzeit-Pipelines für Forschung und Intelligenz

Teams, die Recherche-Tools entwickeln, nutzen die Add-ons Web Search und X Search von Grok 4.3, um Live-Daten aus dem Web und von X direkt in die Generierung einzuspeisen, ohne eine separate Abruf-Ebene zu benötigen. Dies ist nützlich für Wettbewerbsanalysen, Nachrichtenzusammenfassungen und Market-Intelligence-Workflows, bei denen die Antwort von Informationen abhängt, die nach dem Trainings-Cutoff des Modells veröffentlicht wurden. Web Search und X Search werden mit 5 $ pro 1.000 Aufrufe in der xAI API abgerechnet.

Kosteneffizientes Produktions-LLM-Backend

Entwicklungsteams, die von GPT-4.1 oder Claude Sonnet wechseln, nutzen Grok 4.3 als direkten Ersatz über den OpenAI-kompatiblen Endpoint von Atlas Cloud. Mit 1,25 $ pro Million Input-Tokens ist Grok 4.3 bei der Eingabe etwa 37 % günstiger als GPT-4.1 und 58 % günstiger als Claude Sonnet 4.6. Die Migration erfordert lediglich eine Änderung der Base URL und des API-Schlüssels im bestehenden SDK-Code.

Analyse langer Dokumente mit 1M-Kontext

Rechts-, Finanz- und Forschungsteams nutzen das 1M-Token-Kontextfenster von Grok 4.3, um vollständige Vertragssätze, Finanzberichte oder technische Dokumentationen in einem einzigen API-Aufruf zu verarbeiten. Der große Kontext macht gechunkte Retrieval-Pipelines überflüssig und bewahrt das dokumentenübergreifende Schließen, das bei Modellen mit kürzerem Kontext oft abbricht. Prompt-Caching senkt die Kosten weiter, wenn derselbe Dokumentenkontext über mehrere Analyseaufrufe hinweg wiederverwendet wird.

Multimodales Coding und Visuelle Analyse

Entwickler nutzen die Bildverständnisfähigkeiten von Grok 4.3, um Diagramme, Screenshots, UI-Mockups und Fehlerprotokolle zusammen mit Text im selben API-Aufruf zu übergeben. Dies ist nützlich für Debugging-Workflows, bei denen ein Screenshot eines Fehlers oder ein Systemarchitekturdiagramm Kontext liefert, den Text allein nicht bieten kann. Funktionsaufrufe und strukturierte Ausgaben werden im selben Aufruf unterstützt, sodass extrahierte visuelle Daten in einem Schema zurückgegeben werden können, das für die nachgelagerte Verarbeitung bereit ist.

Agentenbasierte mehrstufige Aufgabenausführung

Produktteams nutzen die agentenbasierte Optimierung von Grok 4.3, um Agenten zu entwickeln, die über mehrere Schritte hinweg planen, ausführen und iterieren, ohne dass dazwischen menschliche Prompts erforderlich sind. Das Modell ist speziell auf komplexe Aufgabenzerlegung abgestimmt – es unterteilt ein übergeordnetes Ziel in Teilaufgaben, ruft Werkzeuge nacheinander auf und passt sich basierend auf Zwischenergebnissen an. In Kombination mit Function Calling und dem Web Search Add-on deckt dies Workflows von der Recherche bis zum Ergebnis wie „Wettbewerber finden, Preise analysieren, einen Vergleichsbericht entwerfen“ in einem einzigen Agentendurchlauf ab.

In-Context-Codeausführung für die Datenanalyse

Daten- und Analyseteams verwenden Grok 4.3 mit dem Code Execution-Add-on, um Python direkt im Inferenzaufruf auszuführen, Daten zu verarbeiten und berechnete Ergebnisse zusammen mit den Schlussfolgerungen des Modells zurückzugeben. Dies beseitigt die Notwendigkeit für eine separate Code-Ausführungsumgebung beim Erstellen von Datenanalysetools oder automatisierten Reporting-Pipelines. Code Execution wird mit 5 $ pro 1.000 Aufrufe über die xAI API abgerechnet, unabhängig von den Token-Kosten.

Grok API im Vergleich

Sehen Sie, wie sich die Grok API im Vergleich zu anderen führenden LLMs auf Atlas Cloud in Bezug auf Kontext, Eingaben und Fokus schlägt, sodass Sie jede Aufgabe an das passende Modell weiterleiten können – alles mit einem einzigen Schlüssel.

Model	Provider	Context Window	Inputs	Best For
Grok 4.3	xAI	1M tokens	Text	Agentic reasoning, long-document analysis, high factual accuracy
Grok Build 0.1	xAI	256K tokens	Text	Code generation, debugging, refactoring
DeepSeek V4 Pro	DeepSeek	1M tokens	Text	Cost-efficient reasoning and agentic tool use at scale
Kimi K2.6	Moonshot	262K tokens	Text, image	Long-horizon coding agents and multimodal workflows
GLM 5.2	Z.ai	202.8K tokens	Text	Long-horizon agentic engineering and project-scale coding

So verwenden Sie Grok auf Atlas Cloud

In wenigen Minuten startklar — folgen Sie diesen einfachen Schritten, um Modelle über die Plattform von Atlas Cloud zu integrieren und bereitzustellen.

Atlas Cloud-Konto erstellen

Registrieren Sie sich auf atlascloud.ai und schließen Sie die Verifizierung ab. Neue Nutzer erhalten kostenlose Credits zum Erkunden der Plattform und Testen von Modellen.

Warum Grok auf Atlas Cloud Verwenden

Die Kombination der fortschrittlichen Grok-Modelle mit der GPU-beschleunigten Plattform von Atlas Cloud bietet unübertroffene Leistung, Skalierbarkeit und Entwicklererfahrung.

Leistung & Flexibilität

Niedrige Latenz:
GPU-optimierte Inferenz für Echtzeit-Reasoning.

Einheitliche API:
Führen Sie Grok, GPT, Gemini und DeepSeek mit einer Integration aus.

Transparente Preisgestaltung:
Vorhersehbare Token-basierte Abrechnung mit serverlosen Optionen.

Unternehmen & Skalierung

Entwicklererfahrung:
SDKs, Analysen, Fine-Tuning-Tools und Vorlagen.

Zuverlässigkeit:
99,99% Verfügbarkeit, RBAC und compliance-bereite Protokollierung.

Sicherheit & Compliance:
SOC 2 Type II, HIPAA-Ausrichtung, Datensouveränität in den USA.

Häufig gestellte Fragen zu Grok LLM

Atlas Cloud hostet Grok 4.3, das aktuelle Flaggschiff-LLM von xAI, das für 1,25 $ pro Million Input-Token verfügbar ist. Das Modell unterstützt Chat, Schlussfolgerungen, Funktionsaufrufe, strukturierte Ausgaben und Bildverständnis in einer einzigen API. Überprüfen Sie die Atlas Cloud xAI-Kollektionsseite auf weitere Grok-Versionen, sobald diese hinzugefügt werden.

Grok 4.3 unterstützt ein Kontextfenster von 1 Million Token. Dies ist groß genug, um vollständige Codebasen, umfangreiche Forschungsdokumente oder erweiterte Multi-Turn-Agenten-Sitzungen in einem einzigen Aufruf zu verarbeiten. Das Kontextlimit gilt für die Kombination aus Text- und Bildeingaben.

Ja. Die xAI API unterstützt Web Search und X Search als optionale Add-ons, die separat mit 5 $ pro 1.000 Aufrufe abgerechnet werden. Dies ermöglicht es Grok, während einer Generierung Echtzeitinformationen aus dem Web oder von X abzurufen. Greifen Sie auf diese Funktionen über den Standard-API-Endpoint zusammen mit Ihren regulären API-Aufrufen zu.

Ja. Die xAI API unterstützt Prompt-Caching, was die Kosten für Anfragen reduziert, die denselben System-Prompt oder Kontext-Präfix wiederverwenden. Zwischengespeicherte Input-Tokens werden zu einem deutlich niedrigeren Tarif abgerechnet als nicht zwischengespeicherte Tokens. Dies ist besonders nützlich für Agenten-Workflows, die über viele Aufrufe hinweg dieselben Anweisungen senden.

Ja. Grok 4.3 unterstützt multimodale Eingaben und akzeptiert Bilder zusammen mit Text im selben API-Aufruf. Sie können Bild-URLs oder base64-codierte Bilder über das standardmäßige Nachrichtenformat übergeben. Dies ermöglicht Anwendungsfälle wie visuelle Fragenbeantwortung, Dokumentenanalyse und bildgesteuerte Code-Generierung.

Ja. Grok 4.3 unterstützt Funktionsaufrufe, strukturierte Ausgaben und Streaming-Antworten. Diese Funktionen arbeiten mit dem standardmäßigen OpenAI-kompatiblen Funktionsschema, sodass bestehende Werkzeugdefinitionen aus GPT-basierten Integrationen direkt übernommen werden können. Die Codeausführung ist ebenfalls als optionales Add-on für 5 $ pro 1.000 Aufrufe verfügbar.

Prompt-Caching verwendet ein wiederholtes Kontext-Präfix, wie z. B. einen langen System-Prompt oder gemeinsame Anweisungen, bei späteren Aufrufen zu einem reduzierten Eingabe-Token-Tarif wieder. Für Chatbots und Agenten, die bei jeder Anfrage dasselbe Setup erneut senden, senkt dies die wiederholten Eingabekosten, ohne Ihren Code zu ändern. Platzieren Sie statische Inhalte am Anfang des Prompts und variable Benutzerinhalte am Ende, damit der Cache angewendet werden kann.

Ratenbegrenzungen und Nebenläufigkeit variieren je nach Kontoebene. Fügen Sie daher einen exponentiellen Backoff und einen erneuten Versuch bei einer 429-Antwort hinzu und reihen Sie Anfragen während Verkehrsspitzen in eine Warteschlange ein. Bei großen Offline-Aufträgen hält die Stapelverarbeitung Massenarbeiten von Ihren Echtzeit-Limits fern. Ein häufiger versteckter Kostenfaktor bei Skalierung ist das erneute Senden des vollständigen Gesprächsverlaufs bei jedem Aufruf. Übergeben Sie daher anstelle des gesamten Threads eine kompakte Zusammenfassung und wenden Sie sich an den Support, um die Limits mit Ihrem Wachstum zu erhöhen.

Die Grok API verwendet eine nutzungsbasierte Abrechnung (Pay-as-you-go) basierend auf der Token-Nutzung, wobei Eingabe- und Ausgabe-Tokens pro Anfrage gemessen werden und kein Abonnement erforderlich ist. Die Ausführung von Grok neben über 300 anderen Modellen auf Atlas Cloud bedeutet ein Konto und eine Rechnung anstelle separater Verträge pro Anbieter. Prompt-Caching und Stapelverarbeitung (Batch Processing) können die effektiven Kosten für repetitive oder Offline-Workloads senken.

Erstellen Sie ein Konto bei Atlas Cloud, generieren Sie einen API-Schlüssel und leiten Sie Ihren vorhandenen OpenAI-kompatiblen Client mit dem Grok-Modellnamen auf den Atlas-Endpunkt um. Senden Sie Ihre erste Anfrage für logisches Denken an Grok 4.3 oder für Programmierung an Grok Build 0.1 und skalieren Sie dann je nach Bedarf. Da derselbe Schlüssel auf über 300 Modelle zugreift, können Sie andere Modelle ohne zusätzliche Einrichtung testen.

Weitere Familien Erkunden

Seedance 2.0

Die Seedance 2.0 API bietet Ihnen Produktionszugriff auf das multimodale Videomodell von ByteDance – quadmodale Eingaben (Text, Bild, Video, Audio) und ein branchenführendes „Universal Reference“-System, das Bildkomposition, Kamerabewegungen und Charakteraktionen über verschiedene Einstellungen hinweg fixiert. Integrieren Sie Kontrolle auf Regisseur-Niveau mit nur einem API-Aufruf, einem Pauschalpreis von 0,09 $/s, sofortigem Key und ohne Warteliste – unterstützt durch branchenübliche Verfügbarkeit und Compliance für Unternehmen. Seedance 2.0 Native 4K ist ab sofort live!

Familie Anzeigen

Grok Imagine

Die Grok Imagine API bietet Entwicklern die Bild-, Video- und Audiogenerierung von xAI in einer einzigen Suite. Sie erzeugt Bilder mit bis zu 2K Auflösung und mehrsprachigem Text-Rendering sowie bis zu 15 Sekunden lange Videos mit nativem, synchronisiertem Audio und referenzbasierter Bearbeitung. Auf Atlas Cloud führt ein einziger Schlüssel jeden Grok Imagine-Modus aus, sodass Sie ohne separate Einrichtung zwischen Bild, Video und Audio wechseln können, ab 0,02 $ pro Bild und 0,05 $ pro Sekunde.

Familie Anzeigen

Gemini Omni Flash

Die Gemini Omni API bringt das multimodale Videogenerierungs- und Bearbeitungsmodell von Google DeepMind, vorgestellt auf der Google I/O 2026, in Ihren Stack. Gemini Omni verbindet die Reasoning-Engine von Gemini mit generativen Medien und akzeptiert beliebige Kombinationen aus Text, Bildern, Video und Audio, um konsistente, wissensbasierte Ergebnisse zu erzeugen. Verfeinern Sie die Resultate im natürlichen Dialog – tauschen Sie Objekte aus, schreiben Sie Szenen um und wechseln Sie den Stil, während Physik, Figuren und Kontinuität erhalten bleiben. Atlas Cloud stellt das komplette Gemini-Omni-Flash-Lineup bereit – Text-to-Video, Image-to-Video mit bis zu 7 Referenzbildern und Reference-to-Video – über eine einheitliche API mit transparenter sekundengenauer Abrechnung ab $0.112 und ohne Abo. Legen Sie noch heute los.

Familie Anzeigen

GPT Image 2

Die GPT Image 2 API bietet Entwicklern Zugang zum neuesten Bildmodell von OpenAI, dem Nachfolger von GPT Image 1.5. Es generiert und bearbeitet Bilder mit präziser Textdarstellung über lateinische und CJK-Schriften hinweg sowie mit starker Komposition für Poster, Mockups und Infografiken. Auf Atlas Cloud erreichen Sie es über eine einzige vereinheitlichte API zusammen mit über 300 Modellen, mit kostenlosen Credits, 99,99 % Verfügbarkeit und ohne erforderliche OpenAI-Organisationsverifizierung.

Familie Anzeigen

Google

Die leistungsstärksten kreativen Modelle von Google sind alle auf Atlas Cloud verfügbar. Veo 3.1 liefert kinoreife Videogenerierung, Nano Banana 2 ermöglicht die Erstellung von High-Fidelity-Bildern und Gemini bringt multimodale Intelligenz in jeden Workflow. Greifen Sie über einen einzigen API key mit Day-0-Verfügbarkeit und Pay-as-you-go-Preisen auf die vollständige Google-Modellsuite zu.

Familie Anzeigen

Seedance 2.0 Mini

Seedance 2.0 Mini bringt die multimodale Videogenerierung von ByteDance in Workflows, bei denen Geschwindigkeit und Kosten am wichtigsten sind. Es bietet die Kernfunktionen von Seedance 2.0 bei geringerem Ressourcenverbrauch – schnellere Generierung, niedrigere Kosten pro Video und dieselbe API-Integration, die Sie bereits nutzen. Für Teams, die hochvolumige Pipelines betreiben oder Prototyping in großem Maßstab durchführen, ist Mini der praktische Standard.

Familie Anzeigen

ByteDance

Von der Generierung kinoreifer Videos bis zur Erstellung von High-Fidelity-Bildern sind die leistungsstärksten Modelle von ByteDance jetzt auf der Atlas Cloud verfügbar. Führen Sie Seedance und Seedream in großem Maßstab zu den niedrigsten Inferenzpreisen und ohne Infrastruktur-Overhead aus.

Familie Anzeigen

Alibaba

Atlas Cloud vereint das gesamte Modell-Lineup von Alibaba unter einer einzigen API: Qwen für Sprach- und Bildaufgaben sowie Wan für die Videogenerierung mit bis zu 1080p. Greifen Sie auf jedes Modell im Pay-as-you-go-Verfahren ohne Abonnements zu. Die Alibaba API ist über eine einzige Base-URL mit Ihrem bestehenden OpenAI-kompatiblen Client verfügbar.

Familie Anzeigen

OpenAI

Atlas Cloud bietet Ihnen Zugriff auf das gesamte Lineup der OpenAI API, von GPT Image 2 für die Bildgenerierung bis hin zu Sora 2 für Videos. Jedes Modell ist als Pay-as-you-go-Service ohne monatliche Verpflichtung verfügbar. Die Integration erfolgt durch den einfachen Austausch einer einzigen Basis-URL über die OpenAI-kompatible API.

Familie Anzeigen

xAI

Erstellen Sie vollständige Bild- und Videopipelines unter Verwendung der xAI API auf Atlas Cloud. Generieren Sie in 2K, bearbeiten Sie mit Referenzbildern und animieren Sie Bilder zu audiosynchronen Clips.

Familie Anzeigen

Kwaivgi

Die Kwaivgi API 15 % unter dem Standardpreis. Atlas Cloud bietet Day-0-Zugriff auf neue Kling-Releases mit nutzungsbasierter Preisgestaltung (Pay-as-you-go) und ohne Platzbeschränkungen. Ein Konto, ein Schlüssel, jedes Kling-Modell von der Standard- bis zur Master-Stufe.

Familie Anzeigen

Seedream 5.0 Pro

Die Seedream 5.0 Pro API bietet Entwicklern das steuerbare Bildbearbeitungsmodell von ByteDance auf Atlas Cloud. Sie platziert Bearbeitungen präzise mit Ankern und Koordinaten, trennt Bilder in bearbeitbare Ebenen, verschmilzt mehrere Referenzen und passt exakte Farben und Materialien an, mit mehrsprachigem Text in 2K und 3K. Auf Atlas Cloud erreichen Sie es über einen einzigen Schlüssel!

Familie Anzeigen

Eine API für alle Media-KI.

Alle Modelle erkunden