Jeder populäre Coding-Agent erlaubt es, das zugrunde liegende Modell auszutauschen, aber jeder versteckt die Einstellung in einer anderen Datei, unter einem anderen Schlüsselnamen und in einem anderen URL-Format. Also geben die Leute auf und zahlen weiterhin Spitzenpreise, obwohl Heavy-User bei Agenten mit Standardmodellen etwa 13 USD pro aktivem Entwicklertag erreichen (CloudZero, 2026). Diese Seite schafft Abhilfe. Sie ist eine zentrale Referenz mit der exakten benutzerdefinierten API-Konfiguration für Claude Code, OpenClaw, Codex, OpenCode und Cursor, ergänzt durch die eine entscheidende Unterscheidung, die alle Differenzen zwischen ihnen erklärt. Setzen Sie ein Lesezeichen, denn der Wert liegt hier in den Copy-Paste-Blöcken und den Fallstricken, nicht in Fülltext. Am Ende werden Sie in der Lage sein, jeden dieser Agenten innerhalb weniger Minuten auf ein günstigeres Modell umzustellen, und Sie werden verstehen, warum sich die URL von Tool zu Tool ändert.
Die wichtigsten Erkenntnisse
- Coding-Agenten teilen sich in zwei Protokoll-Familien auf. Claude Code spricht die Anthropic-API; OpenClaw, Codex, OpenCode und Cursor sprechen die OpenAI-kompatible API.
- Der praktische Hinweis ist die URL: Die OpenAI-kompatiblen Tools benötigen ein /v1-Suffix, Claude Code nicht.
- Jede Konfiguration benötigt die gleichen drei Dinge: eine Basis-URL, einen API-Schlüssel und eine Modell-ID. Nur die Feldnamen ändern sich.
- Offene Modelle (Open-Weight) sind der Gewinn: DeepSeek V4 Flash kostet etwa 0,14 USD pro Million Input-Tokens, verglichen mit mehreren Dollar bei Frontier-Modellen (Codersera, 2026).
Warum sich ein Coding-Agent Custom-API-Cheat-Sheet auszahlt
Der Grund, sich damit zu beschäftigen, sind die Kosten, und die Ursache ist strukturell. Agenten senden bei jedem Reasoning-Schritt ihren angesammelten Kontext erneut, wodurch sie 10- bis 100-mal mehr Tokens verbrauchen als ein Chat-Fenster für dieselbe Aufgabe (LeanOps, 2026). Dieser Multiplikator ist der Grund, warum Agenten-Rechnungen explodieren, und er ist auch der Grund, warum eine Neubepreisung der Tokens – anstatt den Agenten weniger zu nutzen – die einzige Strategie ist, die wirklich funktioniert. Eine benutzerdefinierte API leitet Ihren Agenten auf ein günstigeres Backend um, ohne Ihre Arbeitsweise zu ändern. Leiten Sie Routine-Programmieraufgaben an ein offenes Modell weiter, und die Kosten pro Token sinken drastisch, oft um 70 % oder mehr, während die Qualitätslücke bei Alltagsaufgaben gering bleibt. Ein Cheat-Sheet für die benutzerdefinierte API von Coding-Agenten ist wichtig, weil die Einsparungen real sind, die Einrichtungshürde jedoch die meisten Leute abhält – und diese Hürde besteht fast ausschließlich aus der Frage: "Welche Datei, welches Feld, welche URL?"
Wie ein Eintrag im Coding-Agent Custom-API-Cheat-Sheet funktioniert
Bevor wir zu den Konfigurationen kommen, hier die eine Idee, die alles verständlich macht. Coding-Agenten fallen in zwei Protokoll-Familien, und die Zugehörigkeit zu einer Familie bestimmt das Format der Konfiguration.
Claude Code kommuniziert mit der Anthropic Messages API, liest also sein Backend aus ANTHROPIC_BASE_URL und authentifiziert sich mit einem Token im Anthropic-Stil. Alles andere in diesem Cheat-Sheet – OpenClaw, Codex, OpenCode und Cursor – spricht die OpenAI-kompatible Chat Completions API; sie benötigen daher eine baseURL, einen Schlüssel im OpenAI-Stil und erwarten den /v1-Pfad am Endpunkt. Dieses /v1-Detail ist der häufigste Grund für das stille Scheitern einer Konfiguration.
Sobald Sie diese Trennung sehen, sind alle Einträge unten die gleichen drei Werte in anderem Gewand: eine Basis-URL, ein Schlüssel und eine Modell-ID. Die Beispiele verwenden Atlas Cloud als Anbieter, da dieser beide Protokoll-Familien über einen Account bedient. Das Einzige, was sich zwischen den Tools ändert, ist die Syntax, nicht der Schlüssel, den Sie einfügen. Jeder kompatible Anbieter funktioniert genauso; ersetzen Sie einfach die Basis-URL und den Schlüssel.

Das Coding-Agent Custom-API-Cheat-Sheet, Tool für Tool
Hier ist zuerst die Schnellreferenz-Tabelle, dann der vollständige Konfigurationsblock für jedes Tool. Halten Sie Ihren API-Schlüssel bereit, bevor Sie beginnen. Auf Atlas Cloud erstellen Sie diesen, indem Sie Coding Plan als Schlüsseltyp auswählen, was ihn an das kreditbasierte Coding-Kontingent bindet.
| Tool | Konfigurationsort | Basis-URL | Protokoll |
|---|---|---|---|
| Claude Code | ~/.claude/settings.json | https://api.atlascloud.ai | Anthropic-kompatibel |
| OpenClaw | ~/.openclaw/openclaw.json oder openclaw onboard | https://api.atlascloud.ai/v1 | OpenAI-kompatibel |
| Codex | ~/.codex/config.toml + auth.json | https://api.atlascloud.ai/v1 | OpenAI-kompatibel |
| OpenCode | ~/.config/opencode/opencode.json | https://api.atlascloud.ai/v1 | OpenAI-kompatibel |
| Cursor | Einstellungen, Models, benutzerdefinierte Basis-URL | https://api.atlascloud.ai/v1 | OpenAI-kompatibel |
Claude Code
Claude Code ist der Ausreißer der Anthropic-Familie; beachten Sie, dass die Basis-URL kein /v1 enthält. Bearbeiten Sie ~/.claude/settings.json unter macOS oder Linux bzw. %USERPROFILE%.claude\settings.json unter Windows:
plaintext1{ 2 "env": { 3 "ANTHROPIC_AUTH_TOKEN": "your-atlas-api-key", 4 "ANTHROPIC_BASE_URL": "https://api.atlascloud.ai", 5 "ANTHROPIC_MODEL": "zai-org/glm-5.1", 6 "ANTHROPIC_DEFAULT_HAIKU_MODEL": "zai-org/glm-5.1", 7 "ANTHROPIC_DEFAULT_SONNET_MODEL": "zai-org/glm-5.1", 8 "CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS": "1" 9 } 10}
Indem Sie die Haiku- und Sonnet-Standardeinstellungen auf dasselbe Modell festlegen, leiten Sie auch die kleinen Hintergrundaufrufe von Claude Code an Ihr Modell weiter, anstatt an einem nicht verfügbaren Standardmodell zu scheitern.
OpenClaw
OpenClaw ist am einfachsten, da es einen Einrichtungsassistenten besitzt. Führen Sie im Terminal openclaw onboard aus, wählen Sie dann Yes, QuickStart und Custom Provider. Geben Sie die Basis-URL https://api.atlascloud.ai/v1 ein, fügen Sie Ihren Schlüssel ein, geben Sie die Modell-ID ein und wählen Sie das OpenAI-kompatible Protokoll. Wenn "Verification successful" erscheint, benennen Sie den Endpunkt, und Sie sind fertig. Was Sie wissen müssen, falls Sie ~/.openclaw/openclaw.json manuell bearbeiten: OpenClaw erfordert eine zweistufige Konfiguration. Sie definieren den Anbieter unter models.providers und müssen das Modell dann unter agents.defaults.models unter Verwendung des Schlüssels provider-name/model-name freischalten, sonst lehnt der Agent es ab (OpenClaw docs, 2026). Das Vergessen der Freischaltung ist die häufigste Ursache für den Fehler "model not allowed". Der Assistent erledigt beide Schritte für Sie, weshalb er der empfohlene Weg ist.
Codex
Codex verwendet zwei Dateien. Tragen Sie den Anbieter in ~/.codex/config.toml ein:
plaintext1model_provider = "atlas_coding_plan" 2model = "zai-org/glm-5.1" 3 4[model_providers.atlas_coding_plan] 5name = "atlascloud" 6base_url = "https://api.atlascloud.ai/v1" 7wire_api = "chat" 8requires_openai_auth = true
Tragen Sie dann den Schlüssel in ~/.codex/auth.json ein:
plaintext1{ "OPENAI_API_KEY": "your-atlas-api-key" }
Führen Sie codex in Ihrem Terminal aus, überspringen Sie den Update-Hinweis, und Sie sind verbunden.
OpenCode und Cursor
OpenCode liest ~/.config/opencode/opencode.json (unter Windows \Users\your-name.config\opencode\opencode.json):
plaintext1{ 2 "$schema": "https://opencode.ai/config.json", 3 "provider": { 4 "atlascloud": { 5 "npm": "@ai-sdk/openai-compatible", 6 "name": "atlascloud", 7 "options": { 8 "baseURL": "https://api.atlascloud.ai/v1", 9 "apiKey": "your-atlas-api-key" 10 }, 11 "models": { 12 "zai-org/glm-5.1": { "name": "glm-5.1" } 13 } 14 } 15 } 16}
Cursor hat hierfür keine Konfigurationsdatei. Öffnen Sie die Einstellungen, gehen Sie zu "Models", fügen Sie Ihre Modell-ID namentlich hinzu, setzen Sie dann die benutzerdefinierte OpenAI-Basis-URL auf https://api.atlascloud.ai/v1 und fügen Sie Ihren Schlüssel ein. Da Cursor dem OpenAI-kompatiblen Muster folgt, funktionieren dieselbe Basis-URL und derselbe Schlüssel aus den anderen Tools ohne Änderungen.
Modellauswahl: Die andere Hälfte des Cheat-Sheets
Die Anbindung des Endpunkts ist nur die halbe Miete. Das Modell, das Sie wählen, entscheidet über die Einsparungen. Das bewährte Muster: Nutzen Sie standardmäßig ein leistungsstarkes, günstiges offenes Modell für die tägliche Programmierung und halten Sie ein Frontier-Modell für besonders schwierige Reasoning-Aufgaben in Reserve. Die Fähigkeitslücke ist geringer als die Preisspanne: Auf SWE-Bench Pro erreichen führende offene Modelle Werte im hohen 70er-Bereich gegenüber etwa 91 bei den besten Frontier-Modellen (Codersera, 2026) – ein Unterschied, der bei Routineaufgaben und Refactorings kaum ins Gewicht fällt.
Bei einem kreditbasierten Anbieter hat jedes Modell einen Multiplikator, der die Token-Nutzung auf Kredite umrechnet, sodass die relativen Kosten leicht abzulesen sind:
| Modell-ID | Kontext | Input-Multiplikator | Output-Multiplikator | Ca.-Ersparnis vs. offiziell |
|---|---|---|---|---|
| deepseek-ai/deepseek-v4-flash | 1M | 0.23 | 0.46 | ~50% |
| deepseek-ai/deepseek-v3.2 | 160K | 0.42 | 0.62 | ~55% |
| minimaxai/minimax-m2.5 | 200K | 0.65 | 2.18 | ~45% |
| moonshotai/kimi-k2.6 | 262K | 1.72 | 7.26 | ~45% |
| zai-org/glm-5.1 | 200K | 2.54 | 7.99 | ~45% |
| Quelle: Credit-Regeln des Atlas Cloud Coding Plan. Credit-Kosten = Input-Tokens × Input-Multiplikator + Output-Tokens × Output-Multiplikator. | ||||
| Ein praktischer Standard: GLM-5.1 oder Kimi K2.6 für interaktives Programmieren, DeepSeek V4 Flash für Aufgaben mit hohem Volumen oder im Hintergrund, und ein Frontier-Modell nur für die seltenen Fälle, die ein offenes Modell nicht bewältigen kann. Der Wechsel erfolgt durch eine einzeilige Änderung der Modell-ID in einer der oben genannten Konfigurationen. |
Ein API-Schlüssel für alle Coding-Agenten
Beachten Sie, was die Tabelle im Cheat-Sheet implizit zeigt: Derselbe Schlüssel und dieselben Modell-IDs erscheinen in jeder Konfiguration. Das ist das eigentliche Argument für einen einheitlichen Anbieter. Wenn Sie jedes Tool an einen anderen Anbieter anbinden, erhalten Sie separate Schlüssel, separate Dashboards und separate Rechnungen und verlieren den Überblick über die Gesamtausgaben. Wenn Sie alle auf einen Anbieter leiten, bündeln Sie dies in einem Credit-Pool und haben einen zentralen Ort für Modellwechsel. Es vereinfacht auch die Budgetierung, was bei nutzungsbasierter Abrechnung oft schwierig ist. Ein Plan, der ein festes tägliches Credit-Guthaben um Mitternacht erneuert, begrenzt den Schaden durch eine außer Kontrolle geratene Agenten-Schleife, während Pay-as-you-go-Pakete gelegentliche Spitzen abfedern. Die Pläne von Atlas Cloud beginnen bei 10 USD pro Monat, ihre Pay-as-you-go-Pakete bieten 41 % Rabatt, und Upgrades während der Laufzeit werden anteilig berechnet, sodass ein Wechsel in eine höhere Stufe nur die Differenz kostet, statt eines komplett neuen Plans.
Coding-Agent Custom-API-Cheat-Sheet: Häufige Fehler
Fast jedes gescheiterte Setup lässt sich auf einen dieser Punkte zurückführen, und alle sind schnell zu beheben. Die /v1-Verwechslung. Der häufigste Fehler in diesem gesamten Cheat-Sheet. OpenAI-kompatible Tools wollen das /v1-Suffix; Claude Code nicht. Ein Verbindungsfehler bedeutet meist, dass der Pfad für die Tool-Familie falsch ist. Verwendung des falschen Schlüsseltyps. Ihr Provider-Schlüssel ist nicht Ihr Anthropic-Schlüssel und umgekehrt. Das Einfügen des falschen Schlüssels führt zu einem Authentifizierungsfehler, der komplizierter aussieht, als er ist. Überspringen der OpenClaw-Freischaltung. Das Definieren des Anbieters ist nur die halbe Miete bei OpenClaw. Wenn Sie "model not allowed" sehen, fehlt das Modell in der Liste oder der Schlüssel provider-name/model-name enthält einen Tippfehler. Hintergrundmodelle in Claude Code nicht gesetzt. Wenn Sie nur das Hauptmodell setzen, aber die Standardwerte für Haiku und Sonnet auf nicht verfügbare Modelle zeigen, schlagen die kleinen Hintergrundaufrufe fehl. Setzen Sie alle drei.
FAQ: Coding-Agent Custom-API-Cheat-Sheet
Erfordert dieses Cheat-Sheet einen Wechsel der Tools?
Nein. Der ganze Punkt ist, dass Sie den Agenten behalten, den Sie bereits verwenden – sei es Claude Code, OpenClaw, Codex, OpenCode oder Cursor. Eine benutzerdefinierte API ist eine Konfigurationsänderung, keine Migration. Ihr Arbeitsablauf bleibt identisch, während sich das Backend und die Kosten ändern.
Warum ändert sich die Basis-URL im Cheat-Sheet je nach Tool?
Aufgrund der Protokoll-Familie. Claude Code verwendet die Anthropic-API und benötigt die reine Domain, während die OpenAI-kompatiblen Tools den /v1-Pfad erwarten. Gleicher Anbieter, gleicher Schlüssel, unterschiedlicher Pfad. Dieser eine Unterschied erklärt die meisten gescheiterten Setups.
Wie viel kann man mit diesem Cheat-Sheet sparen?
Sehr viel, abhängig vom Modell. DeepSeek V4 Flash kostet etwa 0,14 USD pro Million Input-Tokens, verglichen mit mehreren Dollar bei Frontier-Modellen (Codersera, 2026). Routineaufgaben an ein offenes Modell zu leiten, senkt die Kosten pro Token oft um 70 % oder mehr, ohne dass Sie Ihre Arbeitsweise ändern müssen.
Mit welchem Modell aus dem Cheat-Sheet sollte ich beginnen?
Für interaktives Programmieren sind GLM-5.1 oder Kimi K2.6 starke, erschwingliche Standards. Für Aufgaben mit hohem Volumen oder Hintergrundjobs ist DeepSeek V4 Flash günstiger. Halten Sie ein Frontier-Modell nur für Aufgaben bereit, die ein offenes Modell wirklich nicht bewältigen kann.
Ist die Einrichtung mit diesem Cheat-Sheet umkehrbar?
Ja. Jede Konfiguration ist umkehrbar. Stellen Sie die ursprüngliche Basis-URL wieder her oder entfernen Sie den Provider-Block, und der Agent greift wieder auf seine Standardwerte zurück. Viele Entwickler behalten beide Konfigurationen bei und wechseln je nach Aufgabe.
Fazit
Der Grund, warum es sich lohnt, dieses Cheat-Sheet aufzubewahren, ist, dass das Konzept nie das Schwierige war – das Schwierige war, sich zu merken, welche Datei und welche URL jedes Tool benötigt. Sobald Sie die beiden Protokoll-Familien verstanden haben, ist jede Konfiguration dieselbe Kombination aus Basis-URL, Schlüssel und Modell-ID in unterschiedlicher Syntax. Wählen Sie ein offenes Modell, fügen Sie den richtigen Block ein, achten Sie auf die /v1-Regel, und Sie behalten den Agenten, den Sie mögen, während Sie nur einen Bruchteil der Frontier-Preise zahlen. Wenn Sie einen Schlüssel und ein Budget für alle Tools wünschen, können Sie dies über die Atlas Cloud Coding Plan Konsole einrichten und jederzeit bei Aufgabenwechseln das Modell umstellen.






