Einrichtung der Drittanbieter-API für Claude Code: Eine Schritt-für-Schritt-Anleitung für 2026

Claude Code ist eines der besten agentenbasierten Coding-Tools auf dem Markt, aber auch eines der teuersten im großflächigen Einsatz: Intensivnutzer erreichen Kosten von bis zu USD13 pro aktivem Entwicklertag auf der Standard-API (CloudZero, 2026). Das Detail, das die meisten übersehen: Das Modell, das Claude Code antreibt, ist austauschbar. Mit einer einzigen Umgebungsvariable können Sie dieselbe Claude Code-Erfahrung auf ein anderes Backend lenken, einschließlich deutlich günstigerer Open-Weight-Modelle wie GLM, Kimi und DeepSeek.

Dieser Leitfaden ist eine vollständige, schnörkellose Schritt-für-Schritt-Anleitung für das Setup einer Claude Code Third-Party-API. Sie erfahren, wie die Umleitung unter der Haube funktioniert, welche Konfiguration genau einzufügen ist, wie Sie ein Modell auswählen und wie Sie überprüfen, ob alles korrekt konfiguriert ist. Das Ganze dauert etwa fünf Minuten, und die Ersparnisse zeigen sich ab dem ersten Tag.

Wichtige Erkenntnisse

Claude Code liest sein Backend aus der Umgebungsvariable ANTHROPIC_BASE_URL aus. Jeder Anthropic-kompatible Endpunkt kann das Standard-Backend ersetzen, ohne die App selbst anzupassen (Claude Code docs, 2026).

Das Setup erfordert lediglich eine einzige Änderung an ~/.claude/settings.json; für den Basisfall ist kein Proxy oder Wrapper-Skript erforderlich.

Open-Weight-Modelle senken die Kosten pro Token massiv: DeepSeek V4 Flash kostet etwa USD0,14 pro Million Input-Token im Vergleich zu mehreren Dollar bei Frontier-Modellen (Codersera, 2026).

Die Nutzung eines Gateways, das viele Modelle hinter einem einzigen Endpunkt aggregiert, bedeutet, dass Sie Modelle durch Ändern einer einzigen Zeile austauschen können, statt Schlüssel bei fünf verschiedenen Anbietern registrieren zu müssen.

Warum ein Claude Code Third-Party-API-Setup?

Die ehrliche Antwort lautet: Kosten. Und die Zahlen sind nicht zu unterschätzen. Agenten-Tools wie Claude Code senden bei jedem Schritt des Schlussfolgerungsprozesses den gesamten akkumulierten Kontext erneut mit und verbrauchen daher für die gleiche Menge an Arbeit 10- bis 100-mal mehr Token als ein Chat-Fenster (LeanOps, 2026). Genau dieser Token-Multiplikator ist der Grund, warum eine einzige komplexe Aufgabe unbemerkt Dollarbeträge verschlingen kann und warum Teams monatliche Rechnungen in dreistelliger Höhe pro Entwickler sehen.

Ein Claude Code Third-Party-API-Setup setzt genau an der Quelle der Kosten an: dem Preis pro Token. Anstatt für jede Code-Anpassung, jedes Refactoring und jeden Testlauf Frontier-Preise zu zahlen, leiten Sie den Großteil dieser Arbeit an ein Open-Weight-Modell um, das nur einen Bruchteil kostet. Bei Routine-Coding-Aufgaben ist die Qualitätslücke bei weitem nicht so groß wie die Preisdifferenz. Das Ziel dieses Setups ist nicht, auf Claude Code zu verzichten, sondern das Tool beizubehalten und für die Token Preise offener Modelle zu zahlen.

Es gibt einen zweiten Grund, der für alle außerhalb der direkt von Anthropic bedienten Regionen wichtig ist: Zugang. Ein Third-Party-Endpunkt bietet Entwicklern einen stabilen, kompatiblen Weg, Claude Code zu nutzen, ohne von der Abrechnung oder Verfügbarkeit eines einzelnen Anbieters abhängig zu sein.

Wie ein Claude Code Third-Party-API-Setup funktioniert

Bevor Sie Konfigurationen einfügen, ist es hilfreich, den Mechanismus zu verstehen, der dies ermöglicht. Claude Code hat die Anthropic-Server nicht fest einprogrammiert. Beim Start liest es eine Handvoll Umgebungsvariablen, wobei ANTHROPIC_BASE_URL die wichtigste ist. Standardmäßig verweist sie auf die Anthropic-API. Ändern Sie diese, und jede Anfrage, die Claude Code stellt, geht stattdessen an die neue Adresse (Claude Code docs, 2026).

Damit das funktioniert, muss der Third-Party-Endpunkt das gleiche Protokoll sprechen, das Claude Code erwartet: das Anthropic Messages API-Format. Deshalb können Sie ihn nicht direkt auf einen rohen OpenAI-Endpunkt richten. Der Anbieter muss eine Anthropic-kompatible URL bereitstellen. Viele Modellanbieter veröffentlichen mittlerweile genau solche Endpunkte, und Gateways, die mehrere offene Modelle aggregieren, übernehmen die Übersetzung für Sie, sodass GLM, Kimi oder DeepSeek in dem Format antworten, das Claude Code versteht.

Die drei entscheidenden Variablen sind:

ANTHROPIC_BASE_URL: Wohin Claude Code Anfragen sendet.
ANTHROPIC_AUTH_TOKEN: Der API-Schlüssel für diesen Endpunkt, nicht Ihr Anthropic-Schlüssel.
ANTHROPIC_MODEL: Welches Modell der Endpunkt ausführen soll.

Sobald Sie verinnerlicht haben, dass die App lediglich ein Client ist, der auf eine URL zeigt, ist der Rest des Setups rein mechanisch.

Claude Code Third-Party-API-Setup: Schritt für Schritt

Dies ist der Kern des Leitfadens. Das folgende Beispiel nutzt Atlas Cloud als Anbieter, da dieser einen Anthropic-kompatiblen Endpunkt bereitstellt, der die wichtigsten Open-Weight-Modelle bündelt. Das hält die Konfiguration kurz und ermöglicht es Ihnen, später Modelle zu wechseln, ohne den Prozess wiederholen zu müssen. Dieselben Schritte gelten für jeden kompatiblen Anbieter; nur die Basis-URL und der Schlüssel ändern sich.

Schritt 1: API-Schlüssel und Basis-URL abrufen

Am Ende dieses Schritts haben Sie zwei Strings: eine Endpunkt-URL und einen Schlüssel.

Erstellen Sie ein Konto bei Ihrem Wunschanbieter und öffnen Sie den Bereich für API-Schlüssel.
Generieren Sie einen Schlüssel mit Berechtigung für Coding- oder Agenten-Nutzung. Bei Atlas Cloud wählen Sie beim Erstellen als Schlüsseltyp Coding Plan, was den Schlüssel an das guthabenbasierte Coding-Kontingent bindet statt an das allgemeine Pay-as-you-go.
Kopieren Sie den Schlüssel an einen sicheren Ort und notieren Sie die Basis-URL. Speziell für Claude Code verwendet Atlas Cloud https://api.atlascloud.ai (Hinweis: kein /v1-Suffix für den Claude Code-Endpunkt, was häufig eine Fehlerquelle ist).

Schritt 2: settings.json bearbeiten

Nach diesem Schritt ist Claude Code auf das neue Backend ausgerichtet. Öffnen Sie die Konfigurationsdatei für Ihr Betriebssystem:

macOS / Linux: ~/.claude/settings.json
Windows: %USERPROFILE%\.claude\settings.json

Fügen Sie Folgendes ein und ersetzen Sie das Token durch Ihren echten Schlüssel:

plaintext
1{
2  "env": {
3    "ANTHROPIC_AUTH_TOKEN": "your-atlas-api-key",
4    "ANTHROPIC_BASE_URL": "https://api.atlascloud.ai",
5    "ANTHROPIC_MODEL": "zai-org/glm-5.1",
6    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "zai-org/glm-5.1",
7    "ANTHROPIC_DEFAULT_SONNET_MODEL": "zai-org/glm-5.1",
8    "CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS": "1"
9  }
10}

Ein Detail, das viel Verwirrung vermeidet: Wenn Sie ANTHROPIC_DEFAULT_HAIKU_MODEL und ANTHROPIC_DEFAULT_SONNET_MODEL auf dasselbe Modell setzen, werden auch die Hintergrundaufgaben von Claude Code (die kleinen, schnellen Anfragen, etwa zum Zusammenfassen) auf Ihr gewähltes Modell geleitet, anstatt bei einem nicht verfügbaren Standard-Modell lautlos zu scheitern.

Schritt 3: Das passende Modell für die Aufgabe wählen

Am Ende dieses Schritts haben Sie ein sinnvolles Standardmodell. Der Wert für ANTHROPIC_MODEL ist lediglich eine Modell-ID, die der Anbieter erkennt. Bei einem aggregierenden Endpunkt ist ein Wechsel eine Änderung in einer Zeile: Setzen Sie es heute auf zai-org/glm-5.1, morgen auf moonshotai/kimi-k2.6 oder für volumenstarke Hintergrundarbeit auf deepseek-ai/deepseek-v4-flash und starten Sie Claude Code neu. Keine neuen Schlüssel, keine neuen Konfigurationsblöcke.

Schritt 4: Claude Code Third-Party-API-Setup verifizieren

Nach diesem Schritt wissen Sie, dass es funktioniert. Öffnen Sie ein Terminal in einem beliebigen Projekt und führen Sie aus:

plaintext
1claude

Geben Sie ihm eine triviale Aufgabe, etwa eine Datei zu erklären oder eine einzeilige Funktion zu schreiben. Wenn die Antwort normal erfolgt, ist die Umleitung aktiv und Ihre Anfragen gehen an das Third-Party-Modell. Wenn Sie einen Authentifizierungsfehler erhalten, ist der Schlüssel falsch oder enthält ein überflüssiges Leerzeichen. Bei einem Verbindungsfehler prüfen Sie erneut die Basis-URL, insbesondere das Vorhandensein oder Fehlen des /v1-Suffixes für Ihr spezifisches Tool.

Modellauswahl für Ihr Claude Code Third-Party-API-Setup

Bei der Wahl des Modells entscheiden sich die tatsächlichen Einsparungen. Das kluge Muster ist, für die alltägliche Arbeit standardmäßig ein starkes, günstiges offenes Modell zu nutzen und ein teureres Modell nur für die schwierigsten Schlussfolgerungen zu reservieren. Die Leistungsfähigkeit ist absolut vorhanden: Auf dem SWE-Bench Pro erreichen führende offene Modelle Werte im hohen 70er-Bereich, verglichen mit etwa 91 für Top-Frontier-Modelle (Codersera, 2026) – eine echte Lücke bei den schwierigsten Problemen, aber eine nahezu irrelevante bei routinemäßiger Feature-Arbeit und Refactorings.

Bei einem guthabenbasierten Gateway hat jedes Modell einen Multiplikator, der die Token-Nutzung in Credits umrechnet, sodass Sie die relativen Kosten auf einen Blick sehen können. Hier ist ein Vergleich einiger beliebter Coding-Modelle:

Modell-ID	Kontext	Input-Multiplikator	Output-Multiplikator	Ca.-Ersparnis vs. offiziell
deepseek-ai/deepseek-v4-flash	1M	0.23	0.46	~50%
deepseek-ai/deepseek-v3.2	160K	0.42	0.62	~55%
minimaxai/minimax-m2.5	200K	0.65	2.18	~45%
moonshotai/kimi-k2.6	262K	1.72	7.26	~45%
zai-org/glm-5.1	200K	2.54	7.99	~45%

Quelle: Credit-Regeln des Atlas Cloud Coding Plans. Credit-Kosten = Input-Token × Input-Multiplikator + Output-Token × Output-Multiplikator.

Ein praktischer Standard für die meisten Entwickler: Nutzen Sie GLM-5.1 oder Kimi K2.6 für interaktives Coding, greifen Sie für Massen- oder Hintergrundjobs auf DeepSeek V4 Flash zurück und reservieren Sie ein Frontier-Modell nur für die gelegentliche Aufgabe, an der das offene Modell tatsächlich scheitert.

Ein Setup, viele Tools: Über Claude Code hinaus

Derselbe Endpunkt, der Ihr Claude Code Third-Party-API-Setup antreibt, ist nicht auf Claude Code beschränkt. Die meisten Entwickler nutzen mehr als einen Agenten: Codex im Terminal, Cursor im Editor, OpenClaw oder OpenCode nebenbei. Jeden auf einen anderen Anbieter auszurichten, bedeutet, separate Schlüssel und Rechnungen jonglieren zu müssen. Sie alle auf eine einzige OpenAI-kompatible Basis-URL auszurichten, fasst dies in einem Credit-Pool zusammen – mit einem einzigen Ort, um Modelle zu tauschen.

Für Codex liegt das Äquivalent zur Claude Code-Konfiguration in ~/.codex/config.toml:

plaintext
1model_provider = "atlas_coding_plan"
2model = "zai-org/glm-5.1"
3
4[model_providers.atlas_coding_plan]
5name = "atlascloud"
6base_url = "https://api.atlascloud.ai/v1"
7wire_api = "chat"
8requires_openai_auth = true

Ihr Schlüssel gehört in ~/.codex/auth.json als OPENAI_API_KEY. OpenClaw, OpenCode, Cursor und Copilot-ähnliche Clients verwenden alle dieselbe Basis-URL https://api.atlascloud.ai/v1 mit dem OpenAI-kompatiblen Protokoll. Beachten Sie den wichtigen Unterschied: Claude Code nutzt die nackte URL https://api.atlascloud.ai, während die OpenAI-kompatiblen Tools den Pfad /v1 benötigen.

Eine solche Konsolidierung hilft auch bei der Budgetierung. Pläne, die ein tägliches Guthaben um Mitternacht erneuern, setzen eine strukturelle Obergrenze für eine außer Kontrolle geratene Agenten-Schleife, und Pay-as-you-go-Pakete fangen gelegentliche Spitzen ab. Wenn Sie ein Tier vor Ablauf des Zeitraums überschreiten, werden anteilige Upgrades nur als Differenz berechnet, anstatt einen komplett neuen Plan zu kaufen.

Häufige Fehler beim Claude Code Third-Party-API-Setup vermeiden

Die meisten fehlgeschlagenen Setups lassen sich auf eine Handvoll Fehler zurückführen, und fast alle liegen eher an der Konfigurationszeichenfolge als an tiefer liegenden Problemen.

Falscher Basis-URL-Pfad. Der häufigste Fehler überhaupt. Claude Code und die OpenAI-kompatiblen Tools erwarten vom selben Anbieter oft unterschiedliche Pfade. Wenn Claude Code einen Verbindungsfehler ausgibt, prüfen Sie, ob Ihr Endpunkt das /v1-Suffix benötigt oder nicht.

Versehentliche Verwendung Ihres Anthropic-Schlüssels. Das ANTHROPIC_AUTH_TOKEN muss der Schlüssel des Third-Party-Anbieters sein, nicht Ihr Anthropic-Schlüssel. Sie sind nicht austauschbar, und die Verwendung des falschen Schlüssels erzeugt einen Authentifizierungsfehler, der mysteriöser aussieht, als er ist.

Vergessen der Variablen für Hintergrundmodelle. Wenn Sie nur ANTHROPIC_MODEL setzen, aber die Standardwerte für Haiku und Sonnet auf nicht verfügbare Anthropic-Modelle zeigen lassen, können die kleinen Hintergrundanfragen von Claude Code fehlschlagen. Setzen Sie alle drei auf ein Modell, das Ihr Endpunkt tatsächlich bereitstellt.

Annahme, dass jedes Feature perfekt portiert wird. Offene Modelle bewältigen die Kern-Coding-Schleife gut, aber anbieterspezifische Extras und neueste modellspezifische Verhaltensweisen können vom Anthropic-Standard abweichen. Starten Sie mit einer Routineaufgabe, um die Grundlagen zu bestätigen, bevor Sie dem Modell kritische Aufgaben anvertrauen.

Häufig gestellte Fragen zum Claude Code Third-Party-API-Setup

Ist ein Claude Code Third-Party-API-Setup schwierig umzusetzen?

Nein. Der Basisfall ist eine einzige Bearbeitung der ~/.claude/settings.json mit drei oder vier Umgebungsvariablen; das Ganze dauert etwa fünf Minuten. Sie benötigen kein Proxy- oder Wrapper-Skript, es sei denn, Sie möchten während einer Sitzung Modelle wechseln, was eher eine fortgeschrittene Option als eine Voraussetzung ist.

Wie viel kann ein Claude Code Third-Party-API-Setup tatsächlich einsparen?

Es hängt vom gewählten Modell ab, aber die Preisspanne ist groß. DeepSeek V4 Flash kostet etwa USD0,14 pro Million Input-Token im Vergleich zu mehreren Dollar für Frontier-Modelle (Codersera, 2026). Die Umleitung der Routinearbeit auf ein offenes Modell senkt die Token-Rechnung oft um 70 % oder mehr, ohne dass Sie Ihre Coding-Weise ändern müssen.

Welches Modell sollte ich nach dem Setup verwenden?

Für interaktives Coding ist ein starkes allgemeines Modell wie GLM-5.1 oder Kimi K2.6 ein guter Standard. Für volumenstarke oder Hintergrundaufgaben, bei denen Latenz weniger wichtig ist, ergibt ein günstigeres Modell wie DeepSeek V4 Flash Sinn. Behalten Sie ein Frontier-Modell nur für die gelegentliche Aufgabe in Reserve, die ein offenes Modell nicht lösen kann.

Funktionieren nach dem Setup alle Features?

Die agentenbasierte Coding-Kernschleife funktioniert gut, da sie auf der Standard-Messages-API basiert, die kompatible Endpunkte implementieren. Einige anbieterspezifische Funktionen oder neueste modellspezifische Verhaltensweisen können vom Standard abweichen, daher lohnt es sich, das Setup zuerst mit einer unkritischen Aufgabe zu testen.

Muss ich das Setup rückgängig machen, um zu Anthropic zurückzukehren?

Nein. Halten Sie Ihren Anthropic-Schlüssel bereit und stellen Sie einfach die ursprüngliche ANTHROPIC_BASE_URL wieder her (oder entfernen Sie die Überschreibung) in der settings.json, um Claude Code wieder auf Anthropic zu lenken. Viele Entwickler behalten beide Konfigurationen bei und wechseln je nach Aufgabe.

Fazit

Ein Claude Code Third-Party-API-Setup ist eine der effizientesten Fünf-Minuten-Änderungen, die ein Entwickler im Jahr 2026 vornehmen kann. Das Tool bleibt exakt dasselbe, aber das Backend – und damit die Rechnung – nicht mehr. Richten Sie ANTHROPIC_BASE_URL auf einen Anthropic-kompatiblen Endpunkt aus, wählen Sie ein Open-Weight-Modell für die anstehende Arbeit, und Sie behalten Ihren gewohnten Claude Code-Workflow bei, zahlen aber nur einen Bruchteil der Frontier-Preise. Wenn Sie alles unter einem Schlüssel und einem Budget haben möchten, das auch Codex, OpenClaw und den Rest abdeckt, können Sie dies über die Atlas Cloud Coding Plan-Konsole einrichten und jederzeit durch Ändern einer einzigen Zeile zwischen Modellen wechseln.

ZURÜCK ZUR LISTE

Claude Code Third-Party-API-Einrichtung: Führen Sie GLM, Kimi und DeepSeek zu einem Bruchteil der Kosten aus