Z.ai API for Top Open-Source GLM Coding

Die Z.ai API bringt die vollständige GLM-Serie von ZhipuAI in deinen Stack – von GLM-4.6 bis zum Flaggschiff GLM-5.1, das unter den Open-Source-Modellen auf SWE-Bench Pro den ersten Platz belegt und autonome Coding-Agents stundenlang ausführt. GLM kombiniert einen Kontext von 202K Token mit ausgewogener Ausgabe auf Chinesisch und Englisch unter einer freizügigen MIT-Lizenz. Atlas Cloud stellt jedes Modell über einen OpenAI-kompatiblen Schlüssel bereit – mit Day-0-Zugriff und transparenter Preisgestaltung pro Aufruf. Starte noch heute.

Large Language Models by Z.ai

Treiben Sie Chat, Reasoning und Agenten im großen Maßstab mit führenden großen Sprachmodellen an – schnell und kostengünstig bereitgestellt auf Atlas Cloud.

Alle Modelle ansehen

LLM

GLM

GLM ist die Flaggschiff-LLM-Serie von Z.ai aus dem Hause Zhipu AI, und die GLM API reicht vom agentischen GLM-5 bis zum effizienten 357B MoE GLM-4.6. Diese Modelle sind auf autonome Aufgabenausführung, komplexe Agentenorchestrierung und Programmierung in Produktionsqualität spezialisiert. Auf Atlas Cloud erhalten Sie über einen einzigen einheitlichen Endpoint ab Tag 0 Zugriff auf die gesamte GLM-Familie – mit nutzungsbasierter Preisgestaltung und zuverlässiger Produktionsverfügbarkeit. Beginnen Sie noch heute mit dem Entwickeln.

6 ModelleErkunden Sie GLM

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

Model	Standard Price (USD)	Our Price (USD)	Discount
GLM 5.2	$1.4/$4.4per 1M tokens1048.6K context	$1.26/$3.96M in/outper 1M tokens1048.6K context	-10%	View
GLM 5.1	$1.4/$4.4per 1M tokens202.8K context	$1.26/$3.96M in/outper 1M tokens202.8K context	-10%	View
GLM 5v Turbo	$1.2/$4per 1M tokens202.8K context	$1.2/$4M in/outper 1M tokens202.8K context	—	View
GLM 5	$1/$3.2per 1M tokens202.8K context	$0.95/$3.15M in/outper 1M tokens202.8K context	—	View
GLM 4.7	$0.6/$2.2per 1M tokens202.8K context	$0.52/$1.85M in/outper 1M tokens202.8K context	—	View
GLM 4.6	$0.6/$2.2per 1M tokens202.8K context	$0.6/$2.2M in/outper 1M tokens202.8K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Z-AI API-Anwendungsfälle, die Sie auf Atlas Cloud erstellen können

Die Modellstufen von GLM decken alles ab, von schnellen zweisprachigen Chat-Aufgaben bis hin zu mehrstündigen autonomen Coding-Agenten. Teams verwenden GLM-5.1 für langfristige Ingenieursarbeiten und GLM-4.7 oder GLM-5 Turbo, wenn Kosteneffizienz und Geschwindigkeit im Vordergrund stehen.

Langfristige Datenbank-Leistungsoptimierung

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

Autonomes Code-Refactoring auf Repository-Ebene

Entwicklungsteams nutzen GLM-5.1, um vollständige Codebasis-Transformationen über mehrstündige Sitzungen hinweg ohne menschliche Checkpoints durchzuführen. Das Modell plant, schreibt, testet und iteriert Änderungen kontinuierlich für bis zu 8 Stunden und verarbeitete in einer demonstrierten Erstellung eines Linux-Systems von Grund auf 655 Iterationen. Dies ersetzt wochenlange manuelle Refactoring-Arbeit an großen, Legacy-Codebasen.

IDE-Coding-Agent-Integration

Entwicklertools-Teams integrieren GLM-5.1 und GLM-5 Turbo als zugrunde liegendes Modell für KI-Programmier-Workflows in Claude Code, Kilo Code, Cline, Roo Code und OpenCode. Die Z-AI API auf Atlas Cloud ist OpenAI-kompatibel, sodass der Austausch der base URL die einzige Änderung ist, die erforderlich ist, um eines dieser Tools über GLM zu leiten. Das 262K-Kontextfenster von GLM-5 Turbo macht es besonders geeignet für großen Dateikontext in IDE-Workflows.

Automatisierung von Tier-1-Supportanfragen

Betriebsteams entwickeln mit GLM-5 Support-Agenten, die den Zugriff auf die Ticket-Datenbank, die Suche in der Wissensdatenbank und Eskalationswerkzeuge kombinieren, um wiederkehrende Anfragen ohne menschliches Eingreifen zu bearbeiten. Die Multi-Tool-Aufrufe und die Streaming-Unterstützung des Modells machen es praktisch für Echtzeit-Einsätze mit Kundenkontakt. Durch die zweisprachige Unterstützung bearbeitet derselbe Agent chinesische und englische Tickets über einen einzigen Modell-Endpoint auf Atlas Cloud.

Zweisprachige Dokumentengenerierung in großem Maßstab

Content- und Business-Teams nutzen GLM-4.7, um aus strukturierten Prompts Word-Dokumente, PowerPoint-Präsentationen, PDFs und Excel-Berichte sowohl in Chinesisch als auch in Englisch zu erstellen. Mit 0,52 $ pro Million Input-Tokens ist es die kosteneffizienteste GLM-Stufe für hochvolumige Dokumenten-Workflows, die keine Argumentation auf Frontier-Niveau erfordern. Das Kontextfenster von 202K reicht aus, um vollständige Dokumentstrukturen und Quellmaterial in einem einzigen Aufruf zu erfassen.

Kernel-Optimierung für ML-Workloads

KI-Infrastrukturteams nutzen GLM-5.1, um Benchmark-gesteuerte Optimierungspipelines für Machine-Learning-Workloads auszuführen. Bei Aufgaben im KernelBench-Stil führt GLM-5.1 Tausende von werkzeuggesteuerten Optimierungszyklen durch und erzielt eine 3,6-fache geometrische mittlere Beschleunigung. Die 8-stündige kontinuierliche Ausführungskapazität bedeutet, dass der Agent die vollständige Optimierungsschleife ausführt, ohne dass manuelle Neustarts zwischen den Sitzungen erforderlich sind.

Verwandeln Sie Ihre Unternehmensvision mit Atlas Cloud AI in Realität.

Vertrieb kontaktieren

Was Entwickler über die Z.ai API fragen

Die Z.ai API bietet Entwicklern programmatischen Zugriff auf die GLM-Serie großer Sprachmodelle, die von Z.ai entwickelt wurden, dem Unternehmen, das auch als Zhipu AI bekannt ist. GLM steht für General Language Model und umfasst Versionen von GLM-4.6 bis zum Flaggschiff GLM-5.1, optimiert für Coding, agentische Workflows sowie den produktiven zweisprachigen Einsatz auf Chinesisch und Englisch. Auf Atlas Cloud erreichen Sie die gesamte Modellpalette über einen OpenAI-kompatiblen Endpoint.

Atlas Cloud hostet die GLM-Serie von GLM-4.6 bis zum Flaggschiff GLM-5.1, mit GLM-4.7 und GLM-5 dazwischen. Leichtere Tiers übernehmen alltägliche Aufgaben mit hohem Volumen zu geringeren Kosten, während GLM-5.1 auf die anspruchsvollsten Coding- und agentischen Aufgaben ausgerichtet ist. Jedes Modell läuft nutzungsbasiert über denselben Key.

Ja. Die offenen GLM-Gewichte, einschließlich GLM-5.1, werden unter der MIT-Lizenz veröffentlicht, die kommerzielle Nutzung, Fine-Tuning und Weiterverbreitung ohne Einschränkung erlaubt. Wenn Sie Infrastrukturaufwand lieber vermeiden möchten, stellt Atlas Cloud dieselben Modelle per API für verwalteten Zugriff bereit, statt dass Sie sie selbst hosten müssen.

Richten Sie Ihr bestehendes OpenAI SDK auf die Base URL von Atlas Cloud aus, setzen Sie Ihren Key und übergeben Sie den gewünschten GLM-Modellnamen. Da die Z.ai API OpenAI-kompatibel ist, migrieren die meisten Projekte, indem sie nur die Base URL und den Model String ändern, und die Modelle lassen sich direkt in Agent-Tools wie Claude Code, Cline und Roo Code integrieren. Legen Sie noch heute los.

Sowohl Chinesisch als auch Englisch sind für GLM erstklassig unterstützt; das Modell ist auf hohe Kompetenz in beiden Sprachen trainiert. Prompten Sie in einer der beiden Sprachen und erhalten Sie konsistent hohe Qualität zurück. Dadurch ist die Modellpalette praktisch für Teams, die chinesische und internationale Nutzer mit einem einzigen Modell bedienen möchten, statt separate Stacks zu pflegen.

GLM-4.6 bis GLM-5.1 unterstützen ein 200K token context window, genug, um große Codebases, lange Dokumente oder umfangreiche Agent-Traces in einer einzigen Anfrage zu verarbeiten. Wenn Ihr Workflow lange Ausgaben erzeugt, deckt dasselbe Fenster große Codedateien und mehrstufige Ausführungslogs ohne frühes Abschneiden ab.

GLM-5.1 führte SWE-Bench Pro im April 2026 mit einem Score von 58.4 an und gehört damit zu den stärksten Open-Source-Modellen für reales Coding. Es unterstützt außerdem kontinuierliche autonome Ausführung von bis zu acht Stunden für eine einzelne Aufgabe, mit Planung, Iteration und Lieferung in einer Schleife. Das eignet sich für langfristige Agent-Workflows in Umgebungen wie Claude Code.

Jedes GLM-Modell in der Z.ai API läuft mit transparenter nutzungsbasierter Preisgestaltung, abgerechnet pro Token ohne Abonnement oder monatliche Verpflichtung. Input- und Output-Token werden separat erfasst, und leichtere Tiers wie GLM-4.7 kosten pro Token weniger als das Flaggschiff GLM-5.1, sodass Sie die Modellwahl an Ihr Budget anpassen können. Prüfen Sie den aktuellen Preis pro Token auf der jeweiligen Model Card in Atlas Cloud.

Weitere Familien Erkunden

Seedance 2.0

Die Seedance 2.0 API bietet Ihnen Produktionszugriff auf das multimodale Videomodell von ByteDance – quadmodale Eingaben (Text, Bild, Video, Audio) und ein branchenführendes „Universal Reference“-System, das Bildkomposition, Kamerabewegungen und Charakteraktionen über verschiedene Einstellungen hinweg fixiert. Integrieren Sie Kontrolle auf Regisseur-Niveau mit nur einem API-Aufruf, einem Pauschalpreis von 0,09 $/s, sofortigem Key und ohne Warteliste – unterstützt durch branchenübliche Verfügbarkeit und Compliance für Unternehmen. Seedance 2.0 Native 4K ist ab sofort live!

Familie Anzeigen

GPT Image 2

Die GPT Image 2 API bietet Entwicklern Zugang zum neuesten Bildmodell von OpenAI, dem Nachfolger von GPT Image 1.5. Es generiert und bearbeitet Bilder mit präziser Textdarstellung über lateinische und CJK-Schriften hinweg sowie mit starker Komposition für Poster, Mockups und Infografiken. Auf Atlas Cloud erreichen Sie es über eine einzige vereinheitlichte API zusammen mit über 300 Modellen, mit kostenlosen Credits, 99,99 % Verfügbarkeit und ohne erforderliche OpenAI-Organisationsverifizierung.

Familie Anzeigen

Seedream 5.0 Pro

Die Seedream 5.0 Pro API bietet Entwicklern das steuerbare Bildbearbeitungsmodell von ByteDance auf Atlas Cloud. Sie platziert Bearbeitungen präzise mit Ankern und Koordinaten, trennt Bilder in bearbeitbare Ebenen, verschmilzt mehrere Referenzen und passt exakte Farben und Materialien an, mit mehrsprachigem Text in 2K und 3K. Auf Atlas Cloud erreichen Sie es über einen einzigen Schlüssel!

Familie Anzeigen

Gemini Omni Flash

Die Gemini Omni API bringt das multimodale Videogenerierungs- und Bearbeitungsmodell von Google DeepMind, vorgestellt auf der Google I/O 2026, in Ihren Stack. Gemini Omni verbindet die Reasoning-Engine von Gemini mit generativen Medien und akzeptiert beliebige Kombinationen aus Text, Bildern, Video und Audio, um konsistente, wissensbasierte Ergebnisse zu erzeugen. Verfeinern Sie die Resultate im natürlichen Dialog – tauschen Sie Objekte aus, schreiben Sie Szenen um und wechseln Sie den Stil, während Physik, Figuren und Kontinuität erhalten bleiben. Atlas Cloud stellt das komplette Gemini-Omni-Flash-Lineup bereit – Text-to-Video, Image-to-Video mit bis zu 7 Referenzbildern und Reference-to-Video – über eine einheitliche API mit transparenter sekundengenauer Abrechnung ab $0.112 und ohne Abo. Legen Sie noch heute los.

Familie Anzeigen

Grok Imagine

Die Grok Imagine API bietet Entwicklern die Bild-, Video- und Audiogenerierung von xAI in einer einzigen Suite. Sie erzeugt Bilder mit bis zu 2K Auflösung und mehrsprachigem Text-Rendering sowie bis zu 15 Sekunden lange Videos mit nativem, synchronisiertem Audio und referenzbasierter Bearbeitung. Auf Atlas Cloud führt ein einziger Schlüssel jeden Grok Imagine-Modus aus, sodass Sie ohne separate Einrichtung zwischen Bild, Video und Audio wechseln können, ab 0,02 $ pro Bild und 0,05 $ pro Sekunde.

Familie Anzeigen

Google

Die leistungsstärksten kreativen Modelle von Google sind alle auf Atlas Cloud verfügbar. Veo 3.1 liefert kinoreife Videogenerierung, Nano Banana 2 ermöglicht die Erstellung von High-Fidelity-Bildern und Gemini bringt multimodale Intelligenz in jeden Workflow. Greifen Sie über einen einzigen API key mit Day-0-Verfügbarkeit und Pay-as-you-go-Preisen auf die vollständige Google-Modellsuite zu.

Familie Anzeigen

Seedance 2.0 Mini

Seedance 2.0 Mini bringt die multimodale Videogenerierung von ByteDance in Workflows, bei denen Geschwindigkeit und Kosten am wichtigsten sind. Es bietet die Kernfunktionen von Seedance 2.0 bei geringerem Ressourcenverbrauch – schnellere Generierung, niedrigere Kosten pro Video und dieselbe API-Integration, die Sie bereits nutzen. Für Teams, die hochvolumige Pipelines betreiben oder Prototyping in großem Maßstab durchführen, ist Mini der praktische Standard.

Familie Anzeigen

ByteDance

Von der Generierung kinoreifer Videos bis zur Erstellung von High-Fidelity-Bildern sind die leistungsstärksten Modelle von ByteDance jetzt auf der Atlas Cloud verfügbar. Führen Sie Seedance und Seedream in großem Maßstab zu den niedrigsten Inferenzpreisen und ohne Infrastruktur-Overhead aus.

Familie Anzeigen

Alibaba

Atlas Cloud vereint das gesamte Modell-Lineup von Alibaba unter einer einzigen API: Qwen für Sprach- und Bildaufgaben sowie Wan für die Videogenerierung mit bis zu 1080p. Greifen Sie auf jedes Modell im Pay-as-you-go-Verfahren ohne Abonnements zu. Die Alibaba API ist über eine einzige Base-URL mit Ihrem bestehenden OpenAI-kompatiblen Client verfügbar.

Familie Anzeigen

OpenAI

Atlas Cloud bietet Ihnen Zugriff auf das gesamte Lineup der OpenAI API, von GPT Image 2 für die Bildgenerierung bis hin zu Sora 2 für Videos. Jedes Modell ist als Pay-as-you-go-Service ohne monatliche Verpflichtung verfügbar. Die Integration erfolgt durch den einfachen Austausch einer einzigen Basis-URL über die OpenAI-kompatible API.

Familie Anzeigen

xAI

Erstellen Sie vollständige Bild- und Videopipelines unter Verwendung der xAI API auf Atlas Cloud. Generieren Sie in 2K, bearbeiten Sie mit Referenzbildern und animieren Sie Bilder zu audiosynchronen Clips.

Familie Anzeigen

Kwaivgi

Die Kwaivgi API 15 % unter dem Standardpreis. Atlas Cloud bietet Day-0-Zugriff auf neue Kling-Releases mit nutzungsbasierter Preisgestaltung (Pay-as-you-go) und ohne Platzbeschränkungen. Ein Konto, ein Schlüssel, jedes Kling-Modell von der Standard- bis zur Master-Stufe.

Familie Anzeigen