Z.ai API for Top Open-Source GLM Coding

L’API Z.ai apporte toute la série GLM de ZhipuAI à votre stack, de GLM-4.6 au modèle phare GLM-5.1, qui se classe premier parmi les modèles open source sur SWE-Bench Pro et exécute des agents de codage autonomes pendant des heures d’affilée. GLM associe un contexte de 202K tokens à une génération équilibrée en chinois et en anglais, sous une licence MIT permissive. Atlas Cloud sert chaque modèle via une seule clé compatible OpenAI, avec un accès Day-0 et une tarification transparente à l’appel. Commencez dès aujourd’hui.

Large Language Models by Z.ai

Propulsez le chat, le raisonnement et les agents à grande échelle avec les meilleurs grands modèles de langage, servis rapidement et à moindre coût sur Atlas Cloud.

Voir tous les modèles

LLM

GLM

GLM est la série LLM phare de Z.ai, développée par Zhipu AI, et l’API GLM couvre toute la gamme, du modèle agentique GLM-5 au modèle MoE 357B efficace GLM-4.6. Ces modèles sont spécialisés dans l’exécution autonome de tâches, l’orchestration complexe d’agents et la programmation de niveau production. Sur Atlas Cloud, un endpoint unifié unique vous donne accès dès le Day-0 à toute la famille GLM, avec une tarification à l’usage et une disponibilité fiable en production. Commencez à développer dès aujourd’hui.

6 modèlesExplorer GLM

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

Model	Standard Price (USD)	Our Price (USD)	Discount
GLM 5.2	$1.4/$4.4per 1M tokens1048.6K context	$1.26/$3.96M in/outper 1M tokens1048.6K context	-10%	View
GLM 5.1	$1.4/$4.4per 1M tokens202.8K context	$1.26/$3.96M in/outper 1M tokens202.8K context	-10%	View
GLM 5v Turbo	$1.2/$4per 1M tokens202.8K context	$1.2/$4M in/outper 1M tokens202.8K context	—	View
GLM 5	$1/$3.2per 1M tokens202.8K context	$0.95/$3.15M in/outper 1M tokens202.8K context	—	View
GLM 4.7	$0.6/$2.2per 1M tokens202.8K context	$0.52/$1.85M in/outper 1M tokens202.8K context	—	View
GLM 4.6	$0.6/$2.2per 1M tokens202.8K context	$0.6/$2.2M in/outper 1M tokens202.8K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Cas d'usage de la Z-AI API que vous pouvez développer sur Atlas Cloud

Les niveaux de modèles de GLM couvrent tout, des tâches de chat bilingue rapides aux agents de codage autonomes de plusieurs heures. Les équipes utilisent GLM-5.1 pour les travaux d'ingénierie à long terme et GLM-4.7 ou GLM-5 Turbo lorsque la rentabilité et la vitesse sont prioritaires.

Optimisation des performances de la base de données à long terme

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

Refactorisation Autonome de Code à l'Échelle du Dépôt

Les équipes de développement utilisent GLM-5.1 pour exécuter des transformations complètes de bases de code lors de sessions de plusieurs heures sans points de contrôle humains. Le modèle planifie, écrit, teste et itère les modifications en continu jusqu'à 8 heures, gérant 655 itérations dans une démonstration de construction d'un système Linux à partir de zéro. Cela remplace des semaines de travail de refactorisation manuelle sur de vastes bases de code héritées.

Intégration de l'Agent de Codage IDE

Les équipes d'outils pour développeurs intègrent GLM-5.1 et GLM-5 Turbo comme modèle sous-jacent pour les flux de travail de codage IA dans Claude Code, Kilo Code, Cline, Roo Code et OpenCode. La Z-AI API sur Atlas Cloud est compatible avec OpenAI, le changement de la base URL est donc la seule modification requise pour acheminer l'un de ces outils via GLM. La fenêtre de contexte de 262K de GLM-5 Turbo le rend particulièrement adapté au contexte de fichiers volumineux dans les flux de travail des IDE.

Automatisation des Requêtes de Support de Niveau 1

Les équipes d'exploitation créent des agents de support à l'aide de GLM-5 qui combinent l'accès à la base de données de tickets, la recherche dans la base de connaissances et les outils d'escalade pour traiter les requêtes répétitives sans intervention humaine. La capacité d'appel multi-outils et la prise en charge du streaming du modèle le rendent pratique pour les déploiements en temps réel orientés client. Le support bilingue signifie que le même agent traite les tickets en chinois et en anglais à partir d'un seul point de terminaison de modèle sur Atlas Cloud.

Génération de documents bilingues à grande échelle

Les équipes de contenu et commerciales utilisent GLM-4.7 pour générer des documents Word, des présentations PowerPoint, des PDF et des rapports Excel en chinois et en anglais à partir de prompts structurés. À 0,52 $ par million de tokens d'entrée, il s'agit du niveau GLM le plus rentable pour les flux de travail documentaires à volume élevé qui ne nécessitent pas de raisonnement de niveau frontière. La fenêtre de contexte de 202K est suffisante pour contenir des plans de documents complets et des documents sources en un seul appel.

Optimisation du noyau pour les charges de travail ML

Les équipes d'infrastructure d'IA utilisent GLM-5.1 pour exécuter des pipelines d'optimisation axés sur des benchmarks sur des charges de travail d'apprentissage automatique. Sur des tâches de style KernelBench, GLM-5.1 effectue des milliers de cycles d'optimisation pilotés par des outils et atteint une accélération moyenne géométrique de 3,6x. La capacité d'exécution continue de 8 heures signifie que l'agent exécute la boucle d'optimisation complète sans nécessiter de redémarrages manuels entre les sessions.

Concrétisez la vision de votre entreprise avec Atlas Cloud AI.

Contacter les ventes

Ce que les développeurs demandent à propos de l’API Z.ai

L’API Z.ai donne aux développeurs un accès programmatique à la série GLM de grands modèles de langage conçus par Z.ai, l’entreprise également connue sous le nom de Zhipu AI. GLM signifie General Language Model et couvre les versions allant de GLM-4.6 au modèle phare GLM-5.1, optimisées pour le code, les workflows agentiques et les usages en production bilingues chinois et anglais. Sur Atlas Cloud, vous accédez à toute la gamme via un seul endpoint compatible OpenAI.

Atlas Cloud héberge la série GLM, de GLM-4.6 jusqu’au modèle phare GLM-5.1, avec GLM-4.7 et GLM-5 entre les deux. Les niveaux plus légers prennent en charge les tâches quotidiennes à fort volume à moindre coût, tandis que GLM-5.1 cible les travaux de code et agentiques les plus exigeants. Chaque modèle fonctionne en paiement à l’usage avec la même clé.

Oui. Les poids ouverts de GLM, y compris GLM-5.1, sont publiés sous licence MIT, ce qui autorise l’utilisation commerciale, le fine-tuning et la redistribution sans restriction. Si vous préférez éviter la charge liée à l’infrastructure, Atlas Cloud sert les mêmes modèles par API pour un accès managé plutôt qu’en auto-hébergement.

Pointez votre SDK OpenAI existant vers l’URL de base d’Atlas Cloud, configurez votre clé et indiquez le nom du modèle GLM souhaité. Comme l’API Z.ai est compatible OpenAI, la plupart des projets migrent en ne modifiant que l’URL de base et la chaîne du modèle, et les modèles s’intègrent directement aux outils d’agents tels que Claude Code, Cline et Roo Code. Commencez à développer dès aujourd’hui.

Le chinois comme l’anglais sont des langues de premier plan pour GLM, qui est entraîné pour offrir une forte maîtrise de chacune. Vous pouvez rédiger vos prompts dans l’une ou l’autre langue et obtenir une qualité constante, ce qui rend la gamme pratique pour les équipes servant à la fois des utilisateurs chinois et internationaux avec un seul modèle, plutôt que de maintenir des piles séparées.

De GLM-4.6 à GLM-5.1, les modèles prennent en charge une fenêtre de contexte de 200K tokens, suffisante pour contenir de grandes bases de code, de longs documents ou des traces d’agents étendues dans une seule requête. Si votre workflow produit de longues sorties, la même fenêtre couvre les gros fichiers de code et les journaux d’exécution en plusieurs étapes sans troncature prématurée.

GLM-5.1 est arrivé en tête de SWE-Bench Pro avec un score de 58.4 en avril 2026, ce qui le place parmi les modèles open source les plus performants pour le code en conditions réelles. Il prend également en charge une exécution autonome continue jusqu’à huit heures sur une seule tâche, en enchaînant planification, itération et livraison dans une même boucle, ce qui convient aux workflows agentiques à horizon long dans des environnements comme Claude Code.

Chaque modèle GLM sur l’API Z.ai fonctionne avec une tarification transparente en paiement à l’usage, facturée par token, sans abonnement ni engagement mensuel. Les tokens d’entrée et de sortie sont mesurés séparément, et les niveaux plus légers comme GLM-4.7 coûtent moins cher par token que le modèle phare GLM-5.1, ce qui vous permet d’adapter le choix du modèle à votre budget. Consultez le tarif actuel par token sur la fiche de chaque modèle dans Atlas Cloud.

Explorer Plus de Familles

Seedance 2.0

L'API Seedance 2.0 vous donne un accès en production au modèle vidéo multimodal de ByteDance — des entrées quadrimodales (texte, image, vidéo, audio) et un système « Universal Reference » leader du secteur qui verrouille la composition, les mouvements de caméra et les actions des personnages à travers les plans. Intégrez un contrôle de niveau réalisateur avec un seul appel d'API, un tarif fixe de 0,09 $/s, une clé instantanée et aucune liste d'attente — le tout soutenu par une disponibilité et une conformité de niveau entreprise. Seedance 2.0 Native 4K est désormais disponible !

Voir la Famille

GPT Image 2

L'API GPT Image 2 offre aux développeurs un accès au dernier modèle d'image d'OpenAI, le successeur de GPT Image 1.5. Elle génère et modifie des images avec un rendu de texte précis pour les caractères latins et CJK, ainsi qu'une composition solide pour les affiches, les maquettes et les infographies. Sur Atlas Cloud, vous y accédez via une API unifiée aux côtés de plus de 300 modèles, avec des crédits gratuits, une disponibilité de 99,99 % et sans aucune vérification d'organisation OpenAI requise.

Voir la Famille

Seedream 5.0 Pro

L'API Seedream 5.0 Pro offre aux développeurs le modèle d'édition d'images contrôlable de ByteDance sur Atlas Cloud. Elle positionne les modifications avec précision à l'aide d'ancrages et de coordonnées, sépare les images en calques modifiables, fusionne de multiples références et fait correspondre les couleurs et matériaux exacts, avec du texte multilingue en 2K et 3K. Sur Atlas Cloud, vous y accédez via une seule clé !

Voir la Famille

Gemini Omni Flash

La Gemini Omni API apporte à votre stack le modèle multimodal de génération et d'édition vidéo de Google DeepMind, présenté à Google I/O 2026. Gemini Omni fusionne le moteur de raisonnement de Gemini avec les médias génératifs : il accepte n'importe quelle combinaison de texte, d'images, de vidéo et d'audio pour produire des résultats cohérents et ancrés dans la connaissance. Affinez vos résultats par simple conversation — remplacez des objets, réécrivez des scènes, changez de style — tandis que la physique, les personnages et la continuité restent intacts. Atlas Cloud propose toute la gamme Gemini Omni Flash — texte vers vidéo, image vers vidéo avec jusqu'à 7 images de référence, et référence vers vidéo — via une API unifiée, avec une tarification transparente à la seconde à partir de $0.112 et sans abonnement. Commencez à développer dès aujourd'hui.

Voir la Famille

Grok Imagine

La Grok Imagine API offre aux développeurs la génération d'images, de vidéos et d'audio de xAI dans une seule suite. Elle produit des images jusqu'à 2K avec un rendu de texte multilingue, ainsi que des vidéos allant jusqu'à 15 secondes avec un audio natif synchronisé et une édition basée sur des références. Sur Atlas Cloud, une seule clé exécute chaque mode Grok Imagine, ce qui vous permet de passer d'une image, d'une vidéo et d'un audio à l'autre sans configuration distincte, à partir de 0,02 $ par image et 0,05 $ par seconde.

Voir la Famille

Google

Les modèles créatifs les plus puissants de Google sont tous disponibles sur Atlas Cloud. Veo 3.1 offre une génération de vidéos cinématographiques, Nano Banana 2 permet de créer des images haute fidélité, et Gemini apporte une intelligence multimodale à chaque flux de travail. Accédez à la suite complète de modèles Google via une seule API key avec une disponibilité Day-0 et une tarification à l'usage (pay-as-you-go).

Voir la Famille

Seedance 2.0 Mini

Seedance 2.0 Mini apporte la génération de vidéos multimodale de ByteDance aux flux de travail où la vitesse et les coûts sont primordiaux. Il offre les capacités de base de Seedance 2.0 avec une empreinte plus légère — une génération plus rapide, un coût par vidéo réduit et la même intégration API que celle que vous utilisez déjà. Pour les équipes qui gèrent des pipelines à haut volume ou du prototypage à grande échelle, Mini est le choix par défaut pratique.

Voir la Famille

ByteDance

De la génération de vidéos cinématiques à la création d'images haute fidélité, les modèles les plus puissants de ByteDance sont disponibles sur Atlas Cloud. Exécutez Seedance et Seedream à grande échelle avec les prix d'inférence les plus bas et aucune surcharge d'infrastructure.

Voir la Famille

Alibaba

Atlas Cloud rassemble l'ensemble de la gamme de modèles d'Alibaba sous une seule API : Qwen pour les tâches linguistiques et d'imagerie, et Wan pour la génération de vidéos jusqu'en 1080p. Accédez à chaque modèle avec une tarification à l'usage (pay-as-you-go) sans abonnement. L'API Alibaba est disponible via une URL de base unique en utilisant votre client existant compatible avec OpenAI.

Voir la Famille

OpenAI

Atlas Cloud vous donne accès à l'ensemble de la gamme de l'API OpenAI, de GPT Image 2 pour la génération d'images à Sora 2 pour la vidéo. Chaque modèle est disponible en paiement à l'usage sans engagement mensuel. Intégrez-le en remplaçant simplement l'URL de base à l'aide de l'API compatible OpenAI.

Voir la Famille

xAI

Créez des pipelines complets d'images et de vidéos en utilisant la xAI API sur Atlas Cloud. Générez en 2K, éditez avec des images de référence et animez des images en clips synchronisés avec l'audio.

Voir la Famille

Kwaivgi

L'API Kwaivgi à 15 % en dessous du tarif standard. Atlas Cloud offre un accès Day-0 aux nouvelles versions de Kling avec une tarification à l'usage et sans limite de postes. Un seul compte, une seule clé, tous les modèles Kling du niveau standard au niveau master.

Voir la Famille