
Atlas Cloud aloja la serie completa GLM a través de la API Z-AI, desde GLM-4.6 hasta GLM-5.1. Todos los modelos son bilingües y están disponibles en la modalidad de pago por uso con una ventana de contexto de 202K.
Impulsa chat, razonamiento y agentes a gran escala con los principales grandes modelos de lenguaje, servidos de forma rápida y asequible en Atlas Cloud.
Compare standard vs. our pricing across every Z.ai model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| GLM 5.1 | $1.4/$4.4per 1M tokens202.8K context | $1.26/$3.96M in/outper 1M tokens202.8K context | -10% | View |
| GLM 5 Turbo | $1.2/$4per 1M tokens262.1K context | $1.2/$4M in/outper 1M tokens262.1K context | — | View |
| GLM 5 | $1/$3.2per 1M tokens202.8K context | $0.95/$3.15M in/outper 1M tokens202.8K context | — | View |
| GLM 4.7 | $0.6/$2.2per 1M tokens202.8K context | $0.52/$1.85M in/outper 1M tokens202.8K context | — | View |
| GLM 4.6 | $0.6/$2.2per 1M tokens202.8K context | $0.6/$2.2M in/outper 1M tokens202.8K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Los niveles de los modelos de GLM abarcan desde tareas rápidas de chat bilingüe hasta agentes de codificación autónomos de varias horas. Los equipos utilizan GLM-5.1 para trabajos de ingeniería a largo plazo y GLM-4.7 o GLM-5 Turbo cuando la rentabilidad y la velocidad son la prioridad.
Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.
Los equipos de desarrollo utilizan GLM-5.1 para ejecutar transformaciones completas de bases de código durante sesiones de varias horas sin puntos de control humanos. El modelo planifica, escribe, prueba e itera los cambios continuamente hasta por 8 horas, manejando 655 iteraciones en una demostración de construcción de un sistema Linux desde cero. Esto reemplaza semanas de trabajo de refactorización manual en bases de código heredadas y de gran tamaño.
Los equipos de herramientas para desarrolladores integran GLM-5.1 y GLM-5 Turbo como el modelo subyacente para los flujos de trabajo de programación con IA en Claude Code, Kilo Code, Cline, Roo Code y OpenCode. La Z-AI API en Atlas Cloud es compatible con OpenAI, por lo que el cambio de la base URL es la única modificación necesaria para enrutar cualquiera de estas herramientas a través de GLM. La ventana de contexto de 262K de GLM-5 Turbo lo hace especialmente adecuado para el contexto de archivos grandes en flujos de trabajo de IDE.
Los equipos de operaciones construyen agentes de soporte utilizando GLM-5 que combinan el acceso a la base de datos de tickets, la búsqueda en la base de conocimientos y las herramientas de escalamiento para manejar consultas repetitivas sin intervención humana. La capacidad de llamada a múltiples herramientas y el soporte de streaming del modelo lo hacen práctico para implementaciones en tiempo real orientadas al cliente. El soporte bilingüe significa que el mismo agente maneja tickets en chino e inglés desde un único endpoint de modelo en Atlas Cloud.
Los equipos de contenido y negocios utilizan GLM-4.7 para generar documentos de Word, presentaciones de PowerPoint, PDFs y reportes de Excel tanto en chino como en inglés a partir de prompts estructurados. A 0,52 $ por cada millón de tokens de entrada, es el nivel de GLM más rentable para flujos de trabajo de documentos de gran volumen que no requieren razonamiento de nivel de frontera. La ventana de contexto de 202K es suficiente para mantener esquemas completos de documentos y material fuente en una sola llamada.
Los equipos de infraestructura de IA utilizan GLM-5.1 para ejecutar canalizaciones de optimización impulsadas por puntos de referencia en cargas de trabajo de aprendizaje automático. En tareas de estilo KernelBench, GLM-5.1 realiza miles de ciclos de optimización impulsados por herramientas y logra una aceleración media geométrica de 3.6x. La capacidad de ejecución continua de 8 horas significa que el agente ejecuta el ciclo de optimización completo sin requerir reinicios manuales entre sesiones.
Z-AI (también escrito como Z.ai) es el desarrollador detrás de la serie GLM de grandes modelos de lenguaje, también conocida como ZhipuAI. GLM significa Modelo de Lenguaje General (General Language Model), una familia que abarca desde GLM-4.6 hasta el actual modelo insignia GLM-5.1. La serie está diseñada para la programación, flujos de trabajo basados en agentes y el uso en entornos de producción bilingües chino-inglés.
GLM-5.1 alcanzó el primer lugar en SWE-Bench Pro con una puntuación de 58,4 el 7 de abril de 2026, superando a GPT-5.4 (57,7) y Claude Opus 4.6 (57,3). También lidera CyberGym con 68,7. Esto lo convierte en el modelo de código abierto mejor clasificado para la programación en entornos de producción a partir del segundo trimestre de 2026.
Sí. GLM-5.1 admite la ejecución autónoma continua durante un máximo de 8 horas en una sola tarea sin intervención humana. Gestiona el ciclo completo de planificación, ejecución, optimización iterativa y entrega. Esto está diseñado específicamente para flujos de trabajo de agentes de codificación a largo plazo en entornos como Claude Code y configuraciones compatibles con OpenClaw.
GLM-5 es el modelo fundacional base construido sobre una arquitectura MoE de 744 mil millones de parámetros, entrenado con 28.5 billones de tokens, y alcanzó el n.º 1 de Elo en Chatbot Arena para modelos de código abierto. GLM-5.1 es una actualización posterior al entrenamiento de la misma base con una capacidad significativamente mayor en programación, uso de herramientas y ejecución autónoma. GLM-5 tiene un precio de $0.95 por millón de tokens de entrada en Atlas Cloud; GLM-5.1 cuesta $1.26 por millón de tokens de entrada.
Sí. GLM-5.1 se publica bajo una licencia MIT, que permite el uso comercial, el ajuste fino y la redistribución sin restricciones. Los pesos abiertos están disponibles para la implementación autoalojada. Atlas Cloud proporciona GLM-5.1 a través de API para los equipos que prefieren el acceso gestionado sin gastos generales de infraestructura.
GLM-4.6, GLM-4.7, GLM-5 y GLM-5.1 admiten una ventana de contexto de 202.750 tokens en Atlas Cloud. GLM-5 Turbo es la excepción con una ventana de contexto más grande de 262.144 tokens y una longitud máxima de salida de 131.072 tokens. GLM-5.1 es adecuado para generar archivos de código largos y trazas de ejecución extendidas dentro de su límite de contexto.
Sí. Todos los modelos GLM están optimizados para chino e inglés con la misma competencia en ambos idiomas. Puede escribir prompts en cualquiera de los dos idiomas y recibir resultados de calidad constante. Esto hace que GLM sea práctico para los equipos que desarrollan productos que atienden tanto al mercado chino como al internacional desde un único modelo.
GLM-4.7 tiene un precio inicial de 0,52 $ por millón de tokens de entrada y es el nivel más rentable. GLM-4.6 cuesta 0,60 $, GLM-5 cuesta 0,95 $ y GLM-5 Turbo cuesta 1,20 $ por millón de tokens de entrada. GLM-5.1, el modelo insignia, cuesta 1,26 $ por millón de tokens de entrada y 3,96 $ por millón de tokens de salida. Todos los modelos son de pago por uso, sin compromiso mensual.
Guías, tutoriales y novedades de producto para aprovechar al máximo Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.