Z.ai API for Top Open-Source GLM Coding

La API de Z.ai lleva toda la serie GLM de ZhipuAI a tu stack, desde GLM-4.6 hasta el buque insignia GLM-5.1, que ocupa el primer lugar entre los modelos de código abierto en SWE-Bench Pro y ejecuta agentes de programación autónomos durante horas seguidas. GLM combina un contexto de 202K tokens con una generación equilibrada en chino e inglés bajo una licencia MIT permisiva. Atlas Cloud ofrece cada modelo mediante una única clave compatible con OpenAI, con acceso Day-0 y precios transparentes por llamada. Empieza hoy.

Large Language Models by Z.ai

Impulsa chat, razonamiento y agentes a gran escala con los principales grandes modelos de lenguaje, servidos de forma rápida y asequible en Atlas Cloud.

Ver todos los modelos

LLM

GLM

GLM es la serie insignia de LLM de Z.ai, desarrollada por Zhipu AI, y la GLM API abarca desde el GLM-5 agéntico hasta el eficiente GLM-4.6 MoE de 357B. Estos modelos se especializan en la ejecución autónoma de tareas, la orquestación de agentes complejos y la programación de nivel de producción. En Atlas Cloud, un único endpoint unificado te da acceso desde el día 0 a toda la familia GLM, con precios basados en el uso y una disponibilidad fiable para producción. Empieza a crear hoy mismo.

6 modelosExplorar GLM

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

Model	Standard Price (USD)	Our Price (USD)	Discount
GLM 5.2	$1.4/$4.4per 1M tokens1048.6K context	$1.26/$3.96M in/outper 1M tokens1048.6K context	-10%	View
GLM 5.1	$1.4/$4.4per 1M tokens202.8K context	$1.26/$3.96M in/outper 1M tokens202.8K context	-10%	View
GLM 5v Turbo	$1.2/$4per 1M tokens202.8K context	$1.2/$4M in/outper 1M tokens202.8K context	—	View
GLM 5	$1/$3.2per 1M tokens202.8K context	$0.95/$3.15M in/outper 1M tokens202.8K context	—	View
GLM 4.7	$0.6/$2.2per 1M tokens202.8K context	$0.52/$1.85M in/outper 1M tokens202.8K context	—	View
GLM 4.6	$0.6/$2.2per 1M tokens202.8K context	$0.6/$2.2M in/outper 1M tokens202.8K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Casos de uso de la Z-AI API que puede construir en Atlas Cloud

Los niveles de los modelos de GLM abarcan desde tareas rápidas de chat bilingüe hasta agentes de codificación autónomos de varias horas. Los equipos utilizan GLM-5.1 para trabajos de ingeniería a largo plazo y GLM-4.7 o GLM-5 Turbo cuando la rentabilidad y la velocidad son la prioridad.

Optimización del rendimiento de la base de datos a largo plazo

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

Refactorización Autónoma de Código a Escala de Repositorio

Los equipos de desarrollo utilizan GLM-5.1 para ejecutar transformaciones completas de bases de código durante sesiones de varias horas sin puntos de control humanos. El modelo planifica, escribe, prueba e itera los cambios continuamente hasta por 8 horas, manejando 655 iteraciones en una demostración de construcción de un sistema Linux desde cero. Esto reemplaza semanas de trabajo de refactorización manual en bases de código heredadas y de gran tamaño.

Integración de Agente de Codificación en IDE

Los equipos de herramientas para desarrolladores integran GLM-5.1 y GLM-5 Turbo como el modelo subyacente para los flujos de trabajo de programación con IA en Claude Code, Kilo Code, Cline, Roo Code y OpenCode. La Z-AI API en Atlas Cloud es compatible con OpenAI, por lo que el cambio de la base URL es la única modificación necesaria para enrutar cualquiera de estas herramientas a través de GLM. La ventana de contexto de 262K de GLM-5 Turbo lo hace especialmente adecuado para el contexto de archivos grandes en flujos de trabajo de IDE.

Automatización de Consultas de Soporte de Nivel 1

Los equipos de operaciones construyen agentes de soporte utilizando GLM-5 que combinan el acceso a la base de datos de tickets, la búsqueda en la base de conocimientos y las herramientas de escalamiento para manejar consultas repetitivas sin intervención humana. La capacidad de llamada a múltiples herramientas y el soporte de streaming del modelo lo hacen práctico para implementaciones en tiempo real orientadas al cliente. El soporte bilingüe significa que el mismo agente maneja tickets en chino e inglés desde un único endpoint de modelo en Atlas Cloud.

Generación de documentos bilingües a gran escala

Los equipos de contenido y negocios utilizan GLM-4.7 para generar documentos de Word, presentaciones de PowerPoint, PDFs y reportes de Excel tanto en chino como en inglés a partir de prompts estructurados. A 0,52 $ por cada millón de tokens de entrada, es el nivel de GLM más rentable para flujos de trabajo de documentos de gran volumen que no requieren razonamiento de nivel de frontera. La ventana de contexto de 202K es suficiente para mantener esquemas completos de documentos y material fuente en una sola llamada.

Optimización del kernel para cargas de trabajo de ML

Los equipos de infraestructura de IA utilizan GLM-5.1 para ejecutar canalizaciones de optimización impulsadas por puntos de referencia en cargas de trabajo de aprendizaje automático. En tareas de estilo KernelBench, GLM-5.1 realiza miles de ciclos de optimización impulsados por herramientas y logra una aceleración media geométrica de 3.6x. La capacidad de ejecución continua de 8 horas significa que el agente ejecuta el ciclo de optimización completo sin requerir reinicios manuales entre sesiones.

Haz realidad la visión de tu empresa con Atlas Cloud AI.

Contactar con ventas

Lo que preguntan los desarrolladores sobre la API de Z.ai

La API de Z.ai ofrece a los desarrolladores acceso programático a la serie GLM de large language models creados por Z.ai, la empresa también conocida como Zhipu AI. GLM significa General Language Model y abarca versiones desde GLM-4.6 hasta el buque insignia GLM-5.1, ajustadas para programación, flujos de trabajo agentic y uso en producción bilingüe en chino e inglés. En Atlas Cloud accedes a toda la línea mediante un único endpoint compatible con OpenAI.

Atlas Cloud aloja la serie GLM desde GLM-4.6 hasta el buque insignia GLM-5.1, con GLM-4.7 y GLM-5 entre medias. Los niveles más ligeros gestionan tareas cotidianas de alto volumen a menor coste, mientras que GLM-5.1 está orientado a los trabajos de programación y agentic más exigentes. Todos los modelos funcionan en modalidad pay-as-you-go con la misma clave.

Sí. Los pesos abiertos de GLM, incluido GLM-5.1, se publican bajo la licencia MIT, que permite el uso comercial, el fine-tuning y la redistribución sin restricciones. Si prefieres evitar la sobrecarga de infraestructura, Atlas Cloud sirve los mismos modelos mediante API para ofrecer acceso gestionado en lugar de self-hosting.

Apunta tu SDK de OpenAI existente a la URL base de Atlas Cloud, configura tu clave y pasa el nombre del modelo GLM que quieras. Como la API de Z.ai es compatible con OpenAI, la mayoría de los proyectos migran cambiando solo la URL base y la cadena del modelo, y los modelos se integran directamente en herramientas de agentes como Claude Code, Cline y Roo Code. Empieza a crear hoy mismo.

Tanto el chino como el inglés son idiomas de primera clase para GLM, que se entrena para ofrecer una gran competencia en ambos. Puedes escribir prompts en cualquiera de los dos idiomas y obtendrás una calidad consistente, lo que hace que la línea sea práctica para equipos que atienden a usuarios chinos e internacionales desde un único modelo en lugar de mantener stacks separados.

Desde GLM-4.6 hasta GLM-5.1 se admite una ventana de contexto de 200K tokens, suficiente para contener grandes bases de código, documentos extensos o trazas prolongadas de agentes en una sola solicitud. Si tu flujo de trabajo produce salidas largas, la misma ventana cubre archivos de código grandes y registros de ejecución de varios pasos sin truncamiento prematuro.

GLM-5.1 encabezó SWE-Bench Pro con una puntuación de 58.4 en abril de 2026, situándose entre los modelos open-source más potentes para programación en el mundo real. También admite ejecución autónoma continua durante hasta ocho horas en una sola tarea, ejecutando planificación, iteración y entrega en un único bucle, lo que encaja con flujos de trabajo de agentes de largo horizonte en entornos como Claude Code.

Todos los modelos GLM de la API de Z.ai funcionan con precios transparentes pay-as-you-go, facturados por token, sin suscripción ni compromiso mensual. Los tokens de entrada y salida se miden por separado, y los niveles más ligeros como GLM-4.7 cuestan menos por token que el buque insignia GLM-5.1, por lo que puedes ajustar la elección del modelo a tu presupuesto. Consulta la tarifa actual por token en la ficha de cada modelo en Atlas Cloud.

Explorar Más Series

Seedance 2.0

La API de Seedance 2.0 le ofrece acceso de producción al modelo de video multimodal de ByteDance: entradas cuatrimodales (texto, imagen, video, audio) y un sistema "Universal Reference" líder en la industria que bloquea la composición, el movimiento de la cámara y las acciones de los personajes en diferentes tomas. Integre un control de nivel de director con una sola llamada a la API, una tarifa fija de $0.09/s, clave instantánea y sin lista de espera, todo respaldado por un tiempo de actividad y cumplimiento de nivel empresarial. ¡Seedance 2.0 Native 4K ya está disponible!

Ver Serie

GPT Image 2

La API de GPT Image 2 ofrece a los desarrolladores acceso al último modelo de imágenes de OpenAI, el sucesor de GPT Image 1.5. Genera y edita imágenes con una representación de texto precisa en caracteres latinos y CJK, además de una sólida composición para carteles, maquetas e infografías. En Atlas Cloud, puede acceder a ella a través de una API unificada junto con más de 300 modelos, con créditos gratuitos, un tiempo de actividad del 99,99% y sin necesidad de verificación de organización de OpenAI.

Ver Serie

Seedream 5.0 Pro

La API de Seedream 5.0 Pro ofrece a los desarrolladores el modelo de edición de imágenes controlable de ByteDance en Atlas Cloud. Sitúa las ediciones con precisión mediante anclajes y coordenadas, separa las imágenes en capas editables, fusiona múltiples referencias y empareja colores y materiales exactos, con texto multilingüe a 2K y 3K. ¡En Atlas Cloud puede acceder a él mediante una sola clave!

Ver Serie

Gemini Omni Flash

La Gemini Omni API lleva a tu stack el modelo multimodal de generación y edición de vídeo de Google DeepMind, presentado en Google I/O 2026. Gemini Omni fusiona el motor de razonamiento de Gemini con los medios generativos y acepta cualquier combinación de texto, imágenes, vídeo y audio para producir resultados coherentes y fundamentados en conocimiento. Refina los resultados mediante conversación natural: sustituye objetos, reescribe escenas y cambia de estilo mientras la física, los personajes y la continuidad permanecen intactos. Atlas Cloud ofrece toda la gama Gemini Omni Flash —texto a vídeo, imagen a vídeo con hasta 7 imágenes de referencia y referencia a vídeo— a través de una única API unificada, con precios transparentes por segundo desde $0.112 y sin suscripción. Empieza a construir hoy mismo.

Ver Serie

Grok Imagine

La Grok Imagine API ofrece a los desarrolladores la generación de imágenes, video y audio de xAI en una sola suite. Produce imágenes de hasta 2K con renderizado de texto multilingüe, además de videos de hasta 15 segundos con audio nativo y sincronizado, y edición basada en referencias. En Atlas Cloud, una sola clave ejecuta cada modo de Grok Imagine, por lo que puede alternar entre imagen, video y audio sin configuraciones separadas, desde $0.02 por imagen y $0.05 por segundo.

Ver Serie

Google

Los modelos creativos más potentes de Google están todos disponibles en Atlas Cloud. Veo 3.1 ofrece generación de video cinematográfico, Nano Banana 2 impulsa la creación de imágenes de alta fidelidad y Gemini aporta inteligencia multimodal a cada flujo de trabajo. Acceda a la suite completa de modelos de Google a través de una sola API key con disponibilidad Day-0 y precios de pago por uso (pay-as-you-go).

Ver Serie

Seedance 2.0 Mini

Seedance 2.0 Mini lleva la generación de video multimodal de ByteDance a los flujos de trabajo donde la velocidad y el costo son más importantes. Ofrece las capacidades principales de Seedance 2.0 con un menor consumo de recursos: generación más rápida, menor costo por video y la misma integración de API que ya utiliza. Para los equipos que ejecutan pipelines de alto volumen o crean prototipos a escala, Mini es la opción predeterminada práctica.

Ver Serie

ByteDance

Desde la generación de video cinematográfico hasta la creación de imágenes de alta fidelidad, los modelos más potentes de ByteDance están disponibles en Atlas Cloud. Ejecute Seedance y Seedream a gran escala con los precios de inferencia más bajos y cero gastos generales de infraestructura.

Ver Serie

Alibaba

Atlas Cloud reúne toda la línea de modelos de Alibaba bajo una sola API: Qwen para tareas de lenguaje e imagen, y Wan para la generación de video hasta 1080p. Acceda a cada modelo con pago por uso sin suscripciones. La API de Alibaba está disponible a través de una única URL base utilizando su cliente compatible con OpenAI existente.

Ver Serie

OpenAI

Atlas Cloud le ofrece acceso a la línea completa de la API de OpenAI, desde GPT Image 2 para la generación de imágenes hasta Sora 2 para video. Cada modelo está disponible bajo la modalidad de pago por uso sin compromiso mensual. Intégrelo cambiando simplemente la URL base mediante la API compatible con OpenAI.

Ver Serie

xAI

Construya pipelines completos de imágenes y video utilizando la xAI API en Atlas Cloud. Genere en 2K, edite con imágenes de referencia y anime imágenes en clips sincronizados con audio.

Ver Serie

Kwaivgi

La API de Kwaivgi a un 15% por debajo del precio estándar. Atlas Cloud ofrece acceso Day-0 a los nuevos lanzamientos de Kling con precios de pago por uso y sin límites de puestos. Una cuenta, una clave, todos los modelos de Kling desde el nivel estándar hasta el nivel maestro.

Ver Serie