Todos los agentes de codificación populares permiten cambiar el modelo subyacente, pero cada uno esconde la configuración en un archivo distinto, con un nombre de clave diferente y un formato de URL único. Por eso, la gente se rinde y sigue pagando precios de frontera, a pesar de que los usuarios intensivos de agentes gastan alrededor de USD13 por desarrollador activo al día con los modelos por defecto (CloudZero, 2026). Esta página soluciona ese problema. Es una referencia única con la configuración exacta de API personalizada para Claude Code, OpenClaw, Codex, OpenCode y Cursor, además de la distinción clave que explica todas sus diferencias. Guárdala en tus marcadores, porque el valor aquí reside en los bloques para copiar y pegar y en las precauciones, no en el relleno. Al final, serás capaz de apuntar cualquiera de estos agentes a un modelo más barato en un par de minutos y entenderás por qué la URL cambia de una herramienta a otra.
Puntos clave
- Los agentes de codificación se dividen en dos familias de protocolos. Claude Code habla la API de Anthropic; OpenClaw, Codex, OpenCode y Cursor hablan la API compatible con OpenAI.
- La diferencia práctica está en la URL: las herramientas compatibles con OpenAI requieren el sufijo /v1, y Claude Code no.
- Cada configuración necesita las mismas tres cosas: una URL base, una clave de API y un ID de modelo. Solo cambian los nombres de los campos.
- Los modelos de pesos abiertos (open-weight) son la recompensa: DeepSeek V4 Flash cuesta cerca de USD0.14 por millón de tokens de entrada frente a varios dólares de los modelos de frontera (Codersera, 2026).
Por qué merece la pena una chuleta de API personalizada para agentes de codificación
La razón para molestarse es el coste, y la causa es estructural. Los agentes reenvían su contexto acumulado en cada paso de razonamiento, por lo que consumen de 10 a 100 veces más tokens que una ventana de chat para la misma tarea (LeanOps, 2026). Ese multiplicador es la razón por la que las facturas de los agentes se disparan, y también es la razón por la que cambiar el precio de los tokens, en lugar de usar menos el agente, es la estrategia que realmente funciona. Una API personalizada apunta a tu agente a un backend más barato sin cambiar tu forma de trabajar. Deriva la codificación rutinaria a un modelo de pesos abiertos y el coste por token caerá drásticamente, a menudo un 70% o más, mientras que la brecha de calidad en las tareas cotidianas sigue siendo mínima. Una chuleta de API personalizada para agentes de codificación es importante porque el ahorro es real, pero la fricción en la configuración es lo que detiene a la mayoría, y esa fricción es casi totalmente: "¿qué archivo, qué campo, qué URL?".
Cómo funciona una entrada de la chuleta de API personalizada para agentes de codificación
Antes de las configuraciones, aquí está la única idea que hace que todas tengan sentido. Los agentes de codificación se dividen en dos familias de protocolos, y la familia a la que pertenece una herramienta determina la forma de su configuración.
Claude Code se comunica con la API de Messages de Anthropic, por lo que lee su backend desde ANTHROPIC_BASE_URL y se autentica con un token al estilo Anthropic. Todo lo demás en esta chuleta, OpenClaw, Codex, OpenCode y Cursor, se comunica con la API de Chat Completions compatible con OpenAI, por lo que requieren una baseURL, una clave al estilo OpenAI y esperan la ruta /v1 en el endpoint. Ese detalle del /v1 es la razón más común por la que una configuración falla silenciosamente.
Una vez que ves esa división, cada entrada a continuación son los mismos tres valores con diferentes nombres: una URL base, una clave y un ID de modelo. Los ejemplos utilizan Atlas Cloud como proveedor porque sirve a ambas familias de protocolos desde una sola cuenta, por lo que lo único que cambia entre herramientas es la sintaxis, no la clave que pegas. Cualquier proveedor compatible funciona de la misma manera; simplemente sustituye la URL base y la clave.

La chuleta de API personalizada para agentes de codificación, herramienta por herramienta
Aquí está primero la tabla de referencia rápida, luego el bloque de configuración completo para cada herramienta. Ten lista tu clave de API antes de empezar. En Atlas Cloud, crea una seleccionando Coding Plan como tipo de clave, lo cual la vincula a la cuota de codificación basada en créditos.
| Herramienta | Ubicación de la configuración | URL Base | Protocolo |
|---|---|---|---|
| Claude Code | ~/.claude/settings.json | https://api.atlascloud.ai | Compatible con Anthropic |
| OpenClaw | ~/.openclaw/openclaw.json o openclaw onboard | https://api.atlascloud.ai/v1 | Compatible con OpenAI |
| Codex | ~/.codex/config.toml + auth.json | https://api.atlascloud.ai/v1 | Compatible con OpenAI |
| OpenCode | ~/.config/opencode/opencode.json | https://api.atlascloud.ai/v1 | Compatible con OpenAI |
| Cursor | Ajustes, Modelos, URL base personalizada | https://api.atlascloud.ai/v1 | Compatible con OpenAI |
Claude Code
Claude Code es la excepción de la familia Anthropic, así que ten en cuenta que la URL base no lleva /v1. Edita ~/.claude/settings.json en macOS o Linux, o %USERPROFILE%.claude\settings.json en Windows:
plaintext1{ 2 "env": { 3 "ANTHROPIC_AUTH_TOKEN": "tu-clave-api-atlas", 4 "ANTHROPIC_BASE_URL": "https://api.atlascloud.ai", 5 "ANTHROPIC_MODEL": "zai-org/glm-5.1", 6 "ANTHROPIC_DEFAULT_HAIKU_MODEL": "zai-org/glm-5.1", 7 "ANTHROPIC_DEFAULT_SONNET_MODEL": "zai-org/glm-5.1", 8 "CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS": "1" 9 } 10}
Configurar los valores predeterminados de Haiku y Sonnet al mismo modelo también dirige las pequeñas llamadas en segundo plano de Claude Code a tu modelo, en lugar de fallar por un valor predeterminado no disponible.
OpenClaw
OpenClaw es la más fácil porque tiene un asistente. En una terminal, ejecuta openclaw onboard, luego elige Yes, QuickStart y Custom Provider. Introduce la URL base https://api.atlascloud.ai/v1, pega tu clave, pega el ID del modelo y elige el protocolo OpenAI-compatible. Cuando aparezca Verification successful, nombra el endpoint y listo. Lo que debes saber si editas ~/.openclaw/openclaw.json manualmente: OpenClaw es una configuración de dos pasos. Defines el proveedor en models.providers, luego debes incluir el modelo en la lista de permitidos en agents.defaults.models usando la clave provider-name/model-name, o el agente lo rechazará (OpenClaw docs, 2026). No incluir el modelo en la lista es la causa principal del error "model not allowed". El asistente hace ambos pasos por ti, por eso es la ruta recomendada.
Codex
Codex usa dos archivos. Pon el proveedor en ~/.codex/config.toml:
plaintext1model_provider = "atlas_coding_plan" 2model = "zai-org/glm-5.1" 3 4[model_providers.atlas_coding_plan] 5name = "atlascloud" 6base_url = "https://api.atlascloud.ai/v1" 7wire_api = "chat" 8requires_openai_auth = true
Luego pon la clave en ~/.codex/auth.json:
plaintext1{ "OPENAI_API_KEY": "tu-clave-api-atlas" }
Ejecuta codex en tu terminal, salta el aviso de actualización y estarás conectado.
OpenCode y Cursor
OpenCode lee ~/.config/opencode/opencode.json (en Windows, \Users\tu-nombre.config\opencode\opencode.json):
plaintext1{ 2 "$schema": "https://opencode.ai/config.json", 3 "provider": { 4 "atlascloud": { 5 "npm": "@ai-sdk/openai-compatible", 6 "name": "atlascloud", 7 "options": { 8 "baseURL": "https://api.atlascloud.ai/v1", 9 "apiKey": "tu-clave-api-atlas" 10 }, 11 "models": { 12 "zai-org/glm-5.1": { "name": "glm-5.1" } 13 } 14 } 15 } 16}
Cursor no tiene archivo de configuración para esto. Abre Ajustes, ve a Modelos, añade tu ID de modelo por nombre, luego establece la URL base personalizada de OpenAI a https://api.atlascloud.ai/v1 y pega tu clave. Como Cursor sigue el patrón compatible con OpenAI, la misma URL base y clave de las otras herramientas funcionan sin cambios.
Elegir un modelo: La otra mitad de la chuleta de API personalizada para agentes de codificación
Conectar el endpoint es solo la mitad del trabajo. El modelo que elijas es lo que decide el ahorro. El patrón que funciona es usar por defecto un modelo abierto fuerte y barato para la codificación diaria y reservar un modelo de frontera para el razonamiento más difícil. La brecha de capacidad es menor que la de precio: en SWE-Bench Pro, los modelos abiertos líderes obtienen puntuaciones en el rango alto de 70 frente a aproximadamente 91 de los modelos de frontera (Codersera, 2026), lo que apenas se nota en el trabajo rutinario de funciones y refactorizaciones.
En un proveedor basado en créditos, cada modelo tiene un multiplicador que asigna el uso de tokens a créditos, por lo que el coste relativo es fácil de leer:
| ID de modelo | Contexto | Multiplicador de entrada | Multiplicador de salida | Ahorro aprox. vs oficial |
|---|---|---|---|---|
| deepseek-ai/deepseek-v4-flash | 1M | 0.23 | 0.46 | ~50% |
| deepseek-ai/deepseek-v3.2 | 160K | 0.42 | 0.62 | ~55% |
| minimaxai/minimax-m2.5 | 200K | 0.65 | 2.18 | ~45% |
| moonshotai/kimi-k2.6 | 262K | 1.72 | 7.26 | ~45% |
| zai-org/glm-5.1 | 200K | 2.54 | 7.99 | ~45% |
| Fuente: Reglas de crédito de Atlas Cloud Coding Plan. Coste en créditos = tokens de entrada × multiplicador de entrada + tokens de salida × multiplicador de salida. | ||||
| Un valor predeterminado práctico: GLM-5.1 o Kimi K2.6 para codificación interactiva, DeepSeek V4 Flash para trabajos de alto volumen o en segundo plano, y un modelo de frontera solo para esa tarea poco común que un modelo abierto no puede resolver. Cambiar es cuestión de una línea en el ID del modelo en cualquiera de las configuraciones anteriores. |
Una clave de API para todos los agentes de codificación
Nota lo que la tabla de la chuleta muestra silenciosamente: la misma clave y los mismos IDs de modelo aparecen en cada configuración. Ese es el verdadero argumento a favor de un proveedor unificado. Si conectas cada herramienta a un proveedor diferente, terminas con claves separadas, paneles separados y facturas separadas, y pierdes cualquier visión única del gasto. Apuntar todos a un solo proveedor consolida eso en una sola reserva de créditos y un solo lugar para cambiar de modelo. También soluciona la elaboración de presupuestos, lo cual es genuinamente difícil con la facturación medida por tokens. Un plan que renueva una asignación de crédito diaria fija a medianoche limita el daño de un bucle de agente fuera de control, mientras que los paquetes de pago por uso absorben el pico ocasional. Los planes de Atlas Cloud comienzan en USD10 al mes, sus paquetes de pago por uso tienen un descuento del 41%, y las actualizaciones a mitad de ciclo son prorrateadas, por lo que subir de nivel solo cuesta la diferencia en lugar de pagar un plan nuevo completo.
Chuleta de API personalizada para agentes de codificación: errores comunes
Casi todas las configuraciones fallidas se deben a uno de estos puntos, y todos son rápidos de solucionar. La confusión con el /v1. El error más frecuente en toda esta chuleta. Las herramientas compatibles con OpenAI quieren el sufijo /v1; Claude Code no. Un error de conexión suele significar que la ruta es incorrecta para la familia de esa herramienta. Usar el tipo de clave incorrecto. Tu clave de proveedor no es tu clave de Anthropic, y viceversa. Pegar la incorrecta da un error de autenticación que parece más confuso de lo que es. Saltarse la lista de permitidos de OpenClaw. Definir el proveedor es solo la mitad de la configuración de OpenClaw. Si ves "model not allowed", el modelo falta en la lista de permitidos o la clave provider-name/model-name tiene un error tipográfico. Dejar los modelos de fondo sin configurar en Claude Code. Si configuras solo el modelo principal pero dejas los valores predeterminados de Haiku y Sonnet apuntando a modelos no disponibles, las pequeñas llamadas en segundo plano fallarán. Configura los tres.
FAQ: Chuleta de API personalizada para agentes de codificación
¿Requiere esta chuleta de API personalizada cambiar de herramienta?
No. Todo el punto es que conserves el agente que ya usas, ya sea Claude Code, OpenClaw, Codex, OpenCode o Cursor. Una API personalizada es un cambio de configuración, no una migración, por lo que tu flujo de trabajo se mantiene idéntico mientras el backend y la factura cambian.
¿Por qué cambia la URL base en la chuleta de API personalizada por herramienta?
Debido a la familia del protocolo. Claude Code usa la API de Anthropic y toma el dominio base, mientras que las herramientas compatibles con OpenAI esperan la ruta /v1. Mismo proveedor, misma clave, ruta diferente. Esa única diferencia explica la mayoría de las configuraciones fallidas.
¿Cuánto puede ahorrarte una chuleta de API personalizada para agentes de codificación?
Mucho, dependiendo del modelo. DeepSeek V4 Flash cuesta cerca de USD0.14 por millón de tokens de entrada frente a varios dólares de los modelos de frontera (Codersera, 2026), por lo que enviar el trabajo rutinario a un modelo abierto suele reducir la factura por token en un 70% o más sin cambiar tu forma de codificar.
¿Con qué modelo debería empezar de la chuleta de API personalizada?
Para codificación interactiva, GLM-5.1 o Kimi K2.6 son valores predeterminados fuertes y asequibles. Para trabajos de alto volumen o en segundo plano, DeepSeek V4 Flash es más barato. Mantén un modelo de frontera en reserva solo para tareas que un modelo abierto realmente no pueda manejar.
¿Es reversible la configuración de la chuleta de API personalizada?
Sí. Cada configuración es reversible. Restaura la URL base original o elimina el bloque del proveedor, y el agente volverá a apuntar a su valor predeterminado. Muchos desarrolladores mantienen ambas configuraciones y cambian según la tarea.
Conclusión
La razón por la que merece la pena guardar una chuleta de API personalizada para agentes de codificación es que la parte difícil nunca fue el concepto, sino recordar qué archivo y qué URL quiere cada herramienta. Una vez que ves las dos familias de protocolos, cada configuración es la misma URL base, clave e ID de modelo con diferente sintaxis. Elige un modelo de pesos abiertos, pega el bloque correcto, ten en cuenta la regla del /v1 y conservarás el agente que te gusta mientras pagas una fracción de los precios de frontera. Si quieres una sola clave y un solo presupuesto para todos ellos, puedes configurarlo a través de la consola de Coding Plan de Atlas Cloud y cambiar de modelo cuando cambie la tarea.






