Configuración de API de terceros para Claude Code: Ejecuta GLM, Kimi y DeepSeek a una fracción del costo

Guía práctica para configurar la API de terceros en Claude Code. Aprende a conectar Claude Code con modelos abiertos más económicos como GLM, Kimi y DeepSeek en menos de cinco minutos.

Claude Code es una de las mejores herramientas de codificación agéntica disponibles, y también una de las más caras de ejecutar a escala, con usuarios intensivos que llegan a los $13 por desarrollador activo al día en la API estándar (CloudZero, 2026). Aquí está lo que la mayoría pasa por alto: el modelo que impulsa Claude Code es intercambiable. Con una sola variable de entorno, puedes dirigir la misma experiencia de Claude Code a un backend diferente, incluidos modelos de pesos abiertos mucho más económicos como GLM, Kimi y DeepSeek.

Esta guía es un recorrido completo y directo sobre la configuración de una API de terceros para Claude Code. Aprenderás cómo funciona realmente la redirección, la configuración exacta que debes copiar, cómo elegir un modelo y cómo verificar que todo esté conectado correctamente. Todo el proceso toma unos cinco minutos y los ahorros se notan desde el primer día.

Puntos clave

  • Claude Code lee su backend desde la variable de entorno ANTHROPIC_BASE_URL, por lo que cualquier endpoint compatible con Anthropic puede reemplazar al predeterminado sin tocar la aplicación (Claude Code docs, 2026).
  • La configuración consiste en una sola edición en ~/.claude/settings.json; no se requiere proxy ni script contenedor para el caso básico.
  • Los modelos de pesos abiertos reducen drásticamente el costo por token: DeepSeek V4 Flash cuesta cerca de $0.14 por millón de tokens de entrada frente a varios dólares de los modelos de vanguardia (Codersera, 2026).
  • Usar una pasarela que agrega muchos modelos detrás de un único endpoint significa que puedes cambiar de modelo editando una sola línea, sin tener que volver a registrar claves con cinco proveedores diferentes.

Por qué optar por una configuración de API de terceros para Claude Code

La respuesta honesta es el costo, y las cifras no son sutiles. Las herramientas agénticas como Claude Code reenvían el contexto acumulado en cada paso de razonamiento, por lo que consumen de 10 a 100 veces más tokens que una ventana de chat para la misma cantidad de trabajo (LeanOps, 2026). Ese multiplicador de tokens es exactamente la razón por la que una sola tarea compleja puede convertirse silenciosamente en dólares, y por la que los equipos ven facturas mensuales que ascienden a cientos de dólares por ingeniero.

Una configuración de API de terceros para Claude Code ataca esa factura en la fuente: el precio por token. En lugar de pagar tarifas de modelos de vanguardia por cada edición, refactorización y prueba, diriges la mayor parte del trabajo a un modelo de pesos abiertos que cuesta una fracción. En la codificación rutinaria, la brecha de calidad es mucho menor que la brecha de precio. El objetivo de esta configuración no es renunciar a Claude Code, sino conservar la herramienta que te gusta mientras pagas precios de modelos abiertos por los tokens.

Hay una segunda razón que importa para cualquiera fuera de las regiones donde Anthropic opera directamente: el acceso. Un endpoint de terceros ofrece a los desarrolladores una forma estable y compatible de usar Claude Code sin depender de la facturación o disponibilidad de un solo proveedor.

Cómo funciona realmente la configuración de una API de terceros para Claude Code

Antes de copiar cualquier configuración, ayuda entender el mecanismo que hace posible todo esto. Claude Code no codifica de forma rígida los servidores de Anthropic. Al iniciarse, lee un puñado de variables de entorno, y la más importante es ANTHROPIC_BASE_URL. De forma predeterminada, apunta a la API de Anthropic. Cámbiala, y cada solicitud que haga Claude Code irá a la nueva dirección en su lugar (Claude Code docs, 2026).

Para que esto funcione, el endpoint de terceros debe hablar el mismo protocolo que espera Claude Code, que es el formato de la API de mensajes de Anthropic. Es por esto que no puedes apuntarlo directamente a un endpoint de OpenAI sin más. El proveedor debe exponer una URL compatible con Anthropic. Muchos proveedores de modelos ya publican precisamente este tipo de endpoint, y las pasarelas que agregan múltiples modelos abiertos realizan la traducción por ti, de modo que GLM, Kimi o DeepSeek respondan en el formato que Claude Code entiende.

Las tres variables que soportan la carga son:

  • ANTHROPIC_BASE_URL: a dónde envía las solicitudes Claude Code.
  • ANTHROPIC_AUTH_TOKEN: la clave API para ese endpoint, no tu clave de Anthropic.
  • ANTHROPIC_MODEL: qué modelo debe ejecutar el endpoint.

Una vez que internalizas que la aplicación es solo un cliente apuntando a una URL, el resto de la configuración es mecánica.

Configuración de API de terceros para Claude Code: paso a paso

Este es el núcleo de la guía. El siguiente ejemplo utiliza Atlas Cloud como proveedor porque expone un endpoint compatible con Anthropic que sirve de frente para los principales modelos de pesos abiertos, lo que mantiene la configuración breve y te permite cambiar de modelo más tarde sin repetir estos pasos. Los mismos pasos se aplican a cualquier proveedor compatible; solo cambian la URL base y la clave.

Paso 1: Obtén tu clave API y URL base

Al final de este paso, tendrás dos cadenas: una URL de endpoint y una clave.

  1. Crea una cuenta con el proveedor elegido y abre su sección de claves API.
  2. Genera una clave con alcance para codificación o uso de agentes. En Atlas Cloud, seleccionas Coding Plan como tipo de clave al crearla, lo que vincula la clave a la cuota de codificación basada en créditos en lugar del pago por uso general.
  3. Copia la clave en un lugar seguro y anota la URL base. Para Claude Code específicamente, Atlas Cloud usa https://api.atlascloud.ai (nota: sin el sufijo /v1 para el endpoint de Claude Code, que es un error común).

Paso 2: Edita tu settings.json

Al final de este paso, Claude Code apuntará al nuevo backend. Abre el archivo de configuración para tu sistema operativo:

  • macOS / Linux: ~/.claude/settings.json
  • Windows: %USERPROFILE%\.claude\settings.json

Pega lo siguiente, reemplazando el token por tu clave real:

plaintext
1{
2  "env": {
3    "ANTHROPIC_AUTH_TOKEN": "your-atlas-api-key",
4    "ANTHROPIC_BASE_URL": "https://api.atlascloud.ai",
5    "ANTHROPIC_MODEL": "zai-org/glm-5.1",
6    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "zai-org/glm-5.1",
7    "ANTHROPIC_DEFAULT_SONNET_MODEL": "zai-org/glm-5.1",
8    "CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS": "1"
9  }
10}

Un detalle que evita mucha confusión: establecer ANTHROPIC_DEFAULT_HAIKU_MODEL y ANTHROPIC_DEFAULT_SONNET_MODEL en el mismo modelo significa que las tareas en segundo plano de Claude Code (las llamadas pequeñas y rápidas que hace para cosas como resumir) también se dirigen al modelo elegido en lugar de fallar silenciosamente en un valor predeterminado no disponible.

Paso 3: Elige el modelo que se ajuste al trabajo

Al final de este paso, tendrás un modelo predeterminado razonable. El valor de ANTHROPIC_MODEL es solo una cadena de identificación de modelo que el proveedor reconoce. Con un endpoint agregador, el cambio es de una sola línea: configúralo en zai-org/glm-5.1 hoy, moonshotai/kimi-k2.6 mañana, o deepseek-ai/deepseek-v4-flash para trabajo de fondo de alto volumen, y reinicia Claude Code. Sin nuevas claves, sin nuevos bloques de configuración.

Paso 4: Verifica la configuración de tu API de terceros para Claude Code

Al final de este paso sabrás que funciona. Abre una terminal en cualquier proyecto y ejecuta:

plaintext
1claude

Luego dale una tarea trivial, como pedirle que explique un archivo o escriba una función de una línea. Si responde normalmente, la redirección está activa y tus solicitudes van al modelo de terceros. Si recibes un error de autenticación, la clave está mal o se copió con un espacio extra. Si recibes un error de conexión, vuelve a verificar la URL base, especialmente la presencia o ausencia del sufijo /v1 para tu herramienta específica.

Elección de modelos para tu configuración de API de terceros para Claude Code

Elegir un modelo es donde se deciden los ahorros reales. El patrón inteligente es establecer como predeterminado un modelo abierto fuerte y económico para el trabajo diario y reservar un modelo más caro solo para el razonamiento más complejo. La capacidad está realmente ahí: en SWE-Bench Pro, los modelos abiertos líderes obtienen puntuaciones en los 70 altos frente al 91 de los principales modelos de vanguardia (Codersera, 2026), una brecha real en los problemas más difíciles pero casi irrelevante para el trabajo rutinario de funciones y refactorizaciones.

En una pasarela basada en créditos, cada modelo tiene un multiplicador que asigna el uso de tokens a créditos, por lo que puedes ver el costo relativo de un vistazo. Así es como se comparan algunos modelos de codificación populares:

ID del modeloContextoMultiplicador entradaMultiplicador salidaAhorro aprox. vs oficial
deepseek-ai/deepseek-v4-flash1M0.230.46~50%
deepseek-ai/deepseek-v3.2160K0.420.62~55%
minimaxai/minimax-m2.5200K0.652.18~45%
moonshotai/kimi-k2.6262K1.727.26~45%
zai-org/glm-5.1200K2.547.99~45%

Fuente: Reglas de crédito del Plan de Codificación de Atlas Cloud. Costo de crédito = tokens de entrada × multiplicador de entrada + tokens de salida × multiplicador de salida.

Una opción predeterminada práctica para la mayoría de los desarrolladores: ejecuta GLM-5.1 o Kimi K2.6 para codificación interactiva, baja a DeepSeek V4 Flash para trabajos masivos o en segundo plano, y solo recurre a un modelo de vanguardia para la tarea ocasional que realmente bloquee al modelo abierto.

Una configuración, muchas herramientas: más allá de Claude Code

El mismo endpoint que impulsa tu configuración de API de terceros para Claude Code no se limita a Claude Code. La mayoría de los desarrolladores ejecutan más de un agente: Codex en la terminal, Cursor en el editor, OpenClaw u OpenCode a un lado. Apuntar cada uno a un proveedor diferente significa hacer malabares con claves y facturas separadas. Apuntarlos todos a una única URL base compatible con OpenAI reduce eso a un conjunto de créditos y un solo lugar para cambiar de modelo.

Para Codex, el equivalente de la configuración de Claude Code vive en ~/.codex/config.toml:

plaintext
1model_provider = "atlas_coding_plan"
2model = "zai-org/glm-5.1"
3
4[model_providers.atlas_coding_plan]
5name = "atlascloud"
6base_url = "https://api.atlascloud.ai/v1"
7wire_api = "chat"
8requires_openai_auth = true

Tu clave va en ~/.codex/auth.json como OPENAI_API_KEY. OpenClaw, OpenCode, Cursor y los clientes estilo Copilot aceptan la misma URL base https://api.atlascloud.ai/v1 con el protocolo compatible con OpenAI. Ten en cuenta la diferencia que vale la pena recordar: Claude Code usa la URL base https://api.atlascloud.ai, mientras que las herramientas compatibles con OpenAI usan la ruta /v1.

Consolidar de esta manera también soluciona la presupuestación. Los planes que renuevan una asignación de crédito diaria fija a medianoche ponen un techo estructural a un bucle de agentes fuera de control, y los paquetes de pago por uso absorben el pico ocasional. Si superas un nivel a mitad del ciclo, las actualizaciones prorrateadas cobran solo la diferencia en lugar de un plan nuevo.

Errores comunes en la configuración de la API de terceros para Claude Code que debes evitar

La mayoría de las configuraciones fallidas se deben a un pequeño puñado de errores, y casi todos están en la cadena de configuración en lugar de ser algo profundo.

Ruta de URL base incorrecta. El error más común. Claude Code y las herramientas compatibles con OpenAI a menudo esperan rutas diferentes del mismo proveedor. Si Claude Code lanza un error de conexión, verifica si tu endpoint debe o no llevar el sufijo /v1.

Usar tu clave de Anthropic por error. El ANTHROPIC_AUTH_TOKEN debe ser la clave del proveedor de terceros, no tu clave de Anthropic. No son intercambiables, y reutilizar la incorrecta produce un error de autenticación que parece más misterioso de lo que es.

Olvidar las variables de modelo en segundo plano. Si solo configuras ANTHROPIC_MODEL pero dejas que los valores predeterminados de Haiku y Sonnet apunten a modelos de Anthropic no disponibles, las pequeñas llamadas en segundo plano de Claude Code pueden fallar. Configura los tres con un modelo que tu endpoint realmente sirva.

Asumir que cada función se transfiere perfectamente. Los modelos de terceros manejan bien el bucle de codificación central, pero los extras específicos del proveedor y los comportamientos de los modelos más nuevos pueden diferir del valor predeterminado de Anthropic. Comienza con una tarea rutinaria para confirmar los conceptos básicos antes de confiar en algo crítico.

Preguntas frecuentes sobre la configuración de la API de terceros para Claude Code

¿Es difícil realizar una configuración de API de terceros para Claude Code?

No. El caso básico es una sola edición en ~/.claude/settings.json con tres o cuatro variables de entorno, y toma unos cinco minutos. No necesitas un proxy o script contenedor a menos que quieras cambiar de modelo durante la sesión, lo cual es una opción avanzada en lugar de un requisito.

¿Cuánto puede ahorrar realmente una configuración de API de terceros para Claude Code?

Depende del modelo que elijas, pero la diferencia de precio es grande. DeepSeek V4 Flash cuesta cerca de $0.14 por millón de tokens de entrada frente a varios dólares de los modelos de vanguardia (Codersera, 2026), por lo que dirigir la mayor parte del trabajo rutinario a un modelo abierto suele reducir la factura por token en un 70% o más sin cambiar tu forma de programar.

¿Qué modelo debo usar después de configurar mi API de terceros para Claude Code?

Para la codificación interactiva, un modelo general sólido como GLM-5.1 o Kimi K2.6 es una buena opción predeterminada. Para trabajos de alto volumen o en segundo plano donde la latencia importa menos, un modelo más barato como DeepSeek V4 Flash tiene sentido. Mantén un modelo de vanguardia en espera solo para la tarea ocasional que un modelo abierto no pueda resolver.

¿Funcionará cada característica después de configurar la API de terceros para Claude Code?

El bucle de codificación agéntica central funciona bien, ya que se basa en la API de mensajes estándar que implementan los endpoints compatibles. Algunas funciones específicas del proveedor o los comportamientos más nuevos específicos del modelo pueden diferir del valor predeterminado de Anthropic, por lo que vale la pena probar con una tarea de bajo riesgo primero.

¿Tengo que deshacer la configuración para volver a Anthropic?

No. Mantén tu clave de Anthropic a mano y simplemente restaura el ANTHROPIC_BASE_URL original (o elimina la anulación) en settings.json para que Claude Code vuelva a apuntar a Anthropic. Muchos desarrolladores mantienen ambas configuraciones y cambian según la tarea en cuestión.

Conclusión

Una configuración de API de terceros para Claude Code es uno de los cambios de cinco minutos de mayor impacto que un desarrollador puede hacer en 2026. La herramienta sigue siendo exactamente la misma, pero el backend y la factura no. Dirige ANTHROPIC_BASE_URL a un endpoint compatible con Anthropic, elige un modelo de pesos abiertos que se ajuste al trabajo y mantendrás el flujo de trabajo de Claude Code que ya conoces mientras pagas una fracción de los precios de los modelos de vanguardia. Si quieres tener todo bajo una misma clave y un presupuesto que también cubra Codex, OpenClaw y el resto, puedes configurarlo a través de la consola del Plan de Codificación de Atlas Cloud y cambiar de modelo en cualquier momento modificando una sola línea.

Modelos recientes

Una sola API para toda la IA multimedia.

Explorar Todos los Modelos

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.