Una clave API, cualquier modelo: enrutamiento multimodelo con una puerta de enlace de API de LLM unificada

Si utilizas flujos de trabajo agentes con Claude Code, Codex u OpenClaw, probablemente hayas notado la brecha entre modelos. DeepSeek V4 Flash es rápido y económico, ideal para llamadas simples de alta frecuencia. DeepSeek V4 Pro y GLM 5.1 gestionan razonamientos complejos y generación de código de forma más fiable. Kimi K2.6 aporta una ventana de contexto de 262K, lo cual es fundamental al trabajar con bases de código grandes. La configuración ideal dirige cada tarea al modelo adecuado de forma automática.

La realidad es más compleja. Cada modelo tiene su propia clave API, su propia URL base y sus peculiaridades de autenticación. Terminas manteniendo cinco archivos de configuración en lugar de uno, y una cantidad sorprendente de tiempo se pierde en incompatibilidades de formato antes de empezar a programar.

Ese es el problema que resuelve una puerta de enlace (gateway) unificada de API de LLM: un único endpoint, una única clave API, y la puerta de enlace gestiona el enrutamiento y la compatibilidad de formatos en el backend. Esta guía cubre el concepto, un marco práctico de enrutamiento de tareas a modelos y la configuración paso a paso para Claude Code, Codex y OpenClaw.

multiple browser with different models.jpg

Puntos clave

Una puerta de enlace de API de LLM unificada enruta las solicitudes a múltiples modelos a través de un único endpoint y una sola clave API.

Asignar tareas al modelo correcto reduce costes significativamente: usa V4 Flash para velocidad, V4 Pro o GLM 5.1 para razonamiento profundo.

El Plan de Programación de Atlas Cloud admite 10 modelos de código abierto entre un 35% y un 55% por debajo de los precios oficiales de la API.

Claude Code, Codex y OpenClaw se conectan cambiando un solo archivo de configuración.

Por qué la gestión de múltiples conexiones API se vuelve inmanejable

Conectarse directamente a las API oficiales de DeepSeek, GLM y Kimi es técnicamente posible, pero es un dolor de cabeza recurrente para los desarrolladores que lo han intentado.

Compatibilidad de formatos. No todos los modelos implementan la especificación de API compatible con OpenAI exactamente de la misma manera. DeepSeek V4 es un buen ejemplo: incluso las notas de integración de DeepSeek advierten que, sin los campos de compatibilidad adecuados, "las conversaciones largas en modo de razonamiento con llamadas a herramientas darán error 400" (DeepSeek API Docs, mayo de 2026). Claude Code fue diseñado en torno al comportamiento específico de Claude, por lo que al sustituirlo por otro modelo, diferencias sutiles en cómo se manejan los parámetros pueden causar fallos. Es el tipo de error que suele aparecer en el peor momento posible.

Proliferación de cuentas. Cada modelo adicional implica una nueva cuenta, un nuevo panel de facturación y una nueva cuota de uso a seguir. Al trabajar con DeepSeek, GLM, MiniMax y Kimi, conciliar costes en cuatro sistemas de facturación diferentes no es trivial.

Reconfiguración de herramientas. Claude Code enruta el tráfico a una puerta de enlace configurando la variable de entorno ANTHROPIC_BASE_URL, y la puerta de enlace también debe reenviar las cabeceras de la solicitud, incluyendo anthropic-beta y anthropic-version, o las funciones dejarán de funcionar (Claude Code LLM Gateway Docs, mayo de 2026). Codex, por el contrario, define proveedores bajo [model_providers.] en ~/.codex/config.toml, donde base_url establece la URL base de la API para el proveedor del modelo (OpenAI Codex Configuration Reference, mayo de 2026). OpenClaw tiene su propio asistente de configuración. Cada vez que quieres probar un modelo nuevo, vuelves a la documentación para averiguar el formato de configuración correcto, y no siempre funciona al primer intento.

Una puerta de enlace de API de LLM unificada consolida esta complejidad en una sola capa. Configúrala una vez y luego cambia de modelo modificando un solo parámetro. La puerta de enlace maneja la traducción de formatos, por lo que tu herramienta no necesita saber qué modelo se está ejecutando debajo.

Qué hace realmente una puerta de enlace de API de LLM unificada

all models in one api.jpg

La puerta de enlace es una capa proxy. Expone un endpoint estándar compatible con OpenAI y, cuando llega una solicitud, la enruta al modelo subyacente correcto basándose en el campo model de la solicitud. Desde el lado del desarrollador, la configuración tiene tres pasos:

Apunta la URL base de tu herramienta a la dirección de la puerta de enlace.
Reemplaza tu clave API por la que emite la puerta de enlace.
Establece el parámetro del modelo al que necesites.

Cambiar de modelo no requiere una cuenta nueva ni modificar código. Es una actualización de configuración de una línea. Para las herramientas de programación, esto tiene un efecto secundario útil: la herramienta no necesita saber nada sobre las peculiaridades del modelo subyacente. Envía una solicitud estándar y la puerta de enlace se encarga de traducirla a algo que el modelo pueda procesar correctamente. Gran parte de la fricción de compatibilidad de las llamadas directas a la API desaparece.

Enrutamiento de tareas al modelo correcto

La verdadera ventaja de una puerta de enlace unificada no es solo una gestión de configuración más limpia. Es que cambiar de modelo se vuelve lo suficientemente barato como para que puedas asignar cada tarea a la mejor herramienta para el trabajo.

Aquí tienes una referencia de enrutamiento práctica basada en los modelos disponibles en el Plan de Programación de Atlas Cloud:

Tipo de tarea	Modelo recomendado	Por qué encaja
Razonamiento complejo, generación de código	deepseek-ai/deepseek-v4-pro	1M de contexto, gran razonamiento
Alta frecuencia, respuestas rápidas	deepseek-ai/deepseek-v4-flash	1M de contexto, tarifa de entrada 0.30
Programación diaria general	zai-org/glm-5.1	200K de contexto, buen todoterreno
Base de código grande, análisis de docs	moonshotai/kimi-k2.6	Ventana de contexto de 262K
Lotes de trabajo sensibles al presupuesto	deepseek-ai/deepseek-v3.2	55% más barato que el oficial, tarifa 0.42
Diálogo multi-turno, salida estructurada	minimaxai/minimax-m2.5	200K de contexto, tarifa 0.64

Una regla general simple: usa Flash o V3.2 para cualquier tarea de alta frecuencia y baja complejidad. Usa V4 Pro o GLM 5.1 cuando la tarea necesite profundidad de razonamiento. Opta por Kimi K2.6 cuando trabajes con documentos largos o una base de código grande donde la ventana de 262K realmente marque la diferencia.

También puedes mezclar modelos dentro de un mismo flujo de trabajo de agentes. Deja que el modelo Flash maneje los pasos intermedios y usa un modelo de nivel Pro para la salida final. Una vez que todo pasa por la misma puerta de enlace, ese tipo de enrutamiento híbrido es sencillo de configurar.

La puerta de enlace unificada preferida: 10 modelos, una clave, 55% más barato

La puerta de enlace unificada en la que se centra esta guía es el Plan de Programación de Atlas Cloud. Actualmente admite diez modelos de código abierto: DeepSeek V4 Pro, DeepSeek V4 Flash, DeepSeek V3.2, Kimi K2.5, Kimi K2.6, GLM 5, GLM 5.1, MiniMax M2.5, MiniMax M2.7 y Qwen 3.6 Plus. Todos utilizan la misma URL base y cambiar entre ellos es un simple cambio de parámetro.

La fijación de precios utiliza un sistema de créditos. Cada solicitud cuesta (tokens de entrada × tarifa de entrada) + (tokens de salida × tarifa de salida). Los ahorros en comparación con la conexión directa oscilan entre el 35% y el 55% dependiendo del modelo:

Modelo	Contexto	Tarifa Entrada	Tarifa Salida	vs. Oficial
deepseek-v3.2	160K	0.42	0.62	55% más barato
qwen3.6-plus	256K+	3.30	9.90	50% más barato
deepseek-v4-flash	1M	0.30	0.60	35% más barato
deepseek-v4-pro	1M	3.73	7.47	35% más barato
kimi-k2.5	262K	1.29	6.44	35% más barato
kimi-k2.6	262K	2.04	8.58	35% más barato
glm-5	200K	2.15	6.86	35% más barato
glm-5.1	200K	3.00	9.44	35% más barato
minimax-m2.5	200K	0.64	2.57	35% más barato
minimax-m2.7	200K	2.79	4.72	35% más barato

Hay dos tipos de planes disponibles. La suscripción mensual te ofrece una asignación diaria de créditos que se reinicia a medianoche, repartida en 30 días. Es la mejor opción si ejecutas agentes de forma constante. El paquete de pago por uso es una compra única de créditos con una validez de 90 días, y puedes acumular varios paquetes. Si mantienes ambos tipos simultáneamente, se consumen primero los créditos mensuales; el saldo de pago por uso se activa cuando se agota tu asignación diaria.

Cabe destacar: el Plan de Programación cubre únicamente modelos de código abierto. No incluye Claude, GPT-4 ni otros modelos de código cerrado de proveedores extranjeros.

Configuración de tus herramientas

Tu clave API se encuentra en la sección de gestión de planes de Atlas Cloud. Una vez que la tengas, los cambios de configuración para cada herramienta son mínimos.

Claude Code

Edita ~/.claude/settings.json (Windows: %USERPROFILE%\.claude\settings.json). Reemplaza atlas-api-key con tu clave real y establece ANTHROPIC_MODEL con el ID de modelo que prefieras:

plaintext
1{
2  "env": {
3    "ANTHROPIC_AUTH_TOKEN": "atlas-api-key",
4    "ANTHROPIC_BASE_URL": "https://api.atlascloud.ai",
5    "ANTHROPIC_MODEL": "zai-org/glm-5.1",
6    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "zai-org/glm-5.1",
7    "ANTHROPIC_DEFAULT_SONNET_MODEL": "zai-org/glm-5.1",
8    "CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS": "1"
9  }
10}

Un detalle importante: la URL base de Claude Code no admite el sufijo /v1. Usa https://api.atlascloud.ai exactamente como se muestra. Añadir /v1 romperá la conexión.

Codex

Codex divide su configuración en dos archivos.

~/.codex/config.toml para los ajustes de proveedor y modelo:

plaintext
1model_provider = "atlas_coding_plan"
2model = "zai-org/glm-5.1"
3
4[model_providers.atlas_coding_plan]
5name = "atlascloud"
6base_url = "https://api.atlascloud.ai/v1"
7wire_api = "chat"
8requires_openai_auth = true

~/.codex/auth.json para la clave API:

plaintext
1{
2  "OPENAI_API_KEY": "atlas-api-key"
3}

Ejecuta codex en tu terminal tras guardar ambos archivos. Omite el aviso de actualización y estarás conectado.

OpenClaw

OpenClaw tiene un flujo de configuración guiado. Inícialo con:

plaintext
1openclaw onboard

Selecciona Yes, luego QuickStart y después Custom Provider. Rellena los datos:

API Base URL: https://api.atlascloud.ai/v1
API Key: tu clave API de Atlas
Model ID: cualquier modelo admitido (por ejemplo, zai-org/glm-5.1), con protocolo establecido en OpenAI-compatible

Si aparece "Verification successful", ya estás dentro.

Si prefieres omitir el asistente, edita el archivo de configuración de OpenClaw en ~/.claude/settings.json directamente:

plaintext
1{
2  "baseUrl": "https://api.atlascloud.ai/v1",
3  "apiKey": "your-atlas-key",
4  "api": "openai-completions",
5  "models": [
6    {
7      "id": "zai-org/glm-5.1",
8      "name": "zai-org/glm-5.1",
9      "contextWindow": 200000,
10      "input": ["text"]
11    }
12  ]
13}

Suscripción mensual o pago por uso: Cómo elegir

La decisión es bastante directa.

La suscripción mensual tiene sentido si utilizas Claude Code o una herramienta similar a diario. Tu asignación diaria se recarga automáticamente a medianoche, por lo que no hay nada que gestionar. También es ligeramente más barata por crédito que un paquete de pago por uso. Solo puedes tener un plan mensual a la vez, pero actualizar a mitad de periodo funciona perfectamente: pagas la diferencia prorrateada según los días restantes y la fecha de expiración se mantiene.

Un paquete de pago por uso es mejor si tu uso es irregular. Quizás realizas un trabajo pesado una semana y luego apenas tocas la API durante las dos siguientes. La ventana de 90 días y la facturación por uso te ofrecen flexibilidad sin compromisos. Puedes acumular varios paquetes si necesitas más margen, y el sistema consume primero el paquete que expire antes.

Si deseas ambos, puedes tenerlos simultáneamente. Los créditos mensuales se consumen primero. Una vez que alcanzas el tope diario, la facturación cambia automáticamente a tu saldo de pago por uso. Nada de lo que se ejecute a mitad de una sesión se detendrá solo porque se haya agotado la asignación diaria.

Preguntas frecuentes

¿Necesito cambiar mi código para usar una puerta de enlace de API de LLM unificada?

No. Mientras tu herramienta admita una URL base y una clave API personalizadas, actualizar el archivo de configuración es todo lo que hace falta. El ID del modelo se envía a través del parámetro de configuración, no mediante la lógica de tu aplicación.

¿Qué diferencia hay entre usar una puerta de enlace y llamar directamente a las API oficiales?

Dos cosas principales: gestión de la compatibilidad y coste. La puerta de enlace normaliza los formatos de solicitud entre modelos, lo que reduce la posibilidad de toparse con peculiaridades específicas de cada modelo. En cuanto a precios, pagas entre un 35% y un 55% menos que las tarifas oficiales. El refresco diario del plan mensual también se adapta bien a cargas de trabajo constantes.

¿Funciona DeepSeek V4 de forma fiable con Claude Code?

La integración directa tiene problemas de compatibilidad conocidos, particularmente con el modo de razonamiento simultáneo y llamadas a herramientas que devuelven errores 400. Hay debates abiertos sobre esto en GitHub. Una puerta de enlace añade una capa de compatibilidad que traduce los formatos de solicitud, lo que reduce (aunque no elimina por completo) ese tipo de problemas.

¿Qué pasa si mi clave API se filtra?

Ve a la sección de gestión de planes en el panel de Atlas Cloud y regenérala. La clave antigua queda invalidada inmediatamente. Actualiza después el archivo de configuración de cada herramienta con la nueva clave.

¿Se ampliará la lista de modelos?

El plan se centra actualmente en modelos de código abierto del ecosistema de IA chino, y la documentación oficial indica que se añadirán más modelos. Para conocer la lista actual, la página del Plan de Programación de Atlas Cloud es la fuente de referencia definitiva.

Los precios, la disponibilidad de modelos y las tasas de crédito reflejan la documentación del Plan de Programación de Atlas Cloud a fecha de mayo de 2026. Consulta la consola oficial para conocer los detalles actuales.

VOLVER A LA LISTA