Cada agente de codificação popular permite trocar o modelo que o sustenta, mas cada um esconde a configuração em um arquivo diferente, com um nome de chave diferente e um formato de URL distinto. Por isso, as pessoas desistem e continuam pagando preços de modelos de fronteira, mesmo que usuários intensivos de agentes cheguem a cerca de USD13 por dia de desenvolvedor ativo em modelos padrão (CloudZero, 2026). Esta página resolve isso. É uma referência única com a configuração exata de API personalizada para Claude Code, OpenClaw, Codex, OpenCode e Cursor, além da distinção única que explica todas as diferenças entre eles. Marque esta página, pois o valor aqui são os blocos de copiar e colar e as pegadinhas, não o preenchimento. Ao final, você será capaz de apontar qualquer um desses agentes para um modelo mais barato em poucos minutos, e entenderá por que a URL muda de uma ferramenta para outra.
Principais pontos
- Agentes de codificação se dividem em duas famílias de protocolo. O Claude Code utiliza a API da Anthropic; OpenClaw, Codex, OpenCode e Cursor utilizam a API compatível com OpenAI.
- A diferença prática é a URL: as ferramentas compatíveis com OpenAI exigem um sufixo /v1, e o Claude Code não.
- Toda configuração precisa das mesmas três coisas: uma URL base, uma chave de API e um ID de modelo. Apenas os nomes dos campos mudam.
- Modelos de pesos abertos (open-weight) são a recompensa: o DeepSeek V4 Flash custa cerca de USD0.14 por milhão de tokens de entrada, comparado a vários dólares dos modelos de fronteira (Codersera, 2026).
Por que uma "folha de dicas" de API personalizada para agentes de codificação se paga
O motivo para se preocupar é o custo, e a causa é estrutural. Os agentes reenviam seu contexto acumulado a cada passo de raciocínio, então eles consomem de 10 a 100 vezes mais tokens do que uma janela de chat para a mesma tarefa (LeanOps, 2026). Esse multiplicador é o motivo pelo qual as contas dos agentes disparam, e também é o motivo pelo qual reprecificar os tokens, em vez de usar menos o agente, é a estratégia que realmente funciona. Uma API personalizada aponta seu agente para um backend mais barato sem mudar a forma como você trabalha. Direcione a codificação de rotina para um modelo de pesos abertos e o custo por token cai drasticamente, muitas vezes em 70% ou mais, enquanto a diferença de qualidade em tarefas diárias permanece pequena. Uma folha de dicas de API personalizada para agentes de codificação importa porque a economia é real, mas o atrito na configuração é o que detém a maioria das pessoas, e o atrito é quase inteiramente "qual arquivo, qual campo, qual URL".
Como funciona uma entrada na "folha de dicas" de API personalizada
Antes das configurações, aqui está a ideia única que faz tudo fazer sentido. Os agentes de codificação se dividem em duas famílias de protocolo, e a família à qual uma ferramenta pertence decide a forma da sua configuração.
O Claude Code conversa com a API Messages da Anthropic, então ele lê seu backend a partir de ANTHROPIC_BASE_URL e se autentica com um token estilo Anthropic. Todo o resto nesta folha de dicas, OpenClaw, Codex, OpenCode e Cursor, conversa com a API Chat Completions compatível com OpenAI, então eles utilizam uma baseURL, uma chave estilo OpenAI e esperam o caminho /v1 no endpoint. Esse detalhe do /v1 é a razão mais comum para uma configuração falhar silenciosamente.
Assim que você percebe essa divisão, cada entrada abaixo são os mesmos três valores com roupas diferentes: uma URL base, uma chave e um ID de modelo. Os exemplos usam Atlas Cloud como provedor, pois ele atende a ambas as famílias de protocolo a partir de uma única conta, então a única coisa que muda entre as ferramentas é a sintaxe, não a chave que você cola. Qualquer provedor compatível funciona da mesma maneira; basta substituir a URL base e a chave.

A "folha de dicas" de API personalizada, ferramenta por ferramenta
Aqui está a tabela de referência rápida primeiro, seguida pelo bloco de configuração completo para cada ferramenta. Tenha sua chave de API pronta antes de começar. No Atlas Cloud, você cria uma selecionando Coding Plan como o tipo de chave, o que a vincula à cota de codificação baseada em créditos.
| Ferramenta | Local da configuração | URL Base | Protocolo |
|---|---|---|---|
| Claude Code | ~/.claude/settings.json | https://api.atlascloud.ai | Compatível Anthropic |
| OpenClaw | ~/.openclaw/openclaw.json ou openclaw onboard | https://api.atlascloud.ai/v1 | Compatível OpenAI |
| Codex | ~/.codex/config.toml + auth.json | https://api.atlascloud.ai/v1 | Compatível OpenAI |
| OpenCode | ~/.config/opencode/opencode.json | https://api.atlascloud.ai/v1 | Compatível OpenAI |
| Cursor | Configurações, Modelos, URL base personalizada | https://api.atlascloud.ai/v1 | Compatível OpenAI |
Claude Code
O Claude Code é a exceção da família Anthropic, então note que a URL base não possui /v1. Edite ~/.claude/settings.json no macOS ou Linux, ou %USERPROFILE%.claude\settings.json no Windows:
plaintext1{ 2 "env": { 3 "ANTHROPIC_AUTH_TOKEN": "your-atlas-api-key", 4 "ANTHROPIC_BASE_URL": "https://api.atlascloud.ai", 5 "ANTHROPIC_MODEL": "zai-org/glm-5.1", 6 "ANTHROPIC_DEFAULT_HAIKU_MODEL": "zai-org/glm-5.1", 7 "ANTHROPIC_DEFAULT_SONNET_MODEL": "zai-org/glm-5.1", 8 "CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS": "1" 9 } 10}
Definir os padrões Haiku e Sonnet para o mesmo modelo direciona também as chamadas de segundo plano do Claude Code para o seu modelo, em vez de falhar por um padrão indisponível.
OpenClaw
O OpenClaw é o mais fácil porque possui um assistente. No terminal, execute openclaw onboard, depois escolha Yes, QuickStart e Custom Provider. Insira a URL base https://api.atlascloud.ai/v1, cole sua chave, cole o ID do modelo e escolha o protocolo OpenAI-compatible. Quando aparecer Verification successful, dê um nome ao endpoint e pronto. O que saber caso edite ~/.openclaw/openclaw.json manualmente: o OpenClaw é uma configuração de duas etapas. Você define o provedor em models.providers, então deve colocar o modelo na lista de permissões (allowlist) em agents.defaults.models usando a chave provider-name/model-name, caso contrário o agente o rejeitará (OpenClaw docs, 2026). Falhar na allowlist é a principal causa do erro "model not allowed". O assistente faz as duas etapas para você, razão pela qual é o caminho recomendado.
Codex
O Codex usa dois arquivos. Coloque o provedor em ~/.codex/config.toml:
plaintext1model_provider = "atlas_coding_plan" 2model = "zai-org/glm-5.1" 3 4[model_providers.atlas_coding_plan] 5name = "atlascloud" 6base_url = "https://api.atlascloud.ai/v1" 7wire_api = "chat" 8requires_openai_auth = true
Depois, coloque a chave em ~/.codex/auth.json:
plaintext1{ "OPENAI_API_KEY": "your-atlas-api-key" }
Execute codex no seu terminal, pule o prompt de atualização e você estará conectado.
OpenCode e Cursor
O OpenCode lê ~/.config/opencode/opencode.json (no Windows, \Users\seu-usuario.config\opencode\opencode.json):
plaintext1{ 2 "$schema": "https://opencode.ai/config.json", 3 "provider": { 4 "atlascloud": { 5 "npm": "@ai-sdk/openai-compatible", 6 "name": "atlascloud", 7 "options": { 8 "baseURL": "https://api.atlascloud.ai/v1", 9 "apiKey": "your-atlas-api-key" 10 }, 11 "models": { 12 "zai-org/glm-5.1": { "name": "glm-5.1" } 13 } 14 } 15 } 16}
O Cursor não possui arquivo de configuração para isso. Abra Configurações (Settings), vá em Modelos (Models), adicione o ID do seu modelo pelo nome, defina a URL base personalizada da OpenAI como https://api.atlascloud.ai/v1 e cole sua chave. Como o Cursor segue o padrão compatível com OpenAI, a mesma URL base e chave das outras ferramentas funcionam sem alterações.
Escolhendo um modelo: A outra metade da "folha de dicas"
Conectar o endpoint é apenas metade do trabalho. O modelo que você escolhe é o que decide a economia. O padrão que funciona é definir como padrão um modelo aberto forte e barato para a codificação do dia a dia e manter um modelo de fronteira na reserva para o raciocínio mais difícil. A lacuna de capacidade é menor que a lacuna de preço: no SWE-Bench Pro, os principais modelos abertos pontuam na casa dos 70 altos contra cerca de 91 para os melhores modelos de fronteira (Codersera, 2026), o que quase não aparece no trabalho de rotina e refatorações.
Em um provedor baseado em créditos, cada modelo tem um multiplicador que mapeia o uso de tokens para créditos, então o custo relativo é fácil de ler:
| ID do Modelo | Contexto | Mult. entrada | Mult. saída | Economia aprox. vs oficial |
|---|---|---|---|---|
| deepseek-ai/deepseek-v4-flash | 1M | 0.23 | 0.46 | ~50% |
| deepseek-ai/deepseek-v3.2 | 160K | 0.42 | 0.62 | ~55% |
| minimaxai/minimax-m2.5 | 200K | 0.65 | 2.18 | ~45% |
| moonshotai/kimi-k2.6 | 262K | 1.72 | 7.26 | ~45% |
| zai-org/glm-5.1 | 200K | 2.54 | 7.99 | ~45% |
| Fonte: Regras de crédito do Plano de Codificação Atlas Cloud. Custo do crédito = tokens de entrada × mult. entrada + tokens de saída × mult. saída. | ||||
| Um padrão prático: GLM-5.1 ou Kimi K2.6 para codificação interativa, DeepSeek V4 Flash para trabalhos de alto volume ou em segundo plano, e um modelo de fronteira apenas para a tarefa rara que um modelo aberto não consegue resolver. Trocar é uma mudança de uma linha no ID do modelo em qualquer uma das configurações acima. |
Uma chave de API para todos os agentes de codificação
Note o que a tabela da folha de dicas mostra silenciosamente: a mesma chave e os mesmos IDs de modelo aparecem em cada configuração. Esse é o argumento real para um provedor unificado. Se você conectar cada ferramenta a um fornecedor diferente, terminará com chaves separadas, painéis separados e contas separadas, perdendo qualquer visão única dos gastos. Apontar todos eles para um provedor reduz isso a um pool de créditos e um único lugar para trocar modelos. Isso também corrige o orçamento, o que o faturamento medido por token torna genuinamente difícil. Um plano que renova uma franquia diária fixa de créditos à meia-noite limita o dano de um loop de agente descontrolado, enquanto os pacotes pré-pagos absorvem o pico ocasional. Os planos do Atlas Cloud começam em USD10 por mês, seus pacotes pré-pagos carregam um desconto de 41% e atualizações no meio do ciclo são rateadas, então mudar de nível custa apenas a diferença, e não um plano totalmente novo.
"Folha de dicas" de API personalizada: Erros comuns
Quase toda configuração que falha se resume a um desses pontos, e todos são rápidos de corrigir. A confusão do /v1. O erro mais frequente em toda esta folha de dicas. Ferramentas compatíveis com OpenAI querem o sufixo /v1; o Claude Code não. Um erro de conexão geralmente significa que o caminho está errado para a família daquela ferramenta. Usar o tipo de chave errado. Sua chave de provedor não é sua chave da Anthropic, e vice-versa. Colar a chave errada gera um erro de autenticação que parece mais confuso do que realmente é. Pular a allowlist do OpenClaw. Definir o provedor é apenas metade da configuração do OpenClaw. Se você vir "model not allowed", o modelo está faltando na allowlist ou a chave provider-name/model-name tem um erro de digitação. Deixar modelos de segundo plano não definidos no Claude Code. Se você configurar apenas o modelo principal, mas deixar os padrões Haiku e Sonnet apontando para modelos indisponíveis, as pequenas chamadas de segundo plano falharão. Configure todos os três.
FAQ: "Folha de dicas" de API personalizada
Esta folha de dicas exige trocar de ferramentas?
Não. O objetivo é que você mantenha o agente que já usa, seja ele Claude Code, OpenClaw, Codex, OpenCode ou Cursor. Uma API personalizada é uma mudança de configuração, não uma migração, então seu fluxo de trabalho permanece idêntico enquanto o backend e a conta mudam.
Por que a URL base muda por ferramenta?
Por causa da família de protocolo. O Claude Code usa a API da Anthropic e usa o domínio puro, enquanto as ferramentas compatíveis com OpenAI esperam o caminho /v1. Mesmo provedor, mesma chave, caminho diferente. Essa única diferença explica a maioria das configurações falhas.
Quanto uma folha de dicas dessas pode economizar?
Muito, dependendo do modelo. O DeepSeek V4 Flash custa cerca de USD0.14 por milhão de tokens de entrada contra vários dólares dos modelos de fronteira (Codersera, 2026), então enviar trabalho de rotina para um modelo aberto comumente reduz a conta por token em 70% ou mais sem mudar como você codifica.
Com qual modelo devo começar?
Para codificação interativa, GLM-5.1 ou Kimi K2.6 são padrões fortes e acessíveis. Para trabalhos de alto volume ou segundo plano, o DeepSeek V4 Flash é mais barato. Mantenha um modelo de fronteira de prontidão apenas para tarefas que um modelo aberto genuinamente não consegue processar.
Essa configuração é reversível?
Sim. Cada configuração é reversível. Restaure a URL base original ou remova o bloco do provedor, e o agente voltará a apontar para seu padrão. Muitos desenvolvedores mantêm ambas as configurações e alternam com base na tarefa.
Conclusão
A razão pela qual vale a pena manter esta folha de dicas é que a parte difícil nunca foi o conceito, foi lembrar qual arquivo e qual URL cada ferramenta deseja. Uma vez que você vê as duas famílias de protocolo, toda configuração é a mesma URL base, chave e ID de modelo em sintaxe diferente. Escolha um modelo de pesos abertos, cole o bloco correto, atente-se à regra do /v1, e você manterá o agente que gosta pagando uma fração dos preços de fronteira. Se você quer uma chave e um orçamento para todos eles, pode configurar isso através do console do Plano de Codificação Atlas Cloud e trocar de modelos sempre que a tarefa mudar.






