O Claude Code é uma das melhores ferramentas de codificação baseadas em agentes disponíveis, mas também é uma das mais caras de operar em escala, com usuários intensivos atingindo USD13 por dia de desenvolvedor ativo na API padrão (CloudZero, 2026). Aqui está o que a maioria das pessoas não percebe: o modelo que impulsiona o Claude Code é substituível. Com uma única variável de ambiente, você pode direcionar a mesma experiência do Claude Code para um backend diferente, incluindo modelos de pesos abertos muito mais baratos, como GLM, Kimi e DeepSeek.
Este guia é um passo a passo completo e direto sobre a configuração de uma API de terceiros para o Claude Code. Você aprenderá como o redirecionamento realmente funciona, a configuração exata para copiar e colar, como escolher um modelo e como verificar se tudo está conectado corretamente. O processo todo leva cerca de cinco minutos e a economia aparece já no primeiro dia.
Principais pontos
- O Claude Code lê seu backend a partir da variável de ambiente ANTHROPIC_BASE_URL, portanto, qualquer endpoint compatível com Anthropic pode substituir o padrão sem tocar no aplicativo em si (Documentação do Claude Code, 2026).
- A configuração é uma simples edição em ~/.claude/settings.json; nenhum proxy ou script wrapper é necessário para o caso básico.
- Modelos de pesos abertos reduzem drasticamente o custo por token: o DeepSeek V4 Flash custa cerca de USD0,14 por milhão de tokens de entrada, contra vários dólares dos modelos de fronteira (Codersera, 2026).
- Usar um gateway que agrega vários modelos atrás de um único endpoint significa que você troca de modelo alterando apenas uma linha, em vez de registrar chaves novamente em cinco fornecedores diferentes.
Por que se preocupar com uma configuração de API de terceiros para o Claude Code?
A resposta honesta é custo, e os números não são sutis. Ferramentas baseadas em agentes como o Claude Code reenviam o contexto acumulado a cada etapa de raciocínio, então elas consomem de 10 a 100 vezes mais tokens do que uma janela de chat para a mesma quantidade de trabalho (LeanOps, 2026). Esse multiplicador de tokens é exatamente o motivo pelo qual uma única tarefa complexa pode silenciosamente custar vários dólares, e por que as equipes veem contas mensais subindo para centenas de dólares por engenheiro.
Uma configuração de API de terceiros para o Claude Code ataca essa conta na fonte: o preço por token. Em vez de pagar taxas de modelos de fronteira por cada edição, refatoração e execução de teste, você direciona a maior parte desse trabalho para um modelo de pesos abertos que custa uma fração do valor. Na codificação de rotina, a lacuna de qualidade é muito menor do que a diferença de preço. O objetivo da configuração não é abandonar o Claude Code, mas manter a ferramenta que você gosta enquanto paga preços de modelos abertos pelos tokens.
Existe uma segunda razão que importa para qualquer pessoa fora das regiões que a Anthropic atende diretamente: o acesso. Um endpoint de terceiros oferece aos desenvolvedores uma maneira estável e compatível de usar o Claude Code sem depender do faturamento ou da disponibilidade de um único fornecedor.

Como funciona a configuração de API de terceiros para o Claude Code
Antes de colar qualquer configuração, é útil entender o mecanismo que torna tudo isso possível. O Claude Code não codifica os servidores da Anthropic de forma rígida. Na inicialização, ele lê algumas variáveis de ambiente, e a mais importante é a ANTHROPIC_BASE_URL. Por padrão, ela aponta para a API da Anthropic. Altere-a e todas as solicitações que o Claude Code fizer irão para o novo endereço (Documentação do Claude Code, 2026).
Para que isso funcione, o endpoint de terceiros deve falar o mesmo protocolo que o Claude Code espera, que é o formato da Anthropic Messages API. É por isso que você não pode apontá-lo diretamente para um endpoint da OpenAI puro. O provedor precisa expor uma URL compatível com a Anthropic. Muitos provedores de modelos agora publicam exatamente esse tipo de endpoint, e gateways que agregam vários modelos abertos fazem a tradução para você, de modo que GLM, Kimi ou DeepSeek respondam no formato que o Claude Code entende.
As três variáveis que realizam o trabalho são:
- ANTHROPIC_BASE_URL: para onde o Claude Code envia as solicitações.
- ANTHROPIC_AUTH_TOKEN: a chave de API para esse endpoint, não a sua chave da Anthropic.
- ANTHROPIC_MODEL: qual modelo o endpoint deve executar.
Depois que você internaliza que o aplicativo é apenas um cliente apontado para uma URL, o restante da configuração é mecânico.
Configuração de API de terceiros para o Claude Code: Passo a passo
Este é o cerne do guia. O exemplo abaixo utiliza o Atlas Cloud como provedor, pois ele expõe um único endpoint compatível com a Anthropic que centraliza os principais modelos de pesos abertos, o que mantém a configuração curta e permite trocar de modelo mais tarde sem refazer nada disso. As mesmas etapas se aplicam a qualquer provedor compatível; apenas a URL base e a chave mudam.
Passo 1: Obtenha sua chave de API e URL base
Ao final desta etapa, você terá duas strings: uma URL de endpoint e uma chave.
- Crie uma conta no provedor escolhido e abra a seção de chaves de API.
- Gere uma chave com escopo para codificação ou uso por agentes. No Atlas Cloud, você seleciona Coding Plan como o tipo de chave ao criá-la, o que vincula a chave à cota de codificação baseada em créditos em vez do pagamento conforme o uso geral.
- Copie a chave para um local seguro e anote a URL base. Para o Claude Code especificamente, o Atlas Cloud usa https://api.atlascloud.ai (atenção: sem o sufixo /v1 para o endpoint do Claude Code, que é um ponto de erro comum).

Passo 2: Edite seu settings.json
Ao final desta etapa, o Claude Code será apontado para o novo backend. Abra o arquivo de configuração para o seu SO:
- macOS / Linux: ~/.claude/settings.json
- Windows: %USERPROFILE%.claude\settings.json
Cole o seguinte, substituindo o token pela sua chave real:
plaintext1{ 2 "env": { 3 "ANTHROPIC_AUTH_TOKEN": "your-atlas-api-key", 4 "ANTHROPIC_BASE_URL": "https://api.atlascloud.ai", 5 "ANTHROPIC_MODEL": "zai-org/glm-5.1", 6 "ANTHROPIC_DEFAULT_HAIKU_MODEL": "zai-org/glm-5.1", 7 "ANTHROPIC_DEFAULT_SONNET_MODEL": "zai-org/glm-5.1", 8 "CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS": "1" 9 } 10}
Um detalhe que evita muita confusão: definir ANTHROPIC_DEFAULT_HAIKU_MODEL e ANTHROPIC_DEFAULT_SONNET_MODEL para o mesmo modelo significa que as tarefas de segundo plano do Claude Code (as chamadas pequenas e rápidas que ele faz para coisas como resumir) também são roteadas para o modelo escolhido, em vez de falhar silenciosamente em um padrão indisponível.
Passo 3: Escolha o modelo que se ajusta ao trabalho
Ao final desta etapa, você terá um modelo padrão sensato. O valor ANTHROPIC_MODEL é apenas uma string de identificação de modelo que o provedor reconhece. Com um endpoint de agregação, a troca é uma mudança de uma linha: defina como zai-org/glm-5.1 hoje, moonshotai/kimi-k2.6 amanhã ou deepseek-ai/deepseek-v4-flash para trabalho de alto volume em segundo plano, e reinicie o Claude Code. Sem novas chaves, sem novos blocos de configuração.
Passo 4: Verifique sua configuração de API de terceiros para o Claude Code
Ao final desta etapa, você saberá que funciona. Abra um terminal em qualquer projeto e execute:
plaintext1claude
Em seguida, dê a ele uma tarefa trivial, como pedir para explicar um arquivo ou escrever uma função de uma linha. Se ele responder normalmente, o redirecionamento está ativo e suas solicitações estão indo para o modelo de terceiros. Se você receber um erro de autenticação, a chave está errada ou foi colada com um espaço extra. Se você receber um erro de conexão, verifique novamente a URL base, especialmente a presença ou ausência do sufixo /v1 para sua ferramenta específica.
Escolhendo modelos para sua configuração de API de terceiros para o Claude Code
A escolha do modelo é onde a economia real é decidida. O padrão inteligente é usar um modelo aberto, forte e barato como padrão para o trabalho diário e reservar um modelo mais caro apenas para o raciocínio mais difícil. A capacidade está genuinamente lá: no SWE-Bench Pro, os principais modelos abertos pontuam na casa dos 70, contra aproximadamente 91 dos melhores modelos de fronteira (Codersera, 2026) — uma lacuna real nos problemas mais difíceis, mas quase irrelevante para o trabalho de rotina de funcionalidades e refatorações.
Em um gateway baseado em crédito, cada modelo carrega um multiplicador que mapeia o uso de tokens para créditos, para que você possa ver o custo relativo rapidamente. Veja como alguns modelos de codificação populares se comparam:
| ID do Modelo | Contexto | Multiplicador de Entrada | Multiplicador de Saída | Economia aprox. vs oficial |
|---|---|---|---|---|
| deepseek-ai/deepseek-v4-flash | 1M | 0.23 | 0.46 | ~50% |
| deepseek-ai/deepseek-v3.2 | 160K | 0.42 | 0.62 | ~55% |
| minimaxai/minimax-m2.5 | 200K | 0.65 | 2.18 | ~45% |
| moonshotai/kimi-k2.6 | 262K | 1.72 | 7.26 | ~45% |
| zai-org/glm-5.1 | 200K | 2.54 | 7.99 | ~45% |
Fonte: Regras de crédito do Atlas Cloud Coding Plan. Custo em crédito = tokens de entrada × multiplicador de entrada + tokens de saída × multiplicador de saída.

Um padrão prático para a maioria dos desenvolvedores: execute GLM-5.1 ou Kimi K2.6 para codificação interativa, baixe para o DeepSeek V4 Flash para trabalhos em lote ou em segundo plano, e recorra a um modelo de fronteira apenas na tarefa ocasional que realmente bloqueia o modelo aberto.
Uma configuração, muitas ferramentas: Além do Claude Code
O mesmo endpoint que impulsiona sua configuração de API de terceiros para o Claude Code não se limita apenas a ele. A maioria dos desenvolvedores executa mais de um agente: Codex no terminal, Cursor no editor, OpenClaw ou OpenCode. Apontar cada um para um fornecedor diferente significa lidar com chaves separadas e contas separadas. Apontá-los todos para uma única URL base compatível com OpenAI centraliza tudo em um pool de créditos e um único local para trocar de modelos.
Para o Codex, o equivalente à configuração do Claude Code reside em ~/.codex/config.toml:
plaintext1model_provider = "atlas_coding_plan" 2model = "zai-org/glm-5.1" 3 4[model_providers.atlas_coding_plan] 5name = "atlascloud" 6base_url = "https://api.atlascloud.ai/v1" 7wire_api = "chat" 8requires_openai_auth = true
Sua chave vai em ~/.codex/auth.json como OPENAI_API_KEY. Clientes estilo OpenClaw, OpenCode, Cursor e Copilot usam a mesma URL base https://api.atlascloud.ai/v1 com o protocolo compatível com OpenAI. Note a diferença que vale a pena lembrar: o Claude Code usa o endereço base https://api.atlascloud.ai, enquanto as ferramentas compatíveis com OpenAI usam o caminho /v1.
Consolidar dessa forma também corrige o orçamento. Planos que renovam uma cota diária fixa de créditos à meia-noite colocam um teto estrutural em um loop de agente fora de controle, e pacotes de pagamento conforme o uso absorvem o pico ocasional. Se você ultrapassar um nível no meio do ciclo, as atualizações proporcionais cobram apenas a diferença, em vez de um novo plano.

Erros comuns na configuração de API de terceiros para o Claude Code
A maioria das configurações falhas remonta a um pequeno punhado de erros, e quase todos estão na string de configuração, não em algo profundo.
URL base errada. O erro mais comum. O Claude Code e as ferramentas compatíveis com OpenAI geralmente esperam caminhos diferentes do mesmo provedor. Se o Claude Code exibir um erro de conexão, verifique se seu endpoint deve ou não conter o sufixo /v1.
Usar sua chave da Anthropic por engano. O ANTHROPIC_AUTH_TOKEN deve ser a chave do provedor de terceiros, não a sua chave da Anthropic. Eles não são intercambiáveis, e reutilizar a chave errada produz um erro de autenticação que parece mais misterioso do que realmente é.
Esquecer as variáveis de modelo de segundo plano. Se você definir apenas ANTHROPIC_MODEL, mas deixar os padrões Haiku e Sonnet apontando para modelos da Anthropic indisponíveis, as pequenas chamadas de segundo plano do Claude Code podem falhar. Defina todos os três para um modelo que seu endpoint realmente atende.
Assumir que todos os recursos funcionam perfeitamente. Modelos de terceiros lidam bem com o loop de codificação principal, mas recursos extras específicos do provedor e comportamentos mais recentes dos modelos podem diferir do padrão da Anthropic. Comece com uma tarefa de rotina para confirmar o básico antes de confiar nela para algo crítico.
Perguntas frequentes sobre a configuração de API de terceiros para o Claude Code
É difícil fazer uma configuração de API de terceiros para o Claude Code?
Não. O caso básico é uma única edição em ~/.claude/settings.json com três ou quatro variáveis de ambiente, e leva cerca de cinco minutos. Você não precisa de um proxy ou script wrapper, a menos que queira alternar modelos no meio da sessão, o que é uma opção avançada em vez de um requisito.
Quanto uma configuração de API de terceiros para o Claude Code pode realmente economizar?
Depende do modelo que você escolher, mas a diferença de preço é grande. O DeepSeek V4 Flash custa cerca de USD0,14 por milhão de tokens de entrada contra vários dólares dos modelos de fronteira (Codersera, 2026), portanto, rotear a maior parte do trabalho de rotina para um modelo aberto normalmente corta a conta por token em 70% ou mais sem alterar a forma como você codifica.
Qual modelo devo usar após minha configuração?
Para codificação interativa, um modelo geral forte como o GLM-5.1 ou Kimi K2.6 é um bom padrão. Para trabalhos de alto volume ou em segundo plano onde a latência importa menos, um modelo mais barato como o DeepSeek V4 Flash faz sentido. Mantenha um modelo de fronteira em espera apenas para a tarefa ocasional que um modelo aberto não consegue resolver.
Todos os recursos funcionarão após a configuração?
O loop de codificação principal funciona bem, pois depende da Messages API padrão que endpoints compatíveis implementam. Alguns recursos específicos do provedor ou os comportamentos mais novos dos modelos podem diferir do padrão da Anthropic, por isso vale a pena testar em uma tarefa de baixo risco primeiro.
Preciso desfazer a configuração para voltar à Anthropic?
Não. Mantenha sua chave da Anthropic à mão e simplesmente restaure o ANTHROPIC_BASE_URL original (ou remova a substituição) no settings.json para apontar o Claude Code de volta para a Anthropic. Muitos desenvolvedores mantêm ambas as configurações e alternam com base na tarefa em mãos.
Conclusão
Uma configuração de API de terceiros para o Claude Code é uma das mudanças de cinco minutos de maior impacto que um desenvolvedor pode fazer em 2026. A ferramenta permanece exatamente a mesma, mas o backend e a conta, não. Aponte ANTHROPIC_BASE_URL para um endpoint compatível com Anthropic, escolha um modelo de pesos abertos que se ajuste ao trabalho, e você mantém o fluxo de trabalho do Claude Code que já conhece enquanto paga uma fração dos preços dos modelos de fronteira. Se você quiser tudo sob uma única chave e um único orçamento que também cubra Codex, OpenClaw e outros, você pode configurar tudo pelo console do Atlas Cloud Coding Plan e trocar de modelo a qualquer momento alterando apenas uma linha.






