코딩 에이전트 커스텀 API 치트시트: 토큰 비용을 절감하는 복사-붙여넣기용 설정 가이드

Claude Code, OpenClaw, Codex, OpenCode 및 Cursor에서 더 저렴한 모델을 몇 분 만에 실행할 수 있도록 복사-붙여넣기 설정이 포함된 코딩 에이전트 커스텀 API 치트시트입니다.

모든 인기 있는 코딩 에이전트는 내부 모델을 교체할 수 있도록 지원하지만, 각기 다른 파일, 다른 키 이름, 다른 URL 형식 속에 설정을 숨겨두고 있습니다. 이 때문에 사람들은 설정을 포기하고 비싼 최첨단(frontier) 모델 비용을 계속 지불하게 됩니다. 실제로 헤비 에이전트 사용자는 기본 모델 사용 시 개발자 1인당 하루 평균 약 $13를 소비합니다(CloudZero, 2026). 이 페이지는 이러한 문제를 해결합니다. Claude Code, OpenClaw, Codex, OpenCode, Cursor에 대한 정확한 커스텀 API 설정과 도구 간의 유일한 차이점을 한눈에 볼 수 있는 통합 가이드입니다. 이 페이지를 즐겨찾기에 추가하세요. 군더더기 없이 복사-붙여넣기 가능한 코드 블록과 주의사항만 담았습니다. 이 가이드를 통해 몇 분 안에 모든 에이전트를 더 저렴한 모델로 연결할 수 있으며, 왜 도구마다 URL 형식이 다른지 명확히 이해하게 될 것입니다.

핵심 요약

  • 코딩 에이전트는 두 개의 프로토콜 계열로 나뉩니다. Claude Code는 Anthropic API를, OpenClaw, Codex, OpenCode, Cursor는 OpenAI 호환 API를 사용합니다.
  • 실무적인 구분법은 URL입니다. OpenAI 호환 도구는 /v1 접미사가 필요하지만, Claude Code는 그렇지 않습니다.
  • 모든 설정에는 베이스 URL, API 키, 모델 ID라는 동일한 세 가지 요소가 필요합니다. 필드 이름만 바뀔 뿐입니다.
  • 오픈 웨이트 모델이 핵심입니다. DeepSeek V4 Flash는 100만 입력 토큰당 약 $0.14 수준으로, 최첨단 모델의 수 달러 비용보다 훨씬 저렴합니다(Codersera, 2026).

코딩 에이전트 커스텀 API 치트시트가 필요한 이유

이 작업을 하는 이유는 비용 때문이며, 그 원인은 구조적입니다. 에이전트는 추론 단계마다 누적된 컨텍스트를 반복해서 전송하므로, 동일한 작업을 수행하는 일반 채팅 창보다 10배에서 100배 더 많은 토큰을 소모합니다(LeanOps, 2026). 이 배수 차이가 에이전트 비용을 폭등시키는 주범이며, 에이전트 사용을 줄이는 대신 토큰 단가를 재조정하는 것이 훨씬 효과적인 해결책입니다. 커스텀 API를 사용하면 업무 방식을 바꾸지 않고도 더 저렴한 백엔드로 에이전트를 연결할 수 있습니다. 일상적인 코딩 업무를 오픈 웨이트 모델로 라우팅하면 품질 저하는 최소화하면서 토큰당 비용을 70% 이상 대폭 절감할 수 있습니다. 이 치트시트가 중요한 이유는 절감 효과는 확실하지만, 설정 과정의 복잡함("어떤 파일, 어떤 필드, 어떤 URL인가")이 대부분의 사람을 가로막기 때문입니다.

코딩 에이전트 커스텀 API 치트시트 작동 방식

설정법을 알아보기 전에, 모든 설정을 이해하게 해줄 단 하나의 핵심 개념이 있습니다. 코딩 에이전트는 두 개의 프로토콜 계열로 나뉘며, 어떤 계열에 속하느냐에 따라 설정 방식이 결정됩니다. Claude Code는 Anthropic Messages API와 통신하므로 ANTHROPIC_BASE_URL에서 백엔드를 읽고 Anthropic 방식의 토큰으로 인증합니다. 이 치트시트에 포함된 나머지 도구들(OpenClaw, Codex, OpenCode, Cursor)은 OpenAI 호환 Chat Completions API와 통신하므로 baseURL, OpenAI 스타일 키가 필요하며 엔드포인트에 /v1 경로를 포함해야 합니다. 이 /v1 디테일이 설정이 이유 없이 실패하는 가장 흔한 원인입니다. 이 차이만 이해하면, 아래의 모든 설정은 이름만 바뀔 뿐 동일한 세 가지 값(베이스 URL, 키, 모델 ID)으로 구성됩니다. 예시에서는 단일 계정으로 두 프로토콜 계열을 모두 지원하는 Atlas Cloud를 사용합니다. 따라서 키를 새로 발급받을 필요 없이 구문만 변경하면 됩니다. 모든 호환 제공업체도 같은 방식으로 작동하므로 베이스 URL과 키만 바꿔주면 됩니다. Claude Code와 OpenAI 호환 도구의 두 프로토콜 계열 비교 차트

코딩 에이전트 커스텀 API 치트시트: 도구별 설정

먼저 요약표를 확인한 후, 각 도구별 전체 설정 블록을 확인하세요. 시작하기 전에 API 키를 준비해 두세요. Atlas Cloud의 경우 키 유형으로 Coding Plan을 선택하여 크레딧 기반 코딩 할당량에 연결해야 합니다.

도구설정 위치베이스 URL프로토콜
Claude Code~/.claude/settings.jsonhttps://api.atlascloud.aiAnthropic 호환
OpenClaw~/.openclaw/openclaw.json 또는 openclaw onboardhttps:​//api.atlascloud.ai/v1OpenAI 호환
Codex~/.codex/config.toml + auth.jsonhttps:​//api.atlascloud.ai/v1OpenAI 호환
OpenCode~/.config/opencode/opencode.jsonhttps:​//api.atlascloud.ai/v1OpenAI 호환
Cursor설정(Settings), 모델(Models), 커스텀 베이스 URLhttps:​//api.atlascloud.ai/v1OpenAI 호환

Claude Code

Claude Code는 Anthropic 계열의 예외적인 도구이므로 베이스 URL에 /v1이 포함되지 않음을 주의하세요. macOS/Linux는 ~/.claude/settings.json을, Windows는 %USERPROFILE%.claude\settings.json을 수정합니다.

plaintext
1{
2  "env": {
3    "ANTHROPIC_AUTH_TOKEN": "your-atlas-api-key",
4    "ANTHROPIC_BASE_URL": "https://api.atlascloud.ai",
5    "ANTHROPIC_MODEL": "zai-org/glm-5.1",
6    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "zai-org/glm-5.1",
7    "ANTHROPIC_DEFAULT_SONNET_MODEL": "zai-org/glm-5.1",
8    "CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS": "1"
9  }
10}

Haiku와 Sonnet 기본값을 동일한 모델로 설정하면 Claude Code가 내부적으로 수행하는 작은 호출들도 해당 모델로 라우팅되어 오류를 방지할 수 있습니다.

OpenClaw

OpenClaw는 마법사(wizard) 기능을 제공하여 가장 설정하기 쉽습니다. 터미널에서 openclaw onboard를 실행한 후 Yes, QuickStart, Custom Provider를 차례로 선택하세요. 베이스 URL로 https:​//api.atlascloud.ai/v1을 입력하고, 키와 모델 ID를 붙여넣은 뒤 OpenAI-compatible 프로토콜을 선택합니다. Verification successful 메시지가 뜨면 엔드포인트 이름을 지정하여 완료합니다. ~/.openclaw/openclaw.json을 직접 수정할 경우 주의사항: OpenClaw는 2단계 설정이 필요합니다. 먼저 models.providers 아래에 공급자를 정의한 다음, agents.defaults.models에 provider-name/model-name 키를 사용하여 모델을 허용 목록(allowlist)에 추가해야 합니다(OpenClaw docs, 2026). 이를 누락하는 것이 "model not allowed" 오류의 주원인입니다. 마법사를 사용하면 이 두 단계를 자동으로 처리하므로 마법사를 사용하는 것을 권장합니다.

Codex

Codex는 두 개의 파일을 사용합니다. 먼저 ~/.codex/config.toml에 공급자를 설정합니다:

plaintext
1model_provider = "atlas_coding_plan"
2model = "zai-org/glm-5.1"
3
4[model_providers.atlas_coding_plan]
5name = "atlascloud"
6base_url = "https://api.atlascloud.ai/v1"
7wire_api = "chat"
8requires_openai_auth = true

그 다음 ~/.codex/auth.json에 키를 넣습니다:

plaintext
1{ "OPENAI_API_KEY": "your-atlas-api-key" }

터미널에서 codex를 실행하고 업데이트 프롬프트를 건너뛰면 연결이 완료됩니다.

OpenCode 및 Cursor

OpenCode는 ~/.config/opencode/opencode.json (Windows의 경우 \Users\사용자이름.config\opencode\opencode.json)을 읽습니다:

plaintext
1{
2  "$schema": "https://opencode.ai/config.json",
3  "provider": {
4    "atlascloud": {
5      "npm": "@ai-sdk/openai-compatible",
6      "name": "atlascloud",
7      "options": {
8        "baseURL": "https://api.atlascloud.ai/v1",
9        "apiKey": "your-atlas-api-key"
10      },
11      "models": {
12        "zai-org/glm-5.1": { "name": "glm-5.1" }
13      }
14    }
15  }
16}

Cursor는 별도의 설정 파일이 없습니다. 설정(Settings) > **모델(Models)**로 이동하여 모델 ID를 직접 추가하고, 커스텀 OpenAI 베이스 URL에 https:​//api.atlascloud.ai/v1을 입력한 뒤 키를 붙여넣으세요. Cursor는 OpenAI 호환 패턴을 따르므로 다른 도구와 동일한 베이스 URL과 키가 그대로 작동합니다.

모델 선택: 코딩 에이전트 비용 절감의 핵심

엔드포인트 연결은 시작일 뿐이며, 어떤 모델을 선택하느냐가 실제 비용을 결정합니다. 일상적인 코딩에는 성능이 좋고 저렴한 오픈 모델을 사용하고, 가장 어려운 추론 작업에만 최첨단 모델을 아껴 쓰는 방식이 가장 효과적입니다. 성능 격차는 가격 격차보다 훨씬 작습니다. SWE-Bench Pro 기준, 상위 오픈 모델들은 70점대 후반의 점수를 기록하며 최첨단 모델(약 91점)과 비교했을 때 일반적인 기능 구현이나 리팩토링 작업에서는 차이를 체감하기 어렵습니다(Codersera, 2026). AI 서비스 비용 및 기능 비교 차트 크레딧 기반 제공업체에서는 각 모델별로 토큰 사용량을 크레딧으로 변환하는 승수(multiplier)가 있어 상대적 비용을 쉽게 파악할 수 있습니다:

모델 ID컨텍스트입력 승수출력 승수공식 모델 대비 예상 절감액
deepseek-ai/deepseek-v4-flash1M0.230.46~50%
deepseek-ai/deepseek-v3.2160K0.420.62~55%
minimaxai/minimax-m2.5200K0.652.18~45%
moonshotai/kimi-k2.6262K1.727.26~45%
zai-org/glm-5.1200K2.547.99~45%
출처: Atlas Cloud Coding Plan 크레딧 규칙. 크레딧 비용 = 입력 토큰 × 입력 승수 + 출력 토큰 × 출력 승수.    
실무적인 기본 설정: 대화형 코딩에는 GLM-5.1 또는 Kimi K2.6, 대용량 작업이나 백그라운드 작업에는 DeepSeek V4 Flash를 추천합니다. 최첨단 모델은 오픈 모델이 해결하지 못하는 아주 드문 경우에만 사용하세요. 위 설정 파일에서 모델 ID만 한 줄 바꾸는 것만으로도 즉시 전환이 가능합니다.    

모든 코딩 에이전트에 하나의 API 키 사용하기

치트시트 표에서 볼 수 있듯, 모든 설정에서 동일한 키와 모델 ID를 사용할 수 있습니다. 이것이 통합 제공업체를 선택해야 하는 진정한 이유입니다. 도구마다 다른 업체를 사용하면 키, 대시보드, 청구서가 모두 분산되어 전체 지출을 관리하기 어렵습니다. 하나의 제공업체로 통일하면 크레딧 풀을 통합하고 모델 전환도 한곳에서 관리할 수 있습니다. 또한 토큰 기반 과금 체계에서 매우 어려운 예산 관리가 쉬워집니다. 매일 고정 크레딧을 제공하는 요금제는 에이전트 루프 오류로 인한 비용 폭주를 방지해주고, 종량제 패키지는 갑작스러운 수요 급증을 유연하게 처리합니다. Atlas Cloud의 요금제는 월 $10부터 시작하며, 종량제 패키지는 41% 할인을 제공합니다. 또한 중간에 요금제를 업그레이드해도 차액만 지불하면 되므로 부담이 없습니다.

코딩 에이전트 커스텀 API 치트시트: 흔한 실수

대부분의 설정 실패는 다음 사례 중 하나입니다. 모두 쉽게 해결할 수 있습니다. /v1 혼동. 가장 빈번한 오류입니다. OpenAI 호환 도구는 /v1 접미사가 필요하지만 Claude Code는 안 됩니다. 연결 오류가 발생한다면 해당 도구의 프로토콜 계열에 맞는 경로인지 확인하세요. 잘못된 키 유형 사용. 제공업체 키와 Anthropic 키는 별개입니다. 잘못된 키를 사용하면 매우 혼란스러운 인증 오류 메시지가 뜹니다. OpenClaw 허용 목록(allowlist) 누락. 공급자 정의는 설정의 절반일 뿐입니다. "model not allowed" 오류가 보인다면 모델이 허용 목록에 없거나 provider-name/model-name에 오타가 있는지 확인하세요. Claude Code에서 백그라운드 모델 설정 누락. 메인 모델만 설정하고 Haiku와 Sonnet 기본값을 사용할 수 없는 모델로 두면 내부 호출에서 실패가 발생합니다. 세 가지 모두 설정하세요.

FAQ

이 치트시트를 사용하려면 도구를 바꿔야 하나요?

아니요. 핵심은 현재 사용하는 Claude Code, OpenClaw, Codex, OpenCode, Cursor를 그대로 유지하는 것입니다. 커스텀 API 설정은 마이그레이션이 아니라 환경 설정 변경이므로 업무 방식은 그대로 유지하면서 백엔드와 비용만 변경됩니다.

왜 도구마다 베이스 URL이 다른가요?

프로토콜 계열 때문입니다. Claude Code는 Anthropic API를 사용하므로 도메인만 입력하지만, OpenAI 호환 도구는 /v1 경로가 필요합니다. 같은 제공업체, 같은 키를 사용하더라도 경로만 다를 수 있습니다. 이 작은 차이가 설정 실패의 주원인입니다.

얼마나 절감할 수 있나요?

모델에 따라 다릅니다. DeepSeek V4 Flash는 100만 입력 토큰당 약 $0.14 수준으로, 최첨단 모델보다 훨씬 저렴합니다. 일상 업무를 오픈 모델로 돌리면 작업 방식 변경 없이도 토큰 비용을 70% 이상 절감할 수 있습니다.

어떤 모델부터 시작해야 할까요?

대화형 코딩에는 GLM-5.1이나 Kimi K2.6을, 대용량 작업에는 DeepSeek V4 Flash를 추천합니다. 최첨단 모델은 오픈 모델이 실패할 때를 대비해 아껴두세요.

설정을 되돌릴 수 있나요?

네. 각 설정은 언제든 되돌릴 수 있습니다. 원래의 베이스 URL로 복구하거나 공급자 블록을 제거하면 원래의 기본값으로 돌아갑니다. 많은 개발자들이 작업의 성격에 따라 설정을 전환하며 사용합니다.

결론

이 치트시트를 보관해야 하는 이유는 개념 자체가 어려워서가 아니라, 도구마다 다른 설정 파일과 URL 형식을 기억하기 어렵기 때문입니다. 프로토콜 계열만 이해하면 모든 설정은 동일한 베이스 URL, 키, 모델 ID를 다른 구문으로 입력하는 것뿐입니다. 오픈 웨이트 모델을 선택하고, 올바른 블록을 붙여넣고, /v1 규칙만 주의하세요. 이제 좋아하는 에이전트를 그대로 사용하면서 훨씬 낮은 비용으로 개발할 수 있습니다. 모든 도구에 하나의 키와 예산을 통합하고 싶다면 Atlas Cloud Coding Plan 콘솔에서 설정하고 필요에 따라 모델을 자유롭게 변경하세요.

최신 모델

하나의 API로 모든 미디어 AI를.

모든 모델 탐색

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.