Claude CodeサードパーティAPI設定:GLM、Kimi、DeepSeekを低コストで実行する方法

Claude CodeのサードパーティAPI設定実践ガイド。GLM、Kimi、DeepSeekといった安価なオープンモデルをClaude Codeで利用するための設定方法を5分以内に解説します。

Claude Codeは現在最も優れたエージェント型コーディングツールの一つですが、その一方で大規模運用には最もコストがかかるツールでもあります。ヘビーユーザーの場合、標準API経由で1日あたり13ドル(USD13.00)に達することもあります(CloudZero, 2026)。しかし、ほとんどの人が見落としている重要なポイントがあります。それは、Claude Codeを動かしているモデルは入れ替え可能だということです。環境変数を一つ設定するだけで、GLM、Kimi、DeepSeekといったはるかに安価なオープンウェイトモデルなど、別のバックエンドに対しても全く同じClaude Codeの操作感で利用できます。

本ガイドでは、Claude CodeでサードパーティAPIを設定するための、簡潔で実用的な手順を解説します。リダイレクトの仕組み、コピー&ペースト可能な設定ファイル、モデルの選び方、そして正常に接続できているかの確認方法を学習します。所要時間はわずか5分程度で、初日からコスト削減の効果を実感できるはずです。

重要なポイント

  • Claude Codeは環境変数 ANTHROPIC_BASE_URL からバックエンドを読み取るため、アプリ自体に触れることなく、Anthropic互換のエンドポイントにデフォルト設定を置き換えることができます(Claude Code docs, 2026)。
  • 設定は ~/.claude/settings.json を1箇所編集するだけで完了し、基本的なケースであればプロキシやラッパーのスクリプトは不要です。
  • オープンウェイトモデルを活用すれば、トークンあたりのコストを劇的に抑えられます。例えばDeepSeek V4 Flashは、入力トークン100万あたりUSD0.14程度で利用でき、最先端モデルの数ドルというコストと比べて非常に経済的です(Codersera, 2026)。
  • 複数のモデルを一つのエンドポイントに集約するゲートウェイを利用すれば、5つの異なるベンダーで個別にキーを再登録することなく、1行書き換えるだけでモデルを切り替えられます。

なぜClaude CodeでサードパーティAPIを設定するのか

その理由は単純明快で「コスト」です。エージェント型ツールであるClaude Codeは、推論のステップごとに蓄積されたコンテキストを再送信するため、同じ作業量でもチャットウィンドウに比べて10倍から100倍のトークンを消費します(LeanOps, 2026)。このトークン倍率が、一つの複雑なタスクで簡単に数ドルのコストがかかってしまう理由であり、エンジニア一人あたり月額数百ドルという高額な請求が発生する原因です。

Claude CodeのサードパーティAPI設定は、この請求の源である「トークン単価」を直接攻撃します。編集、リファクタリング、テスト実行のたびに最先端モデルの料金を支払うのではなく、その大半の処理を、わずかなコストで利用できるオープンウェイトモデルにルーティングします。日常的なコーディングにおいて、品質の差は価格の差ほど大きくはありません。この設定の目的はClaude Codeを捨てることではなく、使い慣れたツールを維持しつつ、オープンモデル並みの価格でトークンを利用することにあります。

もう一つの重要な理由は「アクセス制限の回避」です。Anthropicが直接サービスを提供していない地域にいる開発者にとっても、サードパーティのエンドポイントを利用することで、単一ベンダーの請求体系や可用性に依存することなく、安定してClaude Codeを利用できます。

Claude CodeサードパーティAPI設定の仕組み

設定に移る前に、これを可能にするメカニズムを理解しておきましょう。Claude CodeはAnthropicのサーバーをハードコードしているわけではありません。起動時にいくつかの環境変数を読み取りますが、その中で重要なのが ANTHROPIC_BASE_URL です。デフォルトではAnthropicのAPIを指していますが、これを変更すれば、Claude Codeが行うすべてのリクエストが新しいアドレスへと送信されます(Claude Code docs, 2026)。

これを機能させるには、サードパーティ側のエンドポイントがClaude Codeの期待するプロトコル、つまりAnthropic Messages API形式に対応している必要があります。そのため、OpenAIの生のエンドポイントを直接指定することはできません。プロバイダー側が「Anthropic互換のURL」を提供している必要があります。現在多くのモデルプロバイダーがそのようなエンドポイントを公開しており、複数のオープンモデルを集約するゲートウェイが翻訳処理を行うことで、GLM、Kimi、DeepSeekのいずれもClaude Codeが理解できる形式で応答できるようになっています。

以下の3つの変数が主要な役割を果たします:

  • ANTHROPIC_BASE_URL: Claude Codeがリクエストを送信する場所。
  • ANTHROPIC_AUTH_TOKEN: そのエンドポイント用のAPIキー(Anthropicのキーではありません)。
  • ANTHROPIC_MODEL: エンドポイントで動作させるモデル名。

アプリが単にURLを指定されたクライアントに過ぎないと理解できれば、残りの作業は機械的な設定に過ぎません。

Claude CodeサードパーティAPI設定:ステップバイステップ

以下は本ガイドの核心部分です。ここでは Atlas Cloud を例に解説します。同サービスは主要なオープンウェイトモデルをフロントに置いたAnthropic互換エンドポイントを提供しており、設定が簡潔になるほか、後からモデルを変更する際も再設定が不要だからです。どの互換プロバイダーであっても手順は同じで、ベースURLとキーが異なるだけです。

ステップ1:APIキーとベースURLの取得

このステップの完了時、エンドポイントURLとキーの2つが手元にある状態にします。

  1. 選択したプロバイダーでアカウントを作成し、APIキーセクションを開きます。
  2. コーディングまたはエージェント利用にスコープを絞ったキーを生成します。Atlas Cloudの場合、キー作成時に「Coding Plan」を選択することで、一般的な従量課金ではなくクレジットベースのコーディング枠に紐付けることができます。
  3. キーを安全な場所にコピーし、ベースURLを記録します。Claude Code専用として、Atlas Cloudでは https://api.atlascloud.ai を使用します(Claude Codeエンドポイントには /v1 サフィックスが不要である点に注意してください。これがよくある失敗の要因です)。

ステップ2:settings.jsonの編集

このステップにより、Claude Codeが新しいバックエンドに向くようになります。OSごとの設定ファイルを開きます:

  • macOS / Linux: ~/.claude/settings.json
  • Windows: %USERPROFILE%\.claude\settings.json

以下を貼り付け、your-atlas-api-key の部分を実際のキーに置き換えます:

plaintext
1{
2  "env": {
3    "ANTHROPIC_AUTH_TOKEN": "your-atlas-api-key",
4    "ANTHROPIC_BASE_URL": "https://api.atlascloud.ai",
5    "ANTHROPIC_MODEL": "zai-org/glm-5.1",
6    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "zai-org/glm-5.1",
7    "ANTHROPIC_DEFAULT_SONNET_MODEL": "zai-org/glm-5.1",
8    "CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS": "1"
9  }
10}

混乱を防ぐための重要なポイント:ANTHROPIC_DEFAULT_HAIKU_MODEL と ANTHROPIC_DEFAULT_SONNET_MODEL に同じモデルを指定することで、Claude Codeのバックグラウンドタスク(要約などの小さな処理)も選択したモデルにルーティングされ、利用不可のデフォルト設定で失敗するのを防げます。

ステップ3:目的に合ったモデルを選ぶ

このステップの完了時、適切なデフォルトモデルが設定されます。ANTHROPIC_MODEL の値は、プロバイダーが認識するモデルID文字列です。集約型エンドポイントを利用している場合、変更は1行だけです。今日なら zai-org/glm-5.1、明日なら moonshotai/kimi-k2.6、あるいは大量のバックグラウンド処理には deepseek-ai/deepseek-v4-flash と設定してClaude Codeを再起動するだけです。新しいキーの取得や設定ブロックの書き換えは不要です。

ステップ4:設定の検証

最後に正常に動作しているかを確認します。任意のプロジェクトでターミナルを開き、以下を実行します:

plaintext
1claude

次に、ファイルを説明させたり、1行の関数を書かせたりするような簡単なタスクを依頼してみてください。正常に応答があればリダイレクトは成功しており、サードパーティモデルにリクエストが届いています。認証エラーが出る場合はキーが間違っているか、不要なスペースが含まれている可能性があります。接続エラーが出る場合は、ベースURL(特に使用するツールにとって /v1 が必要か不要か)を再確認してください。

サードパーティAPI設定におけるモデル選択

どのモデルを選ぶかで、コスト削減の幅が決まります。賢い運用方法として、日常業務には強力で安価なオープンモデルをデフォルトにし、非常に複雑な推論が必要な時だけ高価なモデルを使うのが良いでしょう。能力差は実際にはわずかです。SWE-Bench Proにおいて、主要なオープンモデルは70点台後半を記録しており、最先端モデルの約91点には及びませんが、ルーチン的な機能実装やリファクタリングにおいてはこの差はほとんど無視できます(Codersera, 2026)。

クレジットベースのゲートウェイでは、各モデルにトークン使用量をクレジットに変換する倍率が設定されているため、相対的なコストを一目で比較できます。主要なコーディングモデルの比較は以下の通りです:

モデルIDコンテキスト入力倍率出力倍率公式比での概算削減率
deepseek-ai/deepseek-v4-flash1M0.230.46約50%
deepseek-ai/deepseek-v3.2160K0.420.62約55%
minimaxai/minimax-m2.5200K0.652.18約45%
moonshotai/kimi-k2.6262K1.727.26約45%
zai-org/glm-5.1200K2.547.99約45%

出典: Atlas Cloud Coding Plan クレジットルール。クレジットコスト = 入力トークン × 入力倍率 + 出力トークン × 出力倍率。

多くの開発者にとって実用的なデフォルトは、インタラクティブなコーディングには GLM-5.1 や Kimi K2.6 を使い、大量の処理やバックグラウンドジョブには DeepSeek V4 Flash を利用し、オープンモデルでは太刀打ちできないタスクが発生した時だけ最先端モデルに切り替える運用です。

Claude Codeを超えて:一つの設定で多くのツールを統合

Claude CodeサードパーティAPI設定を支えるエンドポイントは、Claude Codeだけで使うものではありません。多くの開発者は、ターミナルのCodex、エディタのCursor、OpenClawやOpenCodeなど、複数のエージェントを併用しています。それぞれを異なるベンダーに向けると、個別のキーや請求書に振り回されることになります。すべてを単一のOpenAI互換ベースURLに向けることで、クレジットプールが一つにまとまり、モデルの切り替え場所も一箇所に集約されます。

Codexの場合、Claude Codeの設定に相当するものは ~/.codex/config.toml にあります:

plaintext
1model_provider = "atlas_coding_plan"
2model = "zai-org/glm-5.1"
3
4[model_providers.atlas_coding_plan]
5name = "atlascloud"
6base_url = "https://api.atlascloud.ai/v1"
7wire_api = "chat"
8requires_openai_auth = true

キーは ~/.codex/auth.json に OPENAI_API_KEY として記述します。OpenClaw、OpenCode、Cursor、Copilot系クライアントはすべて、同じ https://api.atlascloud.ai/v1 ベースURLをOpenAI互換プロトコルで使用します。重要な違いとして、Claude Codeは /v1 なしの https://api.atlascloud.ai を使用するのに対し、OpenAI互換ツールは /v1 パスを使用する点に注意してください。

このような統合は予算管理も改善します。1日のクレジット上限が決まっているプランなら、エージェントが暴走してもコストに天井を設けることができます。もし途中で枠が足りなくなれば、残日数に応じたアップグレード料金を支払うだけで済みます。

よくある失敗と回避策

設定の失敗のほとんどは、些細なミスに起因しており、根深い問題ではありません。

ベースURLパスの誤り。最も多いミスです。Claude CodeとOpenAI互換ツールは、同じプロバイダーでも異なるパスを期待することがあります。Claude Codeで接続エラーが出た場合、エンドポイントに /v1 が必要かどうかを確認してください。

Anthropicキーを誤って使用している。ANTHROPIC_AUTH_TOKEN は、サードパーティプロバイダーのキーである必要があります。これらは互換性がないため、間違ったキーを使用すると不可解な認証エラーが発生します。

バックグラウンドモデル変数の設定忘れ。ANTHROPIC_MODEL だけを設定し、HaikuやSonnetのデフォルトが利用できないAnthropicモデルを指したままだと、小さなバックグラウンド呼び出しで失敗する可能性があります。3つすべてを、エンドポイントが実際に提供しているモデルに設定してください。

すべての機能が完璧に移植されると思い込む。サードパーティモデルは中核となるコーディングループをうまくこなしますが、プロバイダー独自の拡張機能や、最新のモデル固有の動作はAnthropicのデフォルトと異なる場合があります。重要なタスクに使う前に、ルーチンワークで動作を確認することをお勧めします。

よくある質問

Claude CodeのサードパーティAPI設定は難しいですか?

いいえ。基本的なケースであれば、~/.claude/settings.json に環境変数を3〜4行追記するだけであり、5分程度で完了します。セッション中にモデルを切り替えたいといった上級者向けの要件がない限り、プロキシやラッパーは不要です。

実際にどれくらいコストを節約できますか?

選択するモデルによりますが、価格差は大きいです。DeepSeek V4 Flashは、入力トークン100万あたりUSD0.14程度で利用でき、最先端モデルの数ドルと比較すると圧倒的に安価です。ルーチンワークの大半をオープンモデルにルーティングすれば、コーディングスタイルを変えることなく、トークン料金を70%以上削減できることは珍しくありません。

設定後、どのモデルを使うべきですか?

インタラクティブなコーディングには、GLM-5.1やKimi K2.6のような強力な汎用モデルをデフォルトにするのが適しています。大量の処理やレイテンシが重要でないバックグラウンドジョブには、DeepSeek V4 Flashが理にかなっています。最先端モデルは、オープンモデルでは解決できないタスクが発生した時のために温存しておくのが良いでしょう。

設定後にすべての機能が動作しますか?

コアとなるエージェントコーディングループは、互換エンドポイントで実装されている標準のMessages APIに依存しているため、問題なく動作します。ただし、プロバイダー独自の機能や特定のモデルの挙動は異なる可能性があるため、まずは低リスクなタスクでテストすることをお勧めします。

Anthropicに戻す場合、設定を解除する必要がありますか?

いいえ。Anthropicのキーを手元に置いておき、settings.json の ANTHROPIC_BASE_URL を元に戻す(あるいはオーバーライドを削除する)だけでClaude CodeをAnthropicに戻せます。多くの開発者は両方の設定を保持し、タスクに応じて切り替えています。

結論

Claude CodeのサードパーティAPI設定は、2026年において開発者が行える最も費用対効果の高い5分間の変更です。ツールそのものは何も変わらず、バックエンドと請求額だけが改善されます。ANTHROPIC_BASE_URL をAnthropic互換のエンドポイントに向け、作業に適したオープンウェイトモデルを選ぶだけで、使い慣れたワークフローを維持しながら最先端モデル価格の何分の一かで運用できます。CodexやOpenClawなども含めて一つのキーと予算で管理したい場合は、Atlas Cloud Coding Planコンソール から設定を行い、1行書き換えるだけでいつでもモデルを切り替えられます。

最新モデル

ひとつのAPIで、あらゆるメディアAIを。

すべてのモデルを探索

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.