Z.ai API for Top Open-Source GLM Coding

Z.ai APIは、GLM-4.6からフラッグシップのGLM-5.1まで、ZhipuAIのGLMシリーズ全体をあなたのスタックに提供します。GLM-5.1はSWE-Bench Proでオープンソースモデル中1位にランクされ、自律型コーディングエージェントを何時間も連続して実行できます。GLMは202K tokenのコンテキストと、中国語・英語でバランスの取れた出力を、寛容なMIT licenseのもとで提供します。Atlas Cloudは、OpenAI-compatible key 1つで各モデルを提供し、Day-0 accessと透明性の高いper-call pricingに対応します。今すぐ始めましょう。

Large Language Models by Z.ai

Atlas Cloud では、業界をリードする大規模言語モデルを高速かつ低コストで提供し、チャット・推論・エージェントを大規模に支えます。

すべてのモデルを見る

LLM

GLM

GLM は、Zhipu AI による Z.ai のフラッグシップ LLM シリーズです。GLM API は、エージェント型の GLM-5 から効率的な 357B MoE GLM-4.6 までを幅広くカバーしています。これらのモデルは、自律的なタスク実行、複雑なエージェントオーケストレーション、本番運用レベルのプログラミングに特化しています。Atlas Cloud では、単一の統合 endpoint から GLM ファミリー全体へ Day-0 アクセスでき、従量課金と信頼性の高い本番稼働時間を利用できます。今すぐ構築を始めましょう。

6 モデルGLMを探索

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

Model	Standard Price (USD)	Our Price (USD)	Discount
GLM 5.2	$1.4/$4.4per 1M tokens1048.6K context	$1.26/$3.96M in/outper 1M tokens1048.6K context	-10%	View
GLM 5.1	$1.4/$4.4per 1M tokens202.8K context	$1.26/$3.96M in/outper 1M tokens202.8K context	-10%	View
GLM 5v Turbo	$1.2/$4per 1M tokens202.8K context	$1.2/$4M in/outper 1M tokens202.8K context	—	View
GLM 5	$1/$3.2per 1M tokens202.8K context	$0.95/$3.15M in/outper 1M tokens202.8K context	—	View
GLM 4.7	$0.6/$2.2per 1M tokens202.8K context	$0.52/$1.85M in/outper 1M tokens202.8K context	—	View
GLM 4.6	$0.6/$2.2per 1M tokens202.8K context	$0.6/$2.2M in/outper 1M tokens202.8K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Atlas Cloud で構築できる Z-AI API のユースケース

GLMのモデル階層は、高速なバイリンガルチャットタスクから、数時間におよぶ自律型コーディングエージェントまで、あらゆるものをカバーしています。チームは長期的なエンジニアリング作業にGLM-5.1を使用し、費用対効果と速度が優先される場合にはGLM-4.7またはGLM-5 Turboを使用します。

長期的なデータベースパフォーマンス最適化

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

自律型リポジトリ規模のコードリファクタリング

開発チームは GLM-5.1 を使用して、人間のチェックポイントなしで数時間におよぶ完全なコードベースの変換を実行します。このモデルは最大8時間にわたって継続的に変更の計画、記述、テスト、反復を行い、実演されたゼロからの Linux システム構築では655回の反復を処理しました。これにより、大規模なレガシーコードベースにおける数週間分の手動リファクタリング作業が置き換えられます。

IDEコーディングエージェント統合

開発者ツールチームは、Claude Code、Kilo Code、Cline、Roo Code、OpenCodeにおけるAIコーディングワークフローの基盤モデルとして、GLM-5.1およびGLM-5 Turboを統合しています。Atlas Cloud上のZ-AI APIはOpenAIと互換性があるため、これらのツールをGLM経由でルーティングするために必要な変更はbase URLの置き換えのみです。GLM-5 Turboの262Kコンテキストウィンドウは、IDEワークフローにおける大規模ファイルのコンテキストに特に適しています。

Tier-1サポート問い合わせ自動化

運用チームは GLM-5 を使用してサポートエージェントを構築します。これらのエージェントは、チケットデータベースへのアクセス、ナレッジベースの検索、エスカレーションツールを組み合わせて、人間の介入なしに反復的な問い合わせを処理します。モデルのマルチツール呼び出しとストリーミングのサポートにより、リアルタイムの顧客向け展開に実用的です。バイリンガルサポートにより、同じエージェントが Atlas Cloud 上の単一のモデルエンドポイントから中国語と英語のチケットを処理できます。

大規模なバイリンガル文書生成

コンテンツチームとビジネスチームは、構造化されたプロンプトから中国語と英語の両方でWord文書、PowerPointプレゼンテーション、PDF、Excelレポートを生成するためにGLM-4.7を使用しています。100万入力トークンあたり0.52ドルで、最先端レベルの推論を必要としない大量のドキュメントワークフローにおいて最も費用対効果の高いGLMティアです。202Kのコンテキストウィンドウは、1回の呼び出しでドキュメントの完全なアウトラインとソース資料を保持するのに十分です。

MLワークロードのカーネル最適化

AIインフラストラクチャチームは、GLM-5.1を使用して、機械学習ワークロード上でベンチマーク主導の最適化パイプラインを実行しています。KernelBenchスタイルのタスクにおいて、GLM-5.1はツール主導の最適化サイクルを数千回実行し、幾何平均で3.6倍の高速化を達成します。8時間の連続実行機能により、エージェントはセッション間で手動で再起動することなく、完全な最適化ループを実行できます。

あなたの企業ビジョンを、Atlas Cloud AI で現実に。

営業に問い合わせる

開発者が Z.ai API についてよく尋ねること

Z.ai API は、Zhipu AI としても知られる Z.ai が構築した GLM シリーズの大規模言語モデルに、開発者がプログラムからアクセスできるようにする API です。GLM は General Language Model の略で、GLM-4.6 からフラッグシップの GLM-5.1 までのリリースを含み、コーディング、エージェント型ワークフロー、中国語と英語のバイリンガルな本番利用向けに調整されています。Atlas Cloud では、OpenAI 互換の単一エンドポイントから全ラインアップを利用できます。

Atlas Cloud では、GLM-4.6 からフラッグシップの GLM-5.1 までの GLM シリーズをホストしており、その間に GLM-4.7 と GLM-5 も含まれます。軽量なティアは、日常的な大量タスクを低コストで処理し、GLM-5.1 は最も要求の厳しいコーディングやエージェント型の作業を対象としています。すべてのモデルは同じキーで従量課金により実行できます。

はい。GLM-5.1 を含む GLM のオープンウェイトは MIT ライセンスで公開されており、商用利用、ファインチューニング、再配布が制限なく許可されています。インフラ運用の手間を避けたい場合は、セルフホスティングの代わりに、Atlas Cloud が同じモデルを API として提供し、マネージドに利用できます。

既存の OpenAI SDK の接続先を Atlas Cloud のベース URL に向け、キーを設定し、使用したい GLM モデル名を渡します。Z.ai API は OpenAI 互換のため、多くのプロジェクトはベース URL とモデル文字列を変更するだけで移行でき、モデルは Claude Code、Cline、Roo Code などのエージェントツールに直接組み込めます。今すぐ構築を始めましょう。

中国語と英語はいずれも GLM にとって第一級の対応言語であり、それぞれで高い能力を発揮するように学習されています。どちらの言語でプロンプトしても一貫した品質の応答が得られるため、中国語圏と海外のユーザーにサービスを提供するチームは、別々のスタックを維持するのではなく、単一のモデルラインアップで実用的に運用できます。

GLM-4.6 から GLM-5.1 までは 200K token のコンテキストウィンドウをサポートしており、大規模なコードベース、長いドキュメント、拡張されたエージェントのトレースを単一リクエスト内に収めるのに十分です。ワークフローで長い出力が発生する場合でも、同じウィンドウで大きなコードファイルや複数ステップの実行ログを早期に切り詰めることなく扱えます。

GLM-5.1 は 2026年4月に SWE-Bench Pro で 58.4 のスコアを獲得して首位となり、実世界のコーディングにおける最も強力なオープンソースモデルの一つに位置付けられました。また、単一タスクで最大 8 時間の継続的な自律実行をサポートし、計画、反復、成果物の作成を 1 つのループで実行できるため、Claude Code のような環境での長期的なエージェントワークフローに適しています。

Z.ai API 上のすべての GLM モデルは、透明性の高い従量課金で利用でき、サブスクリプションや月額契約なしに token 単位で課金されます。入力 token と出力 token は別々に計測され、GLM-4.7 などの軽量ティアはフラッグシップの GLM-5.1 よりも token あたりのコストが低いため、予算に合わせてモデルを選択できます。現在の token あたりの料金は、Atlas Cloud の各モデルカードで確認してください。

さらにファミリーを探索

Seedance 2.0

Seedance 2.0 APIは、ByteDanceのマルチモーダルビデオモデルへのプロダクションアクセスを提供します。これには、クアッドモーダル入力（テキスト、画像、ビデオ、オーディオ）と、ショット間で構図、カメラワーク、キャラクターのアクションを固定する業界最高水準の「Universal Reference」システムが含まれます。1回のAPIコールでディレクターレベルの制御を統合でき、一律$0.09/秒、即時キー発行、順番待ちリストなしで利用可能です。これらはエンタープライズクラスの稼働率とコンプライアンスによって裏付けられています。Seedance 2.0 Native 4Kが提供開始されました！

ファミリーを表示

GPT Image 2

GPT Image 2 API は、GPT Image 1.5 の後継となる OpenAI の最新画像モデルへのアクセスを開発者に提供します。ラテン文字およびCJKスクリプト全体で正確なテキストレンダリングを使用して画像を生成および編集できるほか、ポスター、モックアップ、インフォグラフィック向けの強力なコンポジション（構図）機能を備えています。Atlas Cloud では、300以上のモデルと並んで1つの統合 API を通じてアクセスでき、無料クレジット、99.99% のアップタイムが提供され、OpenAI の組織検証は不要です。

ファミリーを表示

Seedream 5.0 Pro

Seedream 5.0 Pro API は、開発者に Atlas Cloud 上で ByteDance の制御可能な画像編集モデルを提供します。アンカーと座標を使用して編集を正確に配置し、画像を編集可能なレイヤーに分離し、複数の参照を融合し、正確な色と素材を一致させ、2K および 3K での多言語テキストをサポートします。Atlas Cloud では、単一のキーでアクセスできます！

ファミリーを表示

Gemini Omni Flash

Gemini Omni API は、Google I/O 2026 で発表された Google DeepMind のマルチモーダル動画生成・編集モデルを、あなたのスタックで利用可能にします。Gemini Omni は Gemini の推論エンジンと生成メディアを融合し、テキスト・画像・動画・音声を自由に組み合わせた入力から、一貫性があり知識に裏付けられた出力を生成します。自然な対話で結果を磨き上げましょう。オブジェクトの差し替え、シーンの書き換え、スタイルの変更を行っても、物理法則、キャラクター、連続性はそのまま保たれます。Atlas Cloud は、テキストからの動画生成、最大 7 枚の参照画像に対応した画像からの動画生成、そして参照ベースの動画生成という Gemini Omni Flash の全ラインアップを、単一の統合 API で提供します。料金は $0.112 からの秒単位の透明な従量課金で、サブスクリプションは不要です。今すぐ開発を始めましょう。

ファミリーを表示

Grok Imagine

Grok Imagine API は、開発者に xAI の画像、動画、音声生成を1つのスイートで提供します。多言語テキストレンダリングを備えた最大 2K の画像に加え、ネイティブで同期された音声とリファレンスベースの編集を備えた最大15秒の動画を生成します。Atlas Cloud 上では、1つのキーで Grok Imagine のすべてのモードを実行できるため、個別の設定なしで画像、動画、音声の間を移行できます。料金は画像1枚あたり0.02ドル、1秒あたり0.05ドルからです。

ファミリーを表示

Google

Googleの最も強力なクリエイティブモデルはすべてAtlas Cloudで利用可能です。Veo 3.1はシネマティックな動画生成を実現し、Nano Banana 2は高忠実度な画像作成を強化し、Geminiはあらゆるワークフローにマルチモーダルなインテリジェンスをもたらします。Day-0の可用性と従量課金制（pay-as-you-go）の料金体系を備えた単一のAPI keyを通じて、Googleモデルスイート全体にアクセスできます。

ファミリーを表示

Seedance 2.0 Mini

Seedance 2.0 Mini は、速度とコストが最も重視されるワークフローに ByteDance のマルチモーダル動画生成をもたらします。より軽量なフットプリントで Seedance 2.0 のコア機能を提供し、より高速な生成、動画あたりのコスト削減、そしてすでに使用しているものと同じ API 統合を実現します。大容量のパイプラインを運用したり、大規模なプロトタイピングを行ったりするチームにとって、Mini は実用的なデフォルトの選択肢です。

ファミリーを表示

ByteDance

シネマティックな動画生成から高忠実度の画像作成まで、ByteDanceの最も強力なモデルがAtlas Cloudで利用可能になりました。最低水準の推論価格とゼロのインフラストラクチャオーバーヘッドで、SeedanceとSeedreamを大規模に実行できます。

ファミリーを表示

Alibaba

Atlas Cloudは、Alibabaの全モデルラインナップを単一のAPIに統合します。言語および画像タスク用のQwen、最大1080pの動画生成用のWanが利用可能です。すべてのモデルはサブスクリプション不要の従量課金制（pay-as-you-go）でアクセスできます。Alibaba APIは、既存のOpenAI互換クライアントを使用し、単一のベースURLを介して利用可能です。

ファミリーを表示

OpenAI

Atlas Cloudは、画像生成用のGPT Image 2から動画用のSora 2まで、OpenAI APIの全ラインナップへのアクセスを提供します。すべてのモデルは、月額の固定コミットメントなしの従量課金制でご利用いただけます。OpenAI互換APIを使用し、ベースURLを一つ変更するだけで簡単に組み込むことができます。

ファミリーを表示

xAI

Atlas Cloud 上で xAI API を使用して、完全な画像および動画パイプラインを構築します。2K解像度での生成、参照画像を使用した編集、そして画像を音声同期クリップへとアニメーション化することが可能です。

ファミリーを表示

Kwaivgi

Kwaivgi APIを標準価格より15%オフで提供。Atlas Cloudは、新しいKlingリリースへのDay-0アクセスを、従量課金制（Pay-as-you-go）およびシート数無制限で提供します。1つのアカウント、1つのキーで、スタンダードからマスター階層まで、すべてのKlingモデルをご利用いただけます。

ファミリーを表示