Z.ai API for Top Open-Source GLM Coding

Z.ai API 將 ZhipuAI 完整的 GLM 系列帶入你的技術堆疊，從 GLM-4.6 到旗艦 GLM-5.1；其中 GLM-5.1 在 SWE-Bench Pro 開源模型中排名第一，並可讓自主編碼代理連續運行數小時。GLM 結合 202K token 上下文，在寬鬆的 MIT 授權下提供中英文均衡輸出。Atlas Cloud 透過一組 OpenAI-compatible 金鑰提供各模型服務，支援 Day-0 存取，並採透明的按次呼叫計價。立即開始。

Large Language Models by Z.ai

在 Atlas Cloud 上，藉助領先的大型語言模型，以高速且實惠的方式驅動對話、推理與智慧代理的大規模應用。

查看全部模型

LLM

GLM

GLM 是 Zhipu AI 旗下 Z.ai 的旗艦 LLM 系列，而 GLM API 涵蓋從具備代理能力的 GLM-5 到高效率的 357B MoE GLM-4.6。這些模型專精於自主任務執行、複雜代理編排，以及生產級程式開發。在 Atlas Cloud 上，單一統一端點即可讓你在 Day-0 存取整個 GLM 系列，並享有按用量計費與可靠的生產環境正常運行時間。立即開始建置。

6 個模型探索 GLM

Z.ai 模型 API 价格明细

对比 Z.ai 全部模型的标准价、平台价与折扣。

模型	标准价 (USD)	平台价 (USD)	折扣
GLM 5.2	$1.4/$4.4每 100 万 tokens1048.6K 上下文	$1.26/$3.96M 输入/输出每 100 万 tokens1048.6K 上下文	-10%	查看
GLM 5.1	$1.4/$4.4每 100 万 tokens202.8K 上下文	$1.26/$3.96M 输入/输出每 100 万 tokens202.8K 上下文	-10%	查看
GLM 5v Turbo	$1.2/$4每 100 万 tokens202.8K 上下文	$1.2/$4M 输入/输出每 100 万 tokens202.8K 上下文	—	查看
GLM 5	$1/$3.2每 100 万 tokens202.8K 上下文	$0.95/$3.15M 输入/输出每 100 万 tokens202.8K 上下文	—	查看
GLM 4.7	$0.6/$2.2每 100 万 tokens202.8K 上下文	$0.52/$1.85M 输入/输出每 100 万 tokens202.8K 上下文	—	查看
GLM 4.6	$0.6/$2.2每 100 万 tokens202.8K 上下文	$0.6/$2.2M 输入/输出每 100 万 tokens202.8K 上下文	—	查看

探索其他厂商的模型

在 Atlas Playground 中即刻探索并体验 400+ 生产可用模型，一键开始定制。

xAI

您可以在 Atlas Cloud 上建置的 Z-AI API 應用案例

GLM 的模型層級涵蓋了從快速雙語聊天任務到長達數小時的自主編程智能體等各個方面。團隊可以使用 GLM-5.1 進行長週期的工程工作，而在優先考慮成本效益和速度時，則使用 GLM-4.7 或 GLM-5 Turbo。

長期資料庫效能最佳化

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

自主式倉庫級程式碼重構

開發團隊使用 GLM-5.1 執行跨越數小時的完整程式碼庫改造，期間無需人工檢查點。該模型可連續規劃、編寫、測試和迭代變更長達8小時，在展示的從零開始建置 Linux 系統過程中處理了655次迭代。這取代了在大型遺留程式碼庫上長達數週的手動重構工作。

IDE 程式碼智能體整合

開發者工具團隊將 GLM-5.1 和 GLM-5 Turbo 作為 Claude Code、Kilo Code、Cline、Roo Code 和 OpenCode 中 AI 程式設計工作流程的底層模型進行整合。Atlas Cloud 上的 Z-AI API 相容於 OpenAI，因此只需更換 base URL 即可將這些工具的請求路由至 GLM。GLM-5 Turbo 的 262K 上下文視窗使其特別適合 IDE 工作流程中的大檔案上下文。

一級支援查詢自動化

營運團隊使用 GLM-5 建構客服智慧體，這些智慧體結合了工單資料庫存取、知識庫搜尋和升級工具，能夠在無需人工干預的情況下處理重複性查詢。該模型的多工具呼叫和串流支援使其在即時面向客戶的部署中非常實用。雙語支援意味著同一個智慧體可以透過 Atlas Cloud 上的單一模型端點處理中文和英文工單。

大規模雙語文件生成

內容和業務團隊使用 GLM-4.7 透過結構化提示詞產生中英文的 Word 文件、PowerPoint 簡報、PDF 和 Excel 報告。其價格為每百萬輸入 token 0.52 美元，是處理無需前沿級別推理的高吞吐量文件工作流程最具成本效益的 GLM 層級。202K 的上下文視窗足以在單次呼叫中容納完整的文件大綱和來源材料。

ML工作負載核心最佳化

AI基礎架構團隊使用 GLM-5.1 在機器學習工作負載上執行基準驅動的優化流水線。在 KernelBench 風格的任務中，GLM-5.1 執行數以千計的工具驅動優化週期，並實現3.6倍的幾何平均加速。8小時持續執行的能力意味著該智能體可以執行完整的優化循環，而無需在會話之間進行手動重啟。

用 Atlas Cloud AI，讓企業願景照進現實。

聯繫銷售

開發者常問的 Z.ai API 問題

Z.ai API 讓開發者能以程式化方式存取由 Z.ai（亦即 Zhipu AI）打造的 GLM 系列大型語言模型。GLM 代表 General Language Model，涵蓋從 GLM-4.6 到旗艦版 GLM-5.1 的多個版本，並針對程式開發、代理式工作流程，以及中英雙語的生產環境使用進行調校。在 Atlas Cloud 上，你可以透過單一 OpenAI 相容端點存取完整模型陣容。

Atlas Cloud 託管從 GLM-4.6 到旗艦版 GLM-5.1 的 GLM 系列模型，中間包含 GLM-4.7 和 GLM-5。較輕量的級別可用較低成本處理高流量的日常任務，而 GLM-5.1 則面向最嚴苛的程式開發與代理式工作。所有模型都可使用同一把金鑰按用量付費執行。

是。GLM 的開放權重（包括 GLM-5.1）以 MIT license 發布，允許商業使用、微調與再散布，且不受限制。如果你想省去基礎架構的負擔，Atlas Cloud 也會透過 API 提供相同模型的託管存取，無需自行託管。

將你現有的 OpenAI SDK 指向 Atlas Cloud base URL，設定你的金鑰，並傳入想使用的 GLM model name。由於 Z.ai API 相容 OpenAI，大多數專案只要更改 base URL 和 model string 就能完成遷移，而且這些模型可直接接入 Claude Code、Cline、Roo Code 等代理工具。立即開始建置。

中文和英文都是 GLM 的一等支援語言，模型經過訓練，在兩種語言上都具備出色能力。你可以用任一語言提示並獲得一致的品質，讓團隊能用單一模型服務中文與國際使用者，而不必維護不同的技術堆疊。

GLM-4.6 到 GLM-5.1 支援 200K token context window，足以在單一請求中容納大型程式碼庫、長篇文件或延伸的代理執行軌跡。如果你的工作流程會產生長輸出，同一個視窗也能涵蓋大型程式碼檔案與多步驟執行記錄，不會過早截斷。

GLM-5.1 於 2026 年 4 月在 SWE-Bench Pro 以 58.4 分登頂，躋身最強的開源真實世界程式開發模型之列。它也支援在單一任務上最長八小時的連續自主執行，能在同一個迴圈中完成規劃、迭代與交付，適合 Claude Code 等環境中的長期代理工作流程。

Z.ai API 上的每個 GLM 模型都採透明的按用量付費計價，依 token 計費，沒有訂閱或月費承諾。輸入與輸出 token 會分開計量，而 GLM-4.7 等較輕量級別的每 token 成本低於旗艦版 GLM-5.1，因此你可以依預算選擇合適的模型。請在 Atlas Cloud 的各模型卡上查看最新的每 token 費率。

探索更多系列

Seedance 2.0

Seedance 2.0 API 為您提供 ByteDance 多模態影片模型的生產級存取權限——支援四模態輸入（文字、影像、影片、音訊），以及業界領先的「Universal Reference」（通用參考）系統，可在不同鏡頭間鎖定構圖、運鏡與角色動作。只需一次 API 呼叫即可整合導演級控制，固定費率為 $0.09/秒，即時取得金鑰，無需排隊——由企業級正常運行時間與合規性提供保障。Seedance 2.0 原生 4K 現已上線！

檢視系列

GPT Image 2

GPT Image 2 API 為開發者提供了訪問 OpenAI 最新圖像模型的途徑，它是 GPT Image 1.5 的繼任者。該模型可生成和編輯圖像，能夠在拉丁和 CJK 文字上實現準確的文本渲染，並在海報、樣機和資訊圖表方面具備強大的排版能力。在 Atlas Cloud 上，您可以透過一個統一的 API 與 300 多個模型一起訪問它，並享受免費額度、99.99% 的正常運行時間，且無需 OpenAI 組織驗證。

檢視系列

Seedream 5.0 Pro

Seedream 5.0 Pro API 為開發者在 Atlas Cloud 上提供了字節跳動的可控圖像編輯模型。它透過錨點和座標精確定位編輯，將圖像分離為可編輯圖層，融合多個參考，並精準匹配顏色和材質，支援 2K 和 3K 解析度的多語言文本。在 Atlas Cloud 上，您只需一個金鑰即可存取！

檢視系列

Gemini Omni Flash

Gemini Omni API 將 Google DeepMind 於 Google I/O 2026 發表的多模態影片生成與編輯模型帶進你的技術棧。Gemini Omni 將 Gemini 的推理引擎與生成式媒體融合，可接受文字、圖片、影片與音訊的任意組合輸入，產生一致且以知識為根據的輸出。透過自然對話持續打磨成果：替換物件、改寫場景、切換風格，同時維持物理規律、角色與畫面連貫性不變。Atlas Cloud 透過單一整合 API 提供完整的 Gemini Omni Flash 系列——文字生成影片、支援最多 7 張參考圖片的圖片生成影片，以及參考圖生成影片——採每秒計費、價格透明，$0.112 起，無需訂閱。立即開始打造。

檢視系列

Grok Imagine

Grok Imagine API 為開發者提供 xAI 的圖像、影片和音訊生成一站式套件。它可以生成解析度高達 2K 且支援多語言文本渲染的圖像，以及長達 15 秒且帶有原生同步音訊和基於參考圖像編輯功能的影片。在 Atlas Cloud 上，只需一個金鑰即可執行每個 Grok Imagine 模式，因此您可以在圖像、影片和音訊之間無縫切換，無需單獨設定，每張圖像 0.02 美元起，每秒 0.05 美元起。

檢視系列

Google

Google最強大的創意模型現已在Atlas Cloud上全面可用。Veo 3.1提供電影等級的影片生成，Nano Banana 2支援高保真圖像建立，而Gemini為每個工作流程帶來多模態智慧。透過單一API key即可存取完整的Google模型套件，提供Day-0可用性和隨用隨付（pay-as-you-go）定價。

檢視系列

Seedance 2.0 Mini

Seedance 2.0 Mini 將 ByteDance 的多模態影片生成技術引入到對速度和成本要求極高的工作流程中。它以更輕量的佔用空間提供 Seedance 2.0 的核心能力——更快的生成速度、更低的單支影片成本，並且使用您現有的同款 API 整合。對於運行高吞吐量流水線或進行大規模原型設計的團隊來說，Mini 是最實用的預設選擇。

檢視系列

ByteDance

從電影級影片生成到高保真影像建立，ByteDance 最強大的模型現已在 Atlas Cloud 上線。以最低的推論定價和零基礎設施開銷，大規模執行 Seedance 和 Seedream。

檢視系列

Alibaba

Atlas Cloud 將 Alibaba 的全系模型陣容整合至同一個 API 中：Qwen 適用於語言和圖像任務，Wan 適用於高達 1080p 的影片生成。所有模型均採用按需付費模式，無需訂閱。您可以使用現有的 OpenAI 兼容客戶端，透過單一的 base URL 存取 Alibaba API。

檢視系列