
Atlas Cloud 透過 Z-AI API 託管完整的 GLM 系列,從 GLM-4.6 到 GLM-5.1。所有模型皆為雙語模型,支援按需付費,並具備 202K 的上下文視窗。
在 Atlas Cloud 上,藉助領先的大型語言模型,以高速且實惠的方式驅動對話、推理與智慧代理的大規模應用。
对比 Z.ai 全部模型的标准价、平台价与折扣。
| 模型 | 标准价 (USD) | 平台价 (USD) | 折扣 | |
|---|---|---|---|---|
| GLM 5.1 | $1.4/$4.4每 100 万 tokens202.8K 上下文 | $1.26/$3.96M 输入/输出每 100 万 tokens202.8K 上下文 | -10% | 查看 |
| GLM 5 Turbo | $1.2/$4每 100 万 tokens262.1K 上下文 | $1.2/$4M 输入/输出每 100 万 tokens262.1K 上下文 | — | 查看 |
| GLM 5 | $1/$3.2每 100 万 tokens202.8K 上下文 | $0.95/$3.15M 输入/输出每 100 万 tokens202.8K 上下文 | — | 查看 |
| GLM 4.7 | $0.6/$2.2每 100 万 tokens202.8K 上下文 | $0.52/$1.85M 输入/输出每 100 万 tokens202.8K 上下文 | — | 查看 |
| GLM 4.6 | $0.6/$2.2每 100 万 tokens202.8K 上下文 | $0.6/$2.2M 输入/输出每 100 万 tokens202.8K 上下文 | — | 查看 |
在 Atlas Playground 中即刻探索并体验 300+ 生产可用模型,一键开始定制。
GLM 的模型層級涵蓋了從快速雙語聊天任務到長達數小時的自主編程智能體等各個方面。團隊可以使用 GLM-5.1 進行長週期的工程工作,而在優先考慮成本效益和速度時,則使用 GLM-4.7 或 GLM-5 Turbo。
Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.
開發團隊使用 GLM-5.1 執行跨越數小時的完整程式碼庫改造,期間無需人工檢查點。該模型可連續規劃、編寫、測試和迭代變更長達8小時,在展示的從零開始建置 Linux 系統過程中處理了655次迭代。這取代了在大型遺留程式碼庫上長達數週的手動重構工作。
開發者工具團隊將 GLM-5.1 和 GLM-5 Turbo 作為 Claude Code、Kilo Code、Cline、Roo Code 和 OpenCode 中 AI 程式設計工作流程的底層模型進行整合。Atlas Cloud 上的 Z-AI API 相容於 OpenAI,因此只需更換 base URL 即可將這些工具的請求路由至 GLM。GLM-5 Turbo 的 262K 上下文視窗使其特別適合 IDE 工作流程中的大檔案上下文。
營運團隊使用 GLM-5 建構客服智慧體,這些智慧體結合了工單資料庫存取、知識庫搜尋和升級工具,能夠在無需人工干預的情況下處理重複性查詢。該模型的多工具呼叫和串流支援使其在即時面向客戶的部署中非常實用。雙語支援意味著同一個智慧體可以透過 Atlas Cloud 上的單一模型端點處理中文和英文工單。
內容和業務團隊使用 GLM-4.7 透過結構化提示詞產生中英文的 Word 文件、PowerPoint 簡報、PDF 和 Excel 報告。其價格為每百萬輸入 token 0.52 美元,是處理無需前沿級別推理的高吞吐量文件工作流程最具成本效益的 GLM 層級。202K 的上下文視窗足以在單次呼叫中容納完整的文件大綱和來源材料。
AI基礎架構團隊使用 GLM-5.1 在機器學習工作負載上執行基準驅動的優化流水線。在 KernelBench 風格的任務中,GLM-5.1 執行數以千計的工具驅動優化週期,並實現3.6倍的幾何平均加速。8小時持續執行的能力意味著該智能體可以執行完整的優化循環,而無需在會話之間進行手動重啟。
Z-AI(也寫作 Z.ai)是 GLM 系列大型語言模型的開發商,也被稱為 ZhipuAI。GLM 代表通用語言模型(General Language Model),該系列涵蓋了從 GLM-4.6 到當前旗艦版 GLM-5.1 的多個版本。該系列專為程式設計、代理工作流以及中英雙語的生產環境應用而打造。
2026年4月7日,GLM-5.1在SWE-Bench Pro上以58.4分獲得第一名,超越了GPT-5.4(57.7分)和Claude Opus 4.6(57.3分)。它還在CyberGym上以68.7分保持領先。截至2026年第二季,這使其成為用於生產級程式設計排名第一的開源模型。
是的。GLM-5.1支援在無人工干預的情況下,對單一任務進行長達8小時的持續自主執行。它能夠處理規劃、執行、迭代優化和交付的完整閉環。這是專為在Claude Code和相容OpenClaw的環境中運行的長週期編碼智能體工作流而設計的。
GLM-5是建立在7440億參數MoE架構上的基礎模型,在28.5兆個token上進行了訓練,並在Chatbot Arena的開源模型中獲得了Elo排名第一。GLM-5.1是同一基礎模型在訓練後的升級版,具有顯著增強的編碼、工具使用和自主執行能力。在Atlas Cloud上,GLM-5的定價為每百萬輸入token 0.95美元;GLM-5.1為每百萬輸入token 1.26美元。
是的。GLM-5.1 在 MIT 授權條款下發布,允許無限制的商業用途、微調和重新分發。開放權重可用於自託管部署。對於傾向使用託管存取且無需負擔基礎設施開銷的團隊,Atlas Cloud 透過 API 提供 GLM-5.1。
在 Atlas Cloud 上,GLM-4.6、GLM-4.7、GLM-5 和 GLM-5.1 均支援 202,750 個 token 的上下文視窗。GLM-5 Turbo 則是例外,它具有更大的 262,144 個 token 的上下文視窗以及 131,072 個 token 的最大輸出長度。GLM-5.1 適合在其上下文限制內生成長程式碼檔案和擴展的執行追蹤。
是的。所有的GLM模型都針對中文和英文進行了最佳化,在這兩種語言上具備同等水準的能力。您可以使用任何一種語言撰寫提示詞,並獲得品質一致的輸出結果。這使得GLM非常適合那些致力於使用單一模型同時服務中文和國際市場產品的團隊。
GLM-4.7 的起價為每百萬輸入 tokens 0.52 美元,是性價比最高的層級。GLM-4.6 為 0.60 美元,GLM-5 為 0.95 美元,GLM-5 Turbo 為每百萬輸入 tokens 1.20 美元。旗艦模型 GLM-5.1 的價格為每百萬輸入 tokens 1.26 美元,每百萬輸出 tokens 3.96 美元。所有模型均採按需付費模式,無月度最低消費承諾。
指南、教學與產品動態,助你充分發揮 Atlas Cloud 的價值。
Join the Discord community for the latest model updates, prompts, and support.