
Atlas Cloud 通过 Z-AI API 托管完整的 GLM 系列,从 GLM-4.6 到 GLM-5.1。所有模型均为双语模型,支持按需付费,并具备 202K 的上下文窗口。
在 Atlas Cloud 上,依托顶尖的大语言模型,以极速且实惠的方式驱动对话、推理与智能体的规模化应用。
对比 Z.ai 全部模型的标准价、平台价与折扣。
| 模型 | 标准价 (USD) | 平台价 (USD) | 折扣 | |
|---|---|---|---|---|
| GLM 5.1 | $1.4/$4.4每 100 万 tokens202.8K 上下文 | $1.26/$3.96M 输入/输出每 100 万 tokens202.8K 上下文 | -10% | 查看 |
| GLM 5 Turbo | $1.2/$4每 100 万 tokens262.1K 上下文 | $1.2/$4M 输入/输出每 100 万 tokens262.1K 上下文 | — | 查看 |
| GLM 5 | $1/$3.2每 100 万 tokens202.8K 上下文 | $0.95/$3.15M 输入/输出每 100 万 tokens202.8K 上下文 | — | 查看 |
| GLM 4.7 | $0.6/$2.2每 100 万 tokens202.8K 上下文 | $0.52/$1.85M 输入/输出每 100 万 tokens202.8K 上下文 | — | 查看 |
| GLM 4.6 | $0.6/$2.2每 100 万 tokens202.8K 上下文 | $0.6/$2.2M 输入/输出每 100 万 tokens202.8K 上下文 | — | 查看 |
在 Atlas Playground 中即刻探索并体验 300+ 生产可用模型,一键开始定制。
GLM 的模型层级涵盖了从快速双语聊天任务到长达数小时的自主编程智能体等各个方面。团队可以使用 GLM-5.1 进行长周期的工程工作,而在优先考虑成本效益和速度时,则使用 GLM-4.7 或 GLM-5 Turbo。
Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.
开发团队使用 GLM-5.1 执行跨越数小时的完整代码库改造,期间无需人工检查点。该模型可连续规划、编写、测试和迭代更改长达8小时,在演示的从零开始构建 Linux 系统过程中处理了655次迭代。这替代了在大型遗留代码库上长达数周的手动重构工作。
开发者工具团队将 GLM-5.1 和 GLM-5 Turbo 作为 Claude Code、Kilo Code、Cline、Roo Code 和 OpenCode 中 AI 编程工作流的底层模型进行集成。Atlas Cloud 上的 Z-AI API 兼容 OpenAI,因此只需更换 base URL 即可将这些工具的请求路由至 GLM。GLM-5 Turbo 的 262K 上下文窗口使其特别适合 IDE 工作流中的大文件上下文。
运营团队使用 GLM-5 构建客服智能体,这些智能体结合了工单数据库访问、知识库搜索和升级工具,能够在无需人工干预的情况下处理重复性查询。该模型的多工具调用和流式输出支持使其在实时面向客户的部署中非常实用。双语支持意味着同一个智能体可以通过 Atlas Cloud 上的单一模型端点处理中文和英文工单。
内容和业务团队使用 GLM-4.7 通过结构化提示词生成中英文的 Word 文档、PowerPoint 演示文稿、PDF 和 Excel 报告。其价格为每百万输入 token 0.52 美元,是处理无需前沿级别推理的高吞吐量文档工作流最具成本效益的 GLM 层级。202K 的上下文窗口足以在单次调用中容纳完整的文档大纲和源材料。
AI基础架构团队使用 GLM-5.1 在机器学习工作负载上运行基准驱动的优化流水线。在 KernelBench 风格的任务中,GLM-5.1 执行数以千计的工具驱动优化周期,并实现3.6倍的几何平均加速。8小时持续执行的能力意味着该智能体可以运行完整的优化循环,而无需在会话之间进行手动重启。
Z-AI(也写作 Z.ai)是 GLM 系列大型语言模型的开发商,也被称为 ZhipuAI。GLM 代表通用语言模型(General Language Model),该系列涵盖了从 GLM-4.6 到当前旗舰版 GLM-5.1 的多个版本。该系列专为编程、智能体工作流以及中英双语的生产环境应用而打造。
2026年4月7日,GLM-5.1在SWE-Bench Pro上以58.4分获得第一名,超越了GPT-5.4(57.7分)和Claude Opus 4.6(57.3分)。它还在CyberGym上以68.7分保持领先。截至2026年第二季度,这使其成为用于生产级编程排名第一的开源模型。
是的。GLM-5.1支持在无人工干预的情况下,对单一任务进行长达8小时的持续自主执行。它能够处理规划、执行、迭代优化和交付的完整闭环。这是专为在Claude Code和兼容OpenClaw的环境中运行的长周期编码智能体工作流而设计的。
GLM-5是建立在7440亿参数MoE架构上的基础模型,在28.5万亿个token上进行了训练,并在Chatbot Arena的开源模型中获得了Elo排名第一。GLM-5.1是同一基础模型在训练后的升级版,具有显著增强的编码、工具使用和自主执行能力。在Atlas Cloud上,GLM-5的定价为每百万输入token 0.95美元;GLM-5.1为每百万输入token 1.26美元。
是的。GLM-5.1 在 MIT 许可证下发布,允许无限制的商业用途、微调和重新分发。开放权重可用于自托管部署。对于倾向于使用托管访问且无需承担基础设施开销的团队,Atlas Cloud 通过 API 提供 GLM-5.1。
在 Atlas Cloud 上,GLM-4.6、GLM-4.7、GLM-5 和 GLM-5.1 均支持 202,750 个 token 的上下文窗口。GLM-5 Turbo 则是例外,它具有更大的 262,144 个 token 的上下文窗口以及 131,072 个 token 的最大输出长度。GLM-5.1 适合在其上下文限制内生成长代码文件和扩展的执行跟踪。
是的。所有的GLM模型都针对中文和英文进行了优化,在这两种语言上具备同等水平的能力。您可以使用任何一种语言编写提示词,并获得质量一致的输出结果。这使得GLM非常适合那些致力于使用单一模型同时服务中国和国际市场产品的团队。
GLM-4.7 的起价为每百万输入 tokens 0.52 美元,是性价比最高的层级。GLM-4.6 为 0.60 美元,GLM-5 为 0.95 美元,GLM-5 Turbo 为每百万输入 tokens 1.20 美元。旗舰模型 GLM-5.1 的价格为每百万输入 tokens 1.26 美元,每百万输出 tokens 3.96 美元。所有模型均采用按需付费模式,无月度最低消费承诺。
指南、教程与产品动态,助你充分发挥 Atlas Cloud 的价值。
Join the Discord community for the latest model updates, prompts, and support.