Z.ai API for Top Open-Source GLM Coding

Atlas Cloud 通过 Z-AI API 托管完整的 GLM 系列，从 GLM-4.6 到 GLM-5.1。所有模型均为双语模型，支持按需付费，并具备 202K 的上下文窗口。

Large Language Models by Z.ai

在 Atlas Cloud 上，依托顶尖的大语言模型，以极速且实惠的方式驱动对话、推理与智能体的规模化应用。

查看全部模型

LLM

GLM

GLM 是智谱 AI 旗下 Z.ai 的旗舰 LLM 系列，GLM API 覆盖从具备智能体能力的 GLM-5 到高效的 357B MoE GLM-4.6 等模型。这些模型专注于自主任务执行、复杂智能体编排和生产级编程。在 Atlas Cloud 上，单一统一 endpoint 即可让你 Day-0 访问整个 GLM 家族，按量计费，并提供可靠的生产环境可用性。立即开始构建。

6 个模型探索 GLM

Z.ai 模型 API 价格明细

对比 Z.ai 全部模型的标准价、平台价与折扣。

模型	标准价 (USD)	平台价 (USD)	折扣
GLM 5.2	$1.4/$4.4每 100 万 tokens1048.6K 上下文	$1.26/$3.96M 输入/输出每 100 万 tokens1048.6K 上下文	-10%	查看
GLM 5.1	$1.4/$4.4每 100 万 tokens202.8K 上下文	$1.26/$3.96M 输入/输出每 100 万 tokens202.8K 上下文	-10%	查看
GLM 5v Turbo	$1.2/$4每 100 万 tokens202.8K 上下文	$1.2/$4M 输入/输出每 100 万 tokens202.8K 上下文	—	查看
GLM 5	$1/$3.2每 100 万 tokens202.8K 上下文	$0.95/$3.15M 输入/输出每 100 万 tokens202.8K 上下文	—	查看
GLM 4.7	$0.6/$2.2每 100 万 tokens202.8K 上下文	$0.52/$1.85M 输入/输出每 100 万 tokens202.8K 上下文	—	查看
GLM 4.6	$0.6/$2.2每 100 万 tokens202.8K 上下文	$0.6/$2.2M 输入/输出每 100 万 tokens202.8K 上下文	—	查看

探索其他厂商的模型

在 Atlas Playground 中即刻探索并体验 400+ 生产可用模型，一键开始定制。

xAI

您可以在 Atlas Cloud 上构建的 Z-AI API 用例

GLM 的模型层级涵盖了从快速双语聊天任务到长达数小时的自主编程智能体等各个方面。团队可以使用 GLM-5.1 进行长周期的工程工作，而在优先考虑成本效益和速度时，则使用 GLM-4.7 或 GLM-5 Turbo。

长期数据库性能优化

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

自主式仓库级代码重构

开发团队使用 GLM-5.1 执行跨越数小时的完整代码库改造，期间无需人工检查点。该模型可连续规划、编写、测试和迭代更改长达8小时，在演示的从零开始构建 Linux 系统过程中处理了655次迭代。这替代了在大型遗留代码库上长达数周的手动重构工作。

IDE 编程智能体集成

开发者工具团队将 GLM-5.1 和 GLM-5 Turbo 作为 Claude Code、Kilo Code、Cline、Roo Code 和 OpenCode 中 AI 编程工作流的底层模型进行集成。Atlas Cloud 上的 Z-AI API 兼容 OpenAI，因此只需更换 base URL 即可将这些工具的请求路由至 GLM。GLM-5 Turbo 的 262K 上下文窗口使其特别适合 IDE 工作流中的大文件上下文。

一级支持查询自动化

运营团队使用 GLM-5 构建客服智能体，这些智能体结合了工单数据库访问、知识库搜索和升级工具，能够在无需人工干预的情况下处理重复性查询。该模型的多工具调用和流式输出支持使其在实时面向客户的部署中非常实用。双语支持意味着同一个智能体可以通过 Atlas Cloud 上的单一模型端点处理中文和英文工单。

大规模双语文档生成

内容和业务团队使用 GLM-4.7 通过结构化提示词生成中英文的 Word 文档、PowerPoint 演示文稿、PDF 和 Excel 报告。其价格为每百万输入 token 0.52 美元，是处理无需前沿级别推理的高吞吐量文档工作流最具成本效益的 GLM 层级。202K 的上下文窗口足以在单次调用中容纳完整的文档大纲和源材料。

ML工作负载内核优化

AI基础架构团队使用 GLM-5.1 在机器学习工作负载上运行基准驱动的优化流水线。在 KernelBench 风格的任务中，GLM-5.1 执行数以千计的工具驱动优化周期，并实现3.6倍的几何平均加速。8小时持续执行的能力意味着该智能体可以运行完整的优化循环，而无需在会话之间进行手动重启。

用 Atlas Cloud AI，让企业愿景照进现实。

联系销售

开发者关于 Z.ai API 的常见问题

Z.ai API 让开发者能够以编程方式访问由 Z.ai（也称为智谱 AI）构建的 GLM 系列大语言模型。GLM 代表 General Language Model，覆盖从 GLM-4.6 到旗舰模型 GLM-5.1 的多个版本，面向代码编写、智能体工作流以及中英双语生产环境使用进行优化。在 Atlas Cloud 上，你可以通过一个兼容 OpenAI 的 endpoint 访问完整模型阵容。

Atlas Cloud 托管从 GLM-4.6 到旗舰模型 GLM-5.1 的 GLM 系列，中间还包括 GLM-4.7 和 GLM-5。轻量级档位以更低成本处理高并发的日常任务，而 GLM-5.1 则面向要求最高的代码编写和智能体工作。所有模型都可通过同一个 key 按量付费使用。

是的。包括 GLM-5.1 在内的 GLM 开放权重均基于 MIT license 发布，允许商业使用、微调和再分发，且不受限制。如果你不想承担基础设施运维成本，Atlas Cloud 也可以通过 API 提供同款模型的托管访问，无需自托管。

将你现有的 OpenAI SDK 指向 Atlas Cloud base URL，设置你的 key，并传入所需的 GLM model name 即可。由于 Z.ai API 兼容 OpenAI，大多数项目只需修改 base URL 和 model string 就能完成迁移，并且这些模型可以直接接入 Claude Code、Cline 和 Roo Code 等智能体工具。现在就开始构建吧。

中文和英文都是 GLM 的一等能力，它经过训练，在两种语言上都具备很强的表现。你可以用任一语言编写 prompt，并获得稳定一致的质量，这使得该系列模型非常适合同时服务中国和国际用户的团队，用单一模型替代维护多套技术栈。

从 GLM-4.6 到 GLM-5.1 均支持 200K token 上下文窗口，足以在一次请求中容纳大型代码库、长文档或扩展的智能体执行轨迹。如果你的工作流会生成较长输出，同样的窗口也能覆盖大型代码文件和多步骤执行日志，避免过早截断。

GLM-5.1 在 2026 年 4 月以 58.4 的成绩登顶 SWE-Bench Pro，跻身真实世界编程能力最强的开源模型之列。它还支持在单个任务上连续自主执行最长八小时，将规划、迭代和交付整合到一个循环中，非常适合 Claude Code 等环境中的长周期智能体工作流。

Z.ai API 上的每个 GLM 模型都采用透明的按量付费定价，按 token 计费，无需订阅或月度承诺。输入 token 和输出 token 分别计量，GLM-4.7 等轻量级档位的每 token 成本低于旗舰模型 GLM-5.1，因此你可以根据预算选择合适的模型。请在 Atlas Cloud 中各模型卡片上查看当前的每 token 费率。

探索更多系列

Seedance 2.0

Seedance 2.0 API 为您提供 ByteDance 多模态视频模型的生产级访问权限——支持四模态输入（文本、图像、视频、音频），以及行业领先的“Universal Reference”（通用参考）系统，可在不同镜头间锁定构图、运镜和角色动作。只需一次 API 调用即可集成导演级控制，固定费率为 $0.09/秒，即时获取密钥，无需排队——由企业级正常运行时间和合规性提供保障。Seedance 2.0 原生 4K 现已上线！

查看系列

GPT Image 2

GPT Image 2 API 为开发者提供了访问 OpenAI 最新图像模型的途径，它是 GPT Image 1.5 的继任者。该模型可生成和编辑图像，能够在拉丁和 CJK 文字上实现准确的文本渲染，并在海报、样机和信息图表方面具备强大的排版能力。在 Atlas Cloud 上，您可以通过一个统一的 API 与 300 多个模型一起访问它，并享受免费额度、99.99% 的正常运行时间，且无需 OpenAI 组织验证。

查看系列

Seedream 5.0 Pro

Seedream 5.0 Pro API 为开发者在 Atlas Cloud 上提供了字节跳动的可控图像编辑模型。它通过锚点和坐标精确定位编辑，将图像分离为可编辑图层，融合多个参考，并精准匹配颜色和材质，支持 2K 和 3K 分辨率的多语言文本。在 Atlas Cloud 上，您只需一个密钥即可访问！

查看系列

Gemini Omni Flash

Gemini Omni API 将 Google DeepMind 在 Google I/O 2026 上发布的多模态视频生成与编辑模型带入你的技术栈。Gemini Omni 将 Gemini 的推理引擎与生成式媒体融合，可接受文本、图像、视频和音频的任意组合输入，生成一致且以知识为依据的输出。通过自然对话不断打磨结果：替换物体、重写场景、切换风格，同时保持物理规律、角色形象和画面连贯性不变。Atlas Cloud 通过统一的 API 提供完整的 Gemini Omni Flash 系列——文生视频、支持最多 7 张参考图的图生视频，以及参考图生视频——按秒计费、价格透明，低至 $0.112 起，且无需订阅。立即开始构建。

查看系列

Grok Imagine

Grok Imagine API 为开发者提供 xAI 的图像、视频和音频生成一站式套件。它可以生成分辨率高达 2K 且支持多语言文本渲染的图像，以及长达 15 秒且带有原生同步音频和基于参考图像编辑功能的视频。在 Atlas Cloud 上，只需一个密钥即可运行每个 Grok Imagine 模式，因此您可以在图像、视频和音频之间无缝切换，无需单独设置，每张图像 0.02 美元起，每秒 0.05 美元起。

查看系列

Google

Google最强大的创意模型现已在Atlas Cloud上全面可用。Veo 3.1提供电影级别的视频生成，Nano Banana 2支持高保真图像创建，而Gemini为每个工作流带来多模态智能。通过单一API key即可访问完整的Google模型套件，提供Day-0可用性和按需付费（pay-as-you-go）定价。

查看系列

Seedance 2.0 Mini

Seedance 2.0 Mini 将 ByteDance 的多模态视频生成技术引入到对速度和成本要求极高的工作流中。它以更轻量的占用空间提供 Seedance 2.0 的核心能力——更快的生成速度、更低的单条视频成本，并且使用您现有的同款 API 集成。对于运行高吞吐量流水线或进行大规模原型设计的团队来说，Mini 是最实用的默认选择。

查看系列