Z.ai Models on AtlasCloud | GLM

Atlas Cloud 通过 Z-AI API 托管完整的 GLM 系列,从 GLM-4.6 到 GLM-5.1。所有模型均为双语模型,支持按需付费,并具备 202K 的上下文窗口。

Large Language Models by Z.ai

在 Atlas Cloud 上,依托顶尖的大语言模型,以极速且实惠的方式驱动对话、推理与智能体的规模化应用。

查看全部模型

Z.ai 模型 API 价格明细

对比 Z.ai 全部模型的标准价、平台价与折扣。

模型标准价 (USD)平台价 (USD)折扣
GLM 5.1
$1.4/$4.4每 100 万 tokens202.8K 上下文
$1.26/$3.96M 输入/输出每 100 万 tokens202.8K 上下文
-10%查看
GLM 5 Turbo
$1.2/$4每 100 万 tokens262.1K 上下文
$1.2/$4M 输入/输出每 100 万 tokens262.1K 上下文
查看
GLM 5
$1/$3.2每 100 万 tokens202.8K 上下文
$0.95/$3.15M 输入/输出每 100 万 tokens202.8K 上下文
查看
GLM 4.7
$0.6/$2.2每 100 万 tokens202.8K 上下文
$0.52/$1.85M 输入/输出每 100 万 tokens202.8K 上下文
查看
GLM 4.6
$0.6/$2.2每 100 万 tokens202.8K 上下文
$0.6/$2.2M 输入/输出每 100 万 tokens202.8K 上下文
查看

探索其他厂商的模型

在 Atlas Playground 中即刻探索并体验 300+ 生产可用模型,一键开始定制。

您可以在 Atlas Cloud 上构建的 Z-AI API 用例

GLM 的模型层级涵盖了从快速双语聊天任务到长达数小时的自主编程智能体等各个方面。团队可以使用 GLM-5.1 进行长周期的工程工作,而在优先考虑成本效益和速度时,则使用 GLM-4.7 或 GLM-5 Turbo。

长期数据库性能优化

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

自主式仓库级代码重构

开发团队使用 GLM-5.1 执行跨越数小时的完整代码库改造,期间无需人工检查点。该模型可连续规划、编写、测试和迭代更改长达8小时,在演示的从零开始构建 Linux 系统过程中处理了655次迭代。这替代了在大型遗留代码库上长达数周的手动重构工作。

IDE 编程智能体集成

开发者工具团队将 GLM-5.1 和 GLM-5 Turbo 作为 Claude Code、Kilo Code、Cline、Roo Code 和 OpenCode 中 AI 编程工作流的底层模型进行集成。Atlas Cloud 上的 Z-AI API 兼容 OpenAI,因此只需更换 base URL 即可将这些工具的请求路由至 GLM。GLM-5 Turbo 的 262K 上下文窗口使其特别适合 IDE 工作流中的大文件上下文。

一级支持查询自动化

运营团队使用 GLM-5 构建客服智能体,这些智能体结合了工单数据库访问、知识库搜索和升级工具,能够在无需人工干预的情况下处理重复性查询。该模型的多工具调用和流式输出支持使其在实时面向客户的部署中非常实用。双语支持意味着同一个智能体可以通过 Atlas Cloud 上的单一模型端点处理中文和英文工单。

大规模双语文档生成

内容和业务团队使用 GLM-4.7 通过结构化提示词生成中英文的 Word 文档、PowerPoint 演示文稿、PDF 和 Excel 报告。其价格为每百万输入 token 0.52 美元,是处理无需前沿级别推理的高吞吐量文档工作流最具成本效益的 GLM 层级。202K 的上下文窗口足以在单次调用中容纳完整的文档大纲和源材料。

ML工作负载内核优化

AI基础架构团队使用 GLM-5.1 在机器学习工作负载上运行基准驱动的优化流水线。在 KernelBench 风格的任务中,GLM-5.1 执行数以千计的工具驱动优化周期,并实现3.6倍的几何平均加速。8小时持续执行的能力意味着该智能体可以运行完整的优化循环,而无需在会话之间进行手动重启。

Atlas Cloud AI

联系销售

关于 Z.ai 模型的常见问题解答

Z-AI(也写作 Z.ai)是 GLM 系列大型语言模型的开发商,也被称为 ZhipuAI。GLM 代表通用语言模型(General Language Model),该系列涵盖了从 GLM-4.6 到当前旗舰版 GLM-5.1 的多个版本。该系列专为编程、智能体工作流以及中英双语的生产环境应用而打造。

2026年4月7日,GLM-5.1在SWE-Bench Pro上以58.4分获得第一名,超越了GPT-5.4(57.7分)和Claude Opus 4.6(57.3分)。它还在CyberGym上以68.7分保持领先。截至2026年第二季度,这使其成为用于生产级编程排名第一的开源模型。

是的。GLM-5.1支持在无人工干预的情况下,对单一任务进行长达8小时的持续自主执行。它能够处理规划、执行、迭代优化和交付的完整闭环。这是专为在Claude Code和兼容OpenClaw的环境中运行的长周期编码智能体工作流而设计的。

GLM-5是建立在7440亿参数MoE架构上的基础模型,在28.5万亿个token上进行了训练,并在Chatbot Arena的开源模型中获得了Elo排名第一。GLM-5.1是同一基础模型在训练后的升级版,具有显著增强的编码、工具使用和自主执行能力。在Atlas Cloud上,GLM-5的定价为每百万输入token 0.95美元;GLM-5.1为每百万输入token 1.26美元。

是的。GLM-5.1 在 MIT 许可证下发布,允许无限制的商业用途、微调和重新分发。开放权重可用于自托管部署。对于倾向于使用托管访问且无需承担基础设施开销的团队,Atlas Cloud 通过 API 提供 GLM-5.1。

在 Atlas Cloud 上,GLM-4.6、GLM-4.7、GLM-5 和 GLM-5.1 均支持 202,750 个 token 的上下文窗口。GLM-5 Turbo 则是例外,它具有更大的 262,144 个 token 的上下文窗口以及 131,072 个 token 的最大输出长度。GLM-5.1 适合在其上下文限制内生成长代码文件和扩展的执行跟踪。

是的。所有的GLM模型都针对中文和英文进行了优化,在这两种语言上具备同等水平的能力。您可以使用任何一种语言编写提示词,并获得质量一致的输出结果。这使得GLM非常适合那些致力于使用单一模型同时服务中国和国际市场产品的团队。

GLM-4.7 的起价为每百万输入 tokens 0.52 美元,是性价比最高的层级。GLM-4.6 为 0.60 美元,GLM-5 为 0.95 美元,GLM-5 Turbo 为每百万输入 tokens 1.20 美元。旗舰模型 GLM-5.1 的价格为每百万输入 tokens 1.26 美元,每百万输出 tokens 3.96 美元。所有模型均采用按需付费模式,无月度最低消费承诺。

探索更多系列

Seedance 2.0 Models

Seedance 2.0(by Bytedance) is a multimodal video generation model that redefines "controllable creation," moving beyond the limitations of text or start/end frames. It supports quad-modal inputs—text, image, video, and audio—and introduces an industry-leading "Universal Reference" system. By precisely replicating the composition, camera movement, and character actions from reference assets, Seedance 2.0 solves critical issues with character consistency and physical coherence, empowering creators to act as true "directors" with deep control over their output.

查看系列

Grok-Imagine Models

Grok Imagine Image Quality is xAI's latest AI image generation model, delivering studio-grade visuals with up to 2K resolution and razor-sharp detail. It offers best-in-class text rendering across multiple languages, photorealistic outputs with natural lighting, rich textures, and believable physics, plus tighter prompt following and image editing with reference inputs for precise creative control. Ideal for hero images, ad creatives, product renders, and brand-grade visuals.

查看系列

Gemini Omni

Gemini Omni (by Google DeepMind) is a video generation and editing model launched on May 20, 2026 at Google I/O that redefines the standard for "reasoning-driven creation," built specifically to solve the core challenge of AI video: making output that actually understands what you mean, not just what you type. It fuses Gemini's reasoning engine with generative capability, accepting any mix of images, text, video, and audio to produce consistent, knowledge-grounded output. Unlike models that start from scratch each time, Omni lets you edit through natural conversation — swapping objects, rewriting scenes, shifting styles — while keeping physics, characters, and continuity intact across every turn.

查看系列

GPT Image 2 Models

GPT Image 2 is a state-of-the-art multimodal foundation model engineered for exceptional text-to-image generation with unprecedented photorealism and creative versatility. Developed by OpenAI as the evolution of the DALL-E lineage, it transforms detailed natural language descriptions into hyper-realistic imagery at up to 4K resolution. With proprietary "Neural Rendering Engine" technology for precise visual control, GPT Image 2 delivers studio-quality results with accurate anatomy, lighting, and composition—making it the premier AI tool for professional creators, enterprises, and developers demanding production-ready visual assets.

查看系列

Google Models on Atlas Cloud | Gemini, Nano Bananas & Veo

Google最强大的创意模型现已在Atlas Cloud上全面可用。Veo 3.1提供电影级别的视频生成,Nano Banana 2支持高保真图像创建,而Gemini为每个工作流带来多模态智能。通过单一API key即可访问完整的Google模型套件,提供Day-0可用性和按需付费(pay-as-you-go)定价。

查看系列

ByteDance Models on Atlas Cloud | Seedance & Seedream

从电影级视频生成到高保真图像创建,ByteDance 最强大的模型现已在 Atlas Cloud 上线。以最低的推理定价和零基础设施开销,大规模运行 Seedance 和 Seedream。

查看系列

Alibaba Models on Atlas Cloud | Wan & Qwen

Atlas Cloud 将 Alibaba 的全系模型阵容整合至同一个 API 中:Qwen 用于语言和图像任务,Wan 用于高达 1080p 的视频生成。所有模型均采用按需付费模式,无需订阅。您可以使用现有的 OpenAI 兼容客户端,通过单一的 base URL 访问 Alibaba API。

查看系列

MAI Image 2.5 Models

MAI-Image-2.5 是 Microsoft 最新推出的逼真图像生成与编辑模型系列,专为商业设计、产品摄影和品牌级内容创作而打造。提供用于文本生成图像和图像编辑的 standard 和 Flash 变体,以极具竞争力的价格(每张图像起价 0.03 美元)提供同类最佳的 Arena ELO 得分。凭借精准的文本渲染、手术刀级的编辑能力以及自然的人像生成,MAI-Image-2.5 专为需要生产级质量视觉效果且无需承担后期处理开销的团队而设计。

查看系列

Wan2.7 Models

Launching this March, Wan2.7 is the latest powerhouse in the Qwen ecosystem, delivering a massive upgrade in visual fidelity, audio synchronization, and motion consistency over version 2.6. This all-in-one AI video generator supports advanced features like first-and-last frame control, 3x3 grid synthesis, and instruction-based video editing. Outperforming competitors like Jimeng, Wan2.7 offers superior flexibility with support for real-person image inputs, up to five video references, and 1080P high-definition outputs spanning 2 to 15 seconds, making it the premier choice for professional digital storytelling and high-end content marketing.

查看系列

Nano Banana2 Models

Nano Banana 2 (by Google), is a generative image model that perfectly balances lightning-fast rendering with exceptional visual quality. With an improved price-performance ratio, it achieves breakthrough micro-detail depiction, accurate native text rendering, and complex physical structure reconstruction. It serves as a highly efficient, commercial-grade visual production tool for developers, marketing teams, and content creators.

查看系列

Doubao Models

Doubao 是 ByteDance 的大型语言模型系列,专为生产级推理、编码和高并发智能体工作负载而设计。涵盖旗舰版 Seed 2.0 Pro、专用的 Code Preview 变体、高性价比的 Lite 和 Mini 层级,以及经过验证的 Seed 1.8 和 Seed 1.6 世代,该系列为开发者提供了一个单一的、兼容 OpenAI 的接口,以便从前沿推理扩展到对延迟敏感的高吞吐量任务。Atlas Cloud 上的每一个 Doubao 模型都配备了 256K token 的上下文窗口、流式传输和即插即用的 SDK 兼容性——因此您可以为每项任务匹配合适的模型,而无需重写您的技术栈。

查看系列

Hunyuan 3D Generation Models

Hunyuan3D is a state-of-the-art 3D generative foundation model from Tencent that turns text prompts and single images into high-quality, textured 3D meshes. Built on a two-stage pipeline—Hunyuan3D-DiT for shape generation via flow-matching diffusion and Hunyuan3D-Paint for multi-view texture synthesis—it produces clean geometry with full PBR materials ready for game engines, AR/VR, 3D printing, and DCC tools. Available in Pro (up to 1.5M faces, 4K PBR textures) and Rapid (2–3 minute lightweight generation) tiers, with both Text-to-3D and Image-to-3D entry points, Hunyuan3D is the premier AI 3D toolkit for game developers, e-commerce teams, and 3D content studios. Generations start at $0.02 each.

查看系列

推荐文章

指南、教程与产品动态,助你充分发挥 Atlas Cloud 的价值。

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.