Z.ai Models on AtlasCloud | GLM

Atlas Cloud 透過 Z-AI API 託管完整的 GLM 系列,從 GLM-4.6 到 GLM-5.1。所有模型皆為雙語模型,支援按需付費,並具備 202K 的上下文視窗。

Large Language Models by Z.ai

在 Atlas Cloud 上,藉助領先的大型語言模型,以高速且實惠的方式驅動對話、推理與智慧代理的大規模應用。

查看全部模型

Z.ai 模型 API 价格明细

对比 Z.ai 全部模型的标准价、平台价与折扣。

模型标准价 (USD)平台价 (USD)折扣
GLM 5.1
$1.4/$4.4每 100 万 tokens202.8K 上下文
$1.26/$3.96M 输入/输出每 100 万 tokens202.8K 上下文
-10%查看
GLM 5 Turbo
$1.2/$4每 100 万 tokens262.1K 上下文
$1.2/$4M 输入/输出每 100 万 tokens262.1K 上下文
查看
GLM 5
$1/$3.2每 100 万 tokens202.8K 上下文
$0.95/$3.15M 输入/输出每 100 万 tokens202.8K 上下文
查看
GLM 4.7
$0.6/$2.2每 100 万 tokens202.8K 上下文
$0.52/$1.85M 输入/输出每 100 万 tokens202.8K 上下文
查看
GLM 4.6
$0.6/$2.2每 100 万 tokens202.8K 上下文
$0.6/$2.2M 输入/输出每 100 万 tokens202.8K 上下文
查看

探索其他厂商的模型

在 Atlas Playground 中即刻探索并体验 300+ 生产可用模型,一键开始定制。

您可以在 Atlas Cloud 上建置的 Z-AI API 應用案例

GLM 的模型層級涵蓋了從快速雙語聊天任務到長達數小時的自主編程智能體等各個方面。團隊可以使用 GLM-5.1 進行長週期的工程工作,而在優先考慮成本效益和速度時,則使用 GLM-4.7 或 GLM-5 Turbo。

長期資料庫效能最佳化

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

自主式倉庫級程式碼重構

開發團隊使用 GLM-5.1 執行跨越數小時的完整程式碼庫改造,期間無需人工檢查點。該模型可連續規劃、編寫、測試和迭代變更長達8小時,在展示的從零開始建置 Linux 系統過程中處理了655次迭代。這取代了在大型遺留程式碼庫上長達數週的手動重構工作。

IDE 程式碼智能體整合

開發者工具團隊將 GLM-5.1 和 GLM-5 Turbo 作為 Claude Code、Kilo Code、Cline、Roo Code 和 OpenCode 中 AI 程式設計工作流程的底層模型進行整合。Atlas Cloud 上的 Z-AI API 相容於 OpenAI,因此只需更換 base URL 即可將這些工具的請求路由至 GLM。GLM-5 Turbo 的 262K 上下文視窗使其特別適合 IDE 工作流程中的大檔案上下文。

一級支援查詢自動化

營運團隊使用 GLM-5 建構客服智慧體,這些智慧體結合了工單資料庫存取、知識庫搜尋和升級工具,能夠在無需人工干預的情況下處理重複性查詢。該模型的多工具呼叫和串流支援使其在即時面向客戶的部署中非常實用。雙語支援意味著同一個智慧體可以透過 Atlas Cloud 上的單一模型端點處理中文和英文工單。

大規模雙語文件生成

內容和業務團隊使用 GLM-4.7 透過結構化提示詞產生中英文的 Word 文件、PowerPoint 簡報、PDF 和 Excel 報告。其價格為每百萬輸入 token 0.52 美元,是處理無需前沿級別推理的高吞吐量文件工作流程最具成本效益的 GLM 層級。202K 的上下文視窗足以在單次呼叫中容納完整的文件大綱和來源材料。

ML工作負載核心最佳化

AI基礎架構團隊使用 GLM-5.1 在機器學習工作負載上執行基準驅動的優化流水線。在 KernelBench 風格的任務中,GLM-5.1 執行數以千計的工具驅動優化週期,並實現3.6倍的幾何平均加速。8小時持續執行的能力意味著該智能體可以執行完整的優化循環,而無需在會話之間進行手動重啟。

Atlas Cloud AI

聯繫銷售

關於 Z.ai 模型的常見問題解答

Z-AI(也寫作 Z.ai)是 GLM 系列大型語言模型的開發商,也被稱為 ZhipuAI。GLM 代表通用語言模型(General Language Model),該系列涵蓋了從 GLM-4.6 到當前旗艦版 GLM-5.1 的多個版本。該系列專為程式設計、代理工作流以及中英雙語的生產環境應用而打造。

2026年4月7日,GLM-5.1在SWE-Bench Pro上以58.4分獲得第一名,超越了GPT-5.4(57.7分)和Claude Opus 4.6(57.3分)。它還在CyberGym上以68.7分保持領先。截至2026年第二季,這使其成為用於生產級程式設計排名第一的開源模型。

是的。GLM-5.1支援在無人工干預的情況下,對單一任務進行長達8小時的持續自主執行。它能夠處理規劃、執行、迭代優化和交付的完整閉環。這是專為在Claude Code和相容OpenClaw的環境中運行的長週期編碼智能體工作流而設計的。

GLM-5是建立在7440億參數MoE架構上的基礎模型,在28.5兆個token上進行了訓練,並在Chatbot Arena的開源模型中獲得了Elo排名第一。GLM-5.1是同一基礎模型在訓練後的升級版,具有顯著增強的編碼、工具使用和自主執行能力。在Atlas Cloud上,GLM-5的定價為每百萬輸入token 0.95美元;GLM-5.1為每百萬輸入token 1.26美元。

是的。GLM-5.1 在 MIT 授權條款下發布,允許無限制的商業用途、微調和重新分發。開放權重可用於自託管部署。對於傾向使用託管存取且無需負擔基礎設施開銷的團隊,Atlas Cloud 透過 API 提供 GLM-5.1。

在 Atlas Cloud 上,GLM-4.6、GLM-4.7、GLM-5 和 GLM-5.1 均支援 202,750 個 token 的上下文視窗。GLM-5 Turbo 則是例外,它具有更大的 262,144 個 token 的上下文視窗以及 131,072 個 token 的最大輸出長度。GLM-5.1 適合在其上下文限制內生成長程式碼檔案和擴展的執行追蹤。

是的。所有的GLM模型都針對中文和英文進行了最佳化,在這兩種語言上具備同等水準的能力。您可以使用任何一種語言撰寫提示詞,並獲得品質一致的輸出結果。這使得GLM非常適合那些致力於使用單一模型同時服務中文和國際市場產品的團隊。

GLM-4.7 的起價為每百萬輸入 tokens 0.52 美元,是性價比最高的層級。GLM-4.6 為 0.60 美元,GLM-5 為 0.95 美元,GLM-5 Turbo 為每百萬輸入 tokens 1.20 美元。旗艦模型 GLM-5.1 的價格為每百萬輸入 tokens 1.26 美元,每百萬輸出 tokens 3.96 美元。所有模型均採按需付費模式,無月度最低消費承諾。

探索更多系列

Seedance 2.0 Models

Seedance 2.0(by Bytedance) is a multimodal video generation model that redefines "controllable creation," moving beyond the limitations of text or start/end frames. It supports quad-modal inputs—text, image, video, and audio—and introduces an industry-leading "Universal Reference" system. By precisely replicating the composition, camera movement, and character actions from reference assets, Seedance 2.0 solves critical issues with character consistency and physical coherence, empowering creators to act as true "directors" with deep control over their output.

檢視系列

Grok-Imagine Models

Grok Imagine Image Quality is xAI's latest AI image generation model, delivering studio-grade visuals with up to 2K resolution and razor-sharp detail. It offers best-in-class text rendering across multiple languages, photorealistic outputs with natural lighting, rich textures, and believable physics, plus tighter prompt following and image editing with reference inputs for precise creative control. Ideal for hero images, ad creatives, product renders, and brand-grade visuals.

檢視系列

Gemini Omni

Gemini Omni (by Google DeepMind) is a video generation and editing model launched on May 20, 2026 at Google I/O that redefines the standard for "reasoning-driven creation," built specifically to solve the core challenge of AI video: making output that actually understands what you mean, not just what you type. It fuses Gemini's reasoning engine with generative capability, accepting any mix of images, text, video, and audio to produce consistent, knowledge-grounded output. Unlike models that start from scratch each time, Omni lets you edit through natural conversation — swapping objects, rewriting scenes, shifting styles — while keeping physics, characters, and continuity intact across every turn.

檢視系列

GPT Image 2 Models

GPT Image 2 is a state-of-the-art multimodal foundation model engineered for exceptional text-to-image generation with unprecedented photorealism and creative versatility. Developed by OpenAI as the evolution of the DALL-E lineage, it transforms detailed natural language descriptions into hyper-realistic imagery at up to 4K resolution. With proprietary "Neural Rendering Engine" technology for precise visual control, GPT Image 2 delivers studio-quality results with accurate anatomy, lighting, and composition—making it the premier AI tool for professional creators, enterprises, and developers demanding production-ready visual assets.

檢視系列

Google Models on Atlas Cloud | Gemini, Nano Bananas & Veo

Google最強大的創意模型現已在Atlas Cloud上全面可用。Veo 3.1提供電影等級的影片生成,Nano Banana 2支援高保真圖像建立,而Gemini為每個工作流程帶來多模態智慧。透過單一API key即可存取完整的Google模型套件,提供Day-0可用性和隨用隨付(pay-as-you-go)定價。

檢視系列

ByteDance Models on Atlas Cloud | Seedance & Seedream

從電影級影片生成到高保真影像建立,ByteDance 最強大的模型現已在 Atlas Cloud 上線。以最低的推論定價和零基礎設施開銷,大規模執行 Seedance 和 Seedream。

檢視系列

Alibaba Models on Atlas Cloud | Wan & Qwen

Atlas Cloud 將 Alibaba 的全系模型陣容整合至同一個 API 中:Qwen 適用於語言和圖像任務,Wan 適用於高達 1080p 的影片生成。所有模型均採用按需付費模式,無需訂閱。您可以使用現有的 OpenAI 兼容客戶端,透過單一的 base URL 存取 Alibaba API。

檢視系列

MAI Image 2.5 Models

MAI-Image-2.5 是 Microsoft 最新推出的逼真圖像生成與編輯模型系列,專為商業設計、產品攝影和品牌級內容創作而打造。提供用於文字生成圖像和圖像編輯的標準版與 Flash 版本,以極具競爭力的價格(每張圖像起價 0.03 美元)提供同類最佳的 Arena ELO 得分。憑藉精準的文字渲染、手術刀級的編輯能力以及自然的人像生成,MAI-Image-2.5 專為需要生產級品質視覺效果且無需承擔後製處理成本的團隊而設計。

檢視系列

Wan2.7 Models

Launching this March, Wan2.7 is the latest powerhouse in the Qwen ecosystem, delivering a massive upgrade in visual fidelity, audio synchronization, and motion consistency over version 2.6. This all-in-one AI video generator supports advanced features like first-and-last frame control, 3x3 grid synthesis, and instruction-based video editing. Outperforming competitors like Jimeng, Wan2.7 offers superior flexibility with support for real-person image inputs, up to five video references, and 1080P high-definition outputs spanning 2 to 15 seconds, making it the premier choice for professional digital storytelling and high-end content marketing.

檢視系列

Nano Banana2 Models

Nano Banana 2 (by Google), is a generative image model that perfectly balances lightning-fast rendering with exceptional visual quality. With an improved price-performance ratio, it achieves breakthrough micro-detail depiction, accurate native text rendering, and complex physical structure reconstruction. It serves as a highly efficient, commercial-grade visual production tool for developers, marketing teams, and content creators.

檢視系列

Doubao Models

Doubao 是 ByteDance 的大型語言模型系列,專為生產級推理、編碼和高併發代理工作負載而設計。涵蓋旗艦版 Seed 2.0 Pro、專用的 Code Preview 變體、高性價比的 Lite 和 Mini 層級,以及經過驗證的 Seed 1.8 和 Seed 1.6 世代,該系列為開發者提供了一個單一的、相容 OpenAI 的介面,以便從前沿推理擴展到對延遲敏感的高吞吐量任務。Atlas Cloud 上的每一個 Doubao 模型都配備了 256K token 的上下文視窗、串流傳輸和即插即用的 SDK 相容性——因此您可以為每項任務匹配合適的模型,而無需重寫您的技術堆疊。

檢視系列

Hunyuan 3D Generation Models

Hunyuan3D is a state-of-the-art 3D generative foundation model from Tencent that turns text prompts and single images into high-quality, textured 3D meshes. Built on a two-stage pipeline—Hunyuan3D-DiT for shape generation via flow-matching diffusion and Hunyuan3D-Paint for multi-view texture synthesis—it produces clean geometry with full PBR materials ready for game engines, AR/VR, 3D printing, and DCC tools. Available in Pro (up to 1.5M faces, 4K PBR textures) and Rapid (2–3 minute lightweight generation) tiers, with both Text-to-3D and Image-to-3D entry points, Hunyuan3D is the premier AI 3D toolkit for game developers, e-commerce teams, and 3D content studios. Generations start at $0.02 each.

檢視系列

推薦文章

指南、教學與產品動態,助你充分發揮 Atlas Cloud 的價值。

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.