Z.ai Models on AtlasCloud | GLM

Atlas Cloud lưu trữ toàn bộ loạt mô hình GLM thông qua API Z-AI, từ GLM-4.6 đến GLM-5.1. Tất cả các mô hình đều hỗ trợ song ngữ và có sẵn theo hình thức thanh toán theo mức sử dụng (pay-as-you-go) với cửa sổ ngữ cảnh 202K.

Large Language Models by Z.ai

Thúc đẩy trò chuyện, suy luận và tác tử ở quy mô lớn với các mô hình ngôn ngữ lớn hàng đầu, được cung cấp nhanh chóng và tiết kiệm trên Atlas Cloud.

Xem tất cả mô hình

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

ModelStandard Price (USD)Our Price (USD)Discount
GLM 5.1
$1.4/$4.4per 1M tokens202.8K context
$1.26/$3.96M in/outper 1M tokens202.8K context
-10%View
GLM 5 Turbo
$1.2/$4per 1M tokens262.1K context
$1.2/$4M in/outper 1M tokens262.1K context
View
GLM 5
$1/$3.2per 1M tokens202.8K context
$0.95/$3.15M in/outper 1M tokens202.8K context
View
GLM 4.7
$0.6/$2.2per 1M tokens202.8K context
$0.52/$1.85M in/outper 1M tokens202.8K context
View
GLM 4.6
$0.6/$2.2per 1M tokens202.8K context
$0.6/$2.2M in/outper 1M tokens202.8K context
View

Explore models from other providers

Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.

Các trường hợp sử dụng Z-AI API bạn có thể xây dựng trên Atlas Cloud

Các cấp độ mô hình của GLM bao gồm mọi thứ, từ các tác vụ trò chuyện song ngữ nhanh chóng cho đến các tác nhân lập trình tự trị kéo dài nhiều giờ. Các nhóm sử dụng GLM-5.1 cho công việc kỹ thuật dài hạn và GLM-4.7 hoặc GLM-5 Turbo khi ưu tiên hiệu quả chi phí và tốc độ.

Tối ưu hóa hiệu suất cơ sở dữ liệu dài hạn

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

Tái Cấu Trúc Mã Nguồn Tự Trị Quy Mô Kho Lưu Trữ

Các nhóm phát triển sử dụng GLM-5.1 để thực hiện các quá trình chuyển đổi toàn bộ cơ sở mã trong các phiên làm việc kéo dài nhiều giờ mà không cần đến các điểm kiểm tra của con người. Mô hình lập kế hoạch, viết, thử nghiệm và lặp lại các thay đổi liên tục trong tối đa 8 giờ, xử lý 655 lần lặp trong một bản trình diễn xây dựng hệ thống Linux từ đầu. Điều này thay thế hàng tuần làm việc tái cấu trúc thủ công trên các cơ sở mã lớn, kế thừa.

Tích hợp Tác nhân Lập trình IDE

Các nhóm công cụ dành cho nhà phát triển tích hợp GLM-5.1 và GLM-5 Turbo làm mô hình cơ bản cho quy trình mã hóa AI trong Claude Code, Kilo Code, Cline, Roo Code và OpenCode. Z-AI API trên Atlas Cloud tương thích với OpenAI, do đó, việc thay đổi base URL là thay đổi duy nhất cần thiết để định tuyến bất kỳ công cụ nào trong số này thông qua GLM. Cửa sổ ngữ cảnh 262K của GLM-5 Turbo khiến nó đặc biệt phù hợp với ngữ cảnh tệp lớn trong quy trình làm việc của IDE.

Tự Động Hóa Truy Vấn Hỗ Trợ Cấp 1

Các nhóm vận hành xây dựng các tác nhân hỗ trợ bằng GLM-5, kết hợp quyền truy cập cơ sở dữ liệu phiếu hỗ trợ, tìm kiếm cơ sở kiến thức và công cụ báo cáo cấp trên để xử lý các truy vấn lặp đi lặp lại mà không cần sự can thiệp của con người. Khả năng gọi nhiều công cụ và hỗ trợ luồng của mô hình khiến nó trở nên thiết thực cho các triển khai hướng tới khách hàng trong thời gian thực. Hỗ trợ song ngữ có nghĩa là cùng một tác nhân có thể xử lý các phiếu hỗ trợ bằng tiếng Trung và tiếng Anh từ một điểm cuối mô hình duy nhất trên Atlas Cloud.

Tạo tài liệu song ngữ ở quy mô lớn

Các nhóm nội dung và doanh nghiệp sử dụng GLM-4.7 để tạo tài liệu Word, bài thuyết trình PowerPoint, tệp PDF và báo cáo Excel bằng cả tiếng Trung và tiếng Anh từ các prompt được cấu trúc. Ở mức 0,52 USD cho mỗi triệu token đầu vào, đây là cấp độ GLM tiết kiệm chi phí nhất cho các quy trình làm việc với khối lượng tài liệu lớn không yêu cầu khả năng suy luận ở mức độ tiên tiến (frontier-level). Cửa sổ ngữ cảnh 202K là đủ để chứa các dàn ý tài liệu đầy đủ và tài liệu nguồn chỉ trong một lần gọi lệnh.

Tối ưu hóa Kernel cho Khối lượng công việc ML

Các nhóm cơ sở hạ tầng AI sử dụng GLM-5.1 để chạy các quy trình tối ưu hóa dựa trên điểm chuẩn trên các khối lượng công việc học máy. Trên các tác vụ kiểu KernelBench, GLM-5.1 thực hiện hàng nghìn chu kỳ tối ưu hóa dựa trên công cụ và đạt được mức tăng tốc trung bình nhân 3,6x. Khả năng thực thi liên tục trong 8 giờ có nghĩa là tác nhân chạy vòng lặp tối ưu hóa đầy đủ mà không cần khởi động lại thủ công giữa các phiên.

Biến tm nhìn doanh nghip ca bn thành hin thc vi Atlas Cloud AI.

Liên hệ kinh doanh

Các câu hỏi thường gặp về mô hình Z.ai

Z-AI (còn được viết là Z.ai) là nhà phát triển đứng sau dòng mô hình ngôn ngữ lớn GLM, còn được biết đến với tên gọi ZhipuAI. GLM là viết tắt của General Language Model (Mô hình Ngôn ngữ Đa dụng), một hệ sinh thái trải dài từ GLM-4.6 đến phiên bản flagship hiện tại là GLM-5.1. Dòng mô hình này được xây dựng cho việc lập trình, luồng công việc tác nhân và sử dụng trong môi trường sản xuất song ngữ Trung-Anh.

GLM-5.1 đã đạt vị trí đầu tiên trên SWE-Bench Pro với số điểm 58,4 vào ngày 7 tháng 4 năm 2026, vượt qua GPT-5.4 (57,7) và Claude Opus 4.6 (57,3). Nó cũng dẫn đầu trên CyberGym với 68,7 điểm. Điều này khiến nó trở thành mô hình mã nguồn mở được xếp hạng cao nhất cho lập trình trong môi trường sản xuất tính đến quý 2 năm 2026.

Có. GLM-5.1 hỗ trợ thực thi tự động liên tục lên đến 8 giờ trên một tác vụ duy nhất mà không cần con người can thiệp. Nó xử lý toàn bộ vòng lặp từ lập kế hoạch, thực thi, tối ưu hóa lặp đi lặp lại và phân phối. Tính năng này được thiết kế đặc biệt cho các quy trình làm việc của tác nhân lập trình dài hạn trong các môi trường như Claude Code và các thiết lập tương thích với OpenClaw.

GLM-5 là mô hình nền tảng cơ sở được xây dựng trên kiến trúc MoE với 744 tỷ tham số, được huấn luyện trên 28,5 nghìn tỷ token và đạt vị trí số 1 về điểm Elo trên Chatbot Arena dành cho các mô hình mã nguồn mở. GLM-5.1 là một bản nâng cấp sau huấn luyện của cùng một nền tảng với khả năng lập trình, sử dụng công cụ và thực thi tự chủ mạnh mẽ hơn đáng kể. GLM-5 có giá 0,95 đô la cho mỗi triệu token đầu vào trên Atlas Cloud; GLM-5.1 là 1,26 đô la cho mỗi triệu token đầu vào.

Có. GLM-5.1 được phát hành theo giấy phép MIT, cho phép sử dụng thương mại, tinh chỉnh (fine-tuning) và phân phối lại mà không có hạn chế nào. Các trọng số mở có sẵn cho việc triển khai tự lưu trữ (self-hosted). Atlas Cloud cung cấp GLM-5.1 qua API cho các nhóm thích quyền truy cập được quản lý mà không phải chịu chi phí cơ sở hạ tầng.

GLM-4.6, GLM-4.7, GLM-5 và GLM-5.1 đều hỗ trợ cửa sổ ngữ cảnh lên đến 202.750 token trên Atlas Cloud. GLM-5 Turbo là một ngoại lệ với cửa sổ ngữ cảnh lớn hơn là 262.144 token và độ dài đầu ra tối đa là 131.072 token. GLM-5.1 rất phù hợp để tạo ra các tệp mã nguồn dài và dấu vết thực thi mở rộng trong giới hạn ngữ cảnh của nó.

Có. Tất cả các mô hình GLM đều được tối ưu hóa cho tiếng Trung và tiếng Anh với sự thành thạo ngang nhau ở cả hai ngôn ngữ. Bạn có thể viết prompt bằng bất kỳ ngôn ngữ nào và nhận lại đầu ra với chất lượng nhất quán. Điều này làm cho GLM trở nên thiết thực đối với các nhóm đang xây dựng sản phẩm phục vụ cả thị trường Trung Quốc và quốc tế chỉ từ một mô hình duy nhất.

GLM-4.7 có giá bắt đầu từ 0,52 USD cho mỗi triệu token đầu vào và là bậc tiết kiệm chi phí nhất. Giá của GLM-4.6 là 0,60 USD, GLM-5 là 0,95 USD và GLM-5 Turbo là 1,20 USD cho mỗi triệu token đầu vào. GLM-5.1, mô hình hàng đầu, có giá 1,26 USD cho mỗi triệu token đầu vào và 3,96 USD cho mỗi triệu token đầu ra. Tất cả các mô hình đều trả tiền theo mức sử dụng (pay-as-you-go) mà không có cam kết hàng tháng.

Khám phá Thêm Dòng

Seedance 2.0 Models

Seedance 2.0(by Bytedance) is a multimodal video generation model that redefines "controllable creation," moving beyond the limitations of text or start/end frames. It supports quad-modal inputs—text, image, video, and audio—and introduces an industry-leading "Universal Reference" system. By precisely replicating the composition, camera movement, and character actions from reference assets, Seedance 2.0 solves critical issues with character consistency and physical coherence, empowering creators to act as true "directors" with deep control over their output.

Xem Dòng

Grok-Imagine Models

Grok Imagine Image Quality is xAI's latest AI image generation model, delivering studio-grade visuals with up to 2K resolution and razor-sharp detail. It offers best-in-class text rendering across multiple languages, photorealistic outputs with natural lighting, rich textures, and believable physics, plus tighter prompt following and image editing with reference inputs for precise creative control. Ideal for hero images, ad creatives, product renders, and brand-grade visuals.

Xem Dòng

Gemini Omni

Gemini Omni (by Google DeepMind) is a video generation and editing model launched on May 20, 2026 at Google I/O that redefines the standard for "reasoning-driven creation," built specifically to solve the core challenge of AI video: making output that actually understands what you mean, not just what you type. It fuses Gemini's reasoning engine with generative capability, accepting any mix of images, text, video, and audio to produce consistent, knowledge-grounded output. Unlike models that start from scratch each time, Omni lets you edit through natural conversation — swapping objects, rewriting scenes, shifting styles — while keeping physics, characters, and continuity intact across every turn.

Xem Dòng

GPT Image 2 Models

GPT Image 2 is a state-of-the-art multimodal foundation model engineered for exceptional text-to-image generation with unprecedented photorealism and creative versatility. Developed by OpenAI as the evolution of the DALL-E lineage, it transforms detailed natural language descriptions into hyper-realistic imagery at up to 4K resolution. With proprietary "Neural Rendering Engine" technology for precise visual control, GPT Image 2 delivers studio-quality results with accurate anatomy, lighting, and composition—making it the premier AI tool for professional creators, enterprises, and developers demanding production-ready visual assets.

Xem Dòng

Google Models on Atlas Cloud | Gemini, Nano Bananas & Veo

Các mô hình sáng tạo mạnh mẽ nhất của Google hiện đều có sẵn trên Atlas Cloud. Veo 3.1 cung cấp khả năng tạo video đậm chất điện ảnh, Nano Banana 2 hỗ trợ tạo hình ảnh có độ chân thực cao, và Gemini mang trí tuệ đa phương thức vào mọi quy trình làm việc. Truy cập toàn bộ bộ mô hình Google thông qua một API key duy nhất với tính khả dụng Day-0 và mức giá dùng bao nhiêu trả bấy nhiêu (pay-as-you-go).

Xem Dòng

ByteDance Models on Atlas Cloud | Seedance & Seedream

Từ tạo video điện ảnh đến kiến tạo hình ảnh có độ trung thực cao, các mô hình mạnh mẽ nhất của ByteDance hiện đã có mặt trên Atlas Cloud. Chạy Seedance và Seedream ở quy mô lớn với mức giá suy luận thấp nhất và không có chi phí quản lý cơ sở hạ tầng.

Xem Dòng

Alibaba Models on Atlas Cloud | Wan & Qwen

Atlas Cloud tập hợp toàn bộ dòng mô hình của Alibaba dưới một API duy nhất: Qwen cho các tác vụ ngôn ngữ và hình ảnh, Wan để tạo video với độ phân giải lên đến 1080p. Truy cập mọi mô hình theo hình thức dùng đến đâu trả tiền đến đó (pay-as-you-go) mà không cần đăng ký gói. Alibaba API có sẵn thông qua một URL cơ sở (base URL) duy nhất bằng cách sử dụng ứng dụng khách tương thích với OpenAI hiện có của bạn.

Xem Dòng

MAI Image 2.5 Models

MAI-Image-2.5 là dòng mô hình chỉnh sửa và tạo hình ảnh chân thực mới nhất của Microsoft, được xây dựng cho thiết kế thương mại, nhiếp ảnh sản phẩm và tạo nội dung sẵn sàng cho thương hiệu. Có sẵn trong các biến thể tiêu chuẩn và Flash cho cả việc tạo hình ảnh từ văn bản và chỉnh sửa hình ảnh, nó mang lại điểm số Arena ELO tốt nhất trong phân khúc với mức giá cạnh tranh — chỉ từ 0,03 đô la cho mỗi hình ảnh. Với khả năng hiển thị văn bản chính xác, khả năng chỉnh sửa sắc sảo như phẫu thuật và tạo chân dung tự nhiên, MAI-Image-2.5 được thiết kế cho các nhóm cần hình ảnh chất lượng sản xuất mà không phải chịu chi phí xử lý hậu kỳ.

Xem Dòng

Wan2.7 Models

Launching this March, Wan2.7 is the latest powerhouse in the Qwen ecosystem, delivering a massive upgrade in visual fidelity, audio synchronization, and motion consistency over version 2.6. This all-in-one AI video generator supports advanced features like first-and-last frame control, 3x3 grid synthesis, and instruction-based video editing. Outperforming competitors like Jimeng, Wan2.7 offers superior flexibility with support for real-person image inputs, up to five video references, and 1080P high-definition outputs spanning 2 to 15 seconds, making it the premier choice for professional digital storytelling and high-end content marketing.

Xem Dòng

Nano Banana2 Models

Nano Banana 2 (by Google), is a generative image model that perfectly balances lightning-fast rendering with exceptional visual quality. With an improved price-performance ratio, it achieves breakthrough micro-detail depiction, accurate native text rendering, and complex physical structure reconstruction. It serves as a highly efficient, commercial-grade visual production tool for developers, marketing teams, and content creators.

Xem Dòng

Doubao Models

Doubao là dòng mô hình ngôn ngữ lớn của ByteDance, được thiết kế cho khả năng suy luận cấp sản xuất, lập trình và khối lượng công việc lớn của các tác nhân (agentic workloads). Bao gồm bản phát hành hàng đầu Seed 2.0 Pro, biến thể Code Preview chuyên dụng, các cấp độ Lite và Mini tiết kiệm chi phí, cùng với các thế hệ Seed 1.8 và Seed 1.6 đã được kiểm chứng, dải sản phẩm này cung cấp cho các nhà phát triển một giao diện duy nhất tương thích với OpenAI để mở rộng từ khả năng suy luận tiên tiến xuống các tác vụ có thông lượng cao, nhạy cảm với độ trễ. Mọi mô hình Doubao trên Atlas Cloud đều có cửa sổ ngữ cảnh 256K token, tính năng phát trực tuyến (streaming) và khả năng tương thích SDK liền mạch (drop-in) — nhờ đó bạn có thể chọn đúng mô hình cho từng công việc mà không cần viết lại ngăn xếp công nghệ (stack) của mình.

Xem Dòng

Hunyuan 3D Generation Models

Hunyuan3D is a state-of-the-art 3D generative foundation model from Tencent that turns text prompts and single images into high-quality, textured 3D meshes. Built on a two-stage pipeline—Hunyuan3D-DiT for shape generation via flow-matching diffusion and Hunyuan3D-Paint for multi-view texture synthesis—it produces clean geometry with full PBR materials ready for game engines, AR/VR, 3D printing, and DCC tools. Available in Pro (up to 1.5M faces, 4K PBR textures) and Rapid (2–3 minute lightweight generation) tiers, with both Text-to-3D and Image-to-3D entry points, Hunyuan3D is the premier AI 3D toolkit for game developers, e-commerce teams, and 3D content studios. Generations start at $0.02 each.

Xem Dòng

Bài viết đề xuất

Hướng dẫn, bài hướng dẫn và cập nhật sản phẩm giúp bạn khai thác tối đa Atlas Cloud.

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.