
Atlas Cloud lưu trữ toàn bộ loạt mô hình GLM thông qua API Z-AI, từ GLM-4.6 đến GLM-5.1. Tất cả các mô hình đều hỗ trợ song ngữ và có sẵn theo hình thức thanh toán theo mức sử dụng (pay-as-you-go) với cửa sổ ngữ cảnh 202K.
Thúc đẩy trò chuyện, suy luận và tác tử ở quy mô lớn với các mô hình ngôn ngữ lớn hàng đầu, được cung cấp nhanh chóng và tiết kiệm trên Atlas Cloud.
Compare standard vs. our pricing across every Z.ai model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| GLM 5.1 | $1.4/$4.4per 1M tokens202.8K context | $1.26/$3.96M in/outper 1M tokens202.8K context | -10% | View |
| GLM 5 Turbo | $1.2/$4per 1M tokens262.1K context | $1.2/$4M in/outper 1M tokens262.1K context | — | View |
| GLM 5 | $1/$3.2per 1M tokens202.8K context | $0.95/$3.15M in/outper 1M tokens202.8K context | — | View |
| GLM 4.7 | $0.6/$2.2per 1M tokens202.8K context | $0.52/$1.85M in/outper 1M tokens202.8K context | — | View |
| GLM 4.6 | $0.6/$2.2per 1M tokens202.8K context | $0.6/$2.2M in/outper 1M tokens202.8K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Các cấp độ mô hình của GLM bao gồm mọi thứ, từ các tác vụ trò chuyện song ngữ nhanh chóng cho đến các tác nhân lập trình tự trị kéo dài nhiều giờ. Các nhóm sử dụng GLM-5.1 cho công việc kỹ thuật dài hạn và GLM-4.7 hoặc GLM-5 Turbo khi ưu tiên hiệu quả chi phí và tốc độ.
Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.
Các nhóm phát triển sử dụng GLM-5.1 để thực hiện các quá trình chuyển đổi toàn bộ cơ sở mã trong các phiên làm việc kéo dài nhiều giờ mà không cần đến các điểm kiểm tra của con người. Mô hình lập kế hoạch, viết, thử nghiệm và lặp lại các thay đổi liên tục trong tối đa 8 giờ, xử lý 655 lần lặp trong một bản trình diễn xây dựng hệ thống Linux từ đầu. Điều này thay thế hàng tuần làm việc tái cấu trúc thủ công trên các cơ sở mã lớn, kế thừa.
Các nhóm công cụ dành cho nhà phát triển tích hợp GLM-5.1 và GLM-5 Turbo làm mô hình cơ bản cho quy trình mã hóa AI trong Claude Code, Kilo Code, Cline, Roo Code và OpenCode. Z-AI API trên Atlas Cloud tương thích với OpenAI, do đó, việc thay đổi base URL là thay đổi duy nhất cần thiết để định tuyến bất kỳ công cụ nào trong số này thông qua GLM. Cửa sổ ngữ cảnh 262K của GLM-5 Turbo khiến nó đặc biệt phù hợp với ngữ cảnh tệp lớn trong quy trình làm việc của IDE.
Các nhóm vận hành xây dựng các tác nhân hỗ trợ bằng GLM-5, kết hợp quyền truy cập cơ sở dữ liệu phiếu hỗ trợ, tìm kiếm cơ sở kiến thức và công cụ báo cáo cấp trên để xử lý các truy vấn lặp đi lặp lại mà không cần sự can thiệp của con người. Khả năng gọi nhiều công cụ và hỗ trợ luồng của mô hình khiến nó trở nên thiết thực cho các triển khai hướng tới khách hàng trong thời gian thực. Hỗ trợ song ngữ có nghĩa là cùng một tác nhân có thể xử lý các phiếu hỗ trợ bằng tiếng Trung và tiếng Anh từ một điểm cuối mô hình duy nhất trên Atlas Cloud.
Các nhóm nội dung và doanh nghiệp sử dụng GLM-4.7 để tạo tài liệu Word, bài thuyết trình PowerPoint, tệp PDF và báo cáo Excel bằng cả tiếng Trung và tiếng Anh từ các prompt được cấu trúc. Ở mức 0,52 USD cho mỗi triệu token đầu vào, đây là cấp độ GLM tiết kiệm chi phí nhất cho các quy trình làm việc với khối lượng tài liệu lớn không yêu cầu khả năng suy luận ở mức độ tiên tiến (frontier-level). Cửa sổ ngữ cảnh 202K là đủ để chứa các dàn ý tài liệu đầy đủ và tài liệu nguồn chỉ trong một lần gọi lệnh.
Các nhóm cơ sở hạ tầng AI sử dụng GLM-5.1 để chạy các quy trình tối ưu hóa dựa trên điểm chuẩn trên các khối lượng công việc học máy. Trên các tác vụ kiểu KernelBench, GLM-5.1 thực hiện hàng nghìn chu kỳ tối ưu hóa dựa trên công cụ và đạt được mức tăng tốc trung bình nhân 3,6x. Khả năng thực thi liên tục trong 8 giờ có nghĩa là tác nhân chạy vòng lặp tối ưu hóa đầy đủ mà không cần khởi động lại thủ công giữa các phiên.
Z-AI (còn được viết là Z.ai) là nhà phát triển đứng sau dòng mô hình ngôn ngữ lớn GLM, còn được biết đến với tên gọi ZhipuAI. GLM là viết tắt của General Language Model (Mô hình Ngôn ngữ Đa dụng), một hệ sinh thái trải dài từ GLM-4.6 đến phiên bản flagship hiện tại là GLM-5.1. Dòng mô hình này được xây dựng cho việc lập trình, luồng công việc tác nhân và sử dụng trong môi trường sản xuất song ngữ Trung-Anh.
GLM-5.1 đã đạt vị trí đầu tiên trên SWE-Bench Pro với số điểm 58,4 vào ngày 7 tháng 4 năm 2026, vượt qua GPT-5.4 (57,7) và Claude Opus 4.6 (57,3). Nó cũng dẫn đầu trên CyberGym với 68,7 điểm. Điều này khiến nó trở thành mô hình mã nguồn mở được xếp hạng cao nhất cho lập trình trong môi trường sản xuất tính đến quý 2 năm 2026.
Có. GLM-5.1 hỗ trợ thực thi tự động liên tục lên đến 8 giờ trên một tác vụ duy nhất mà không cần con người can thiệp. Nó xử lý toàn bộ vòng lặp từ lập kế hoạch, thực thi, tối ưu hóa lặp đi lặp lại và phân phối. Tính năng này được thiết kế đặc biệt cho các quy trình làm việc của tác nhân lập trình dài hạn trong các môi trường như Claude Code và các thiết lập tương thích với OpenClaw.
GLM-5 là mô hình nền tảng cơ sở được xây dựng trên kiến trúc MoE với 744 tỷ tham số, được huấn luyện trên 28,5 nghìn tỷ token và đạt vị trí số 1 về điểm Elo trên Chatbot Arena dành cho các mô hình mã nguồn mở. GLM-5.1 là một bản nâng cấp sau huấn luyện của cùng một nền tảng với khả năng lập trình, sử dụng công cụ và thực thi tự chủ mạnh mẽ hơn đáng kể. GLM-5 có giá 0,95 đô la cho mỗi triệu token đầu vào trên Atlas Cloud; GLM-5.1 là 1,26 đô la cho mỗi triệu token đầu vào.
Có. GLM-5.1 được phát hành theo giấy phép MIT, cho phép sử dụng thương mại, tinh chỉnh (fine-tuning) và phân phối lại mà không có hạn chế nào. Các trọng số mở có sẵn cho việc triển khai tự lưu trữ (self-hosted). Atlas Cloud cung cấp GLM-5.1 qua API cho các nhóm thích quyền truy cập được quản lý mà không phải chịu chi phí cơ sở hạ tầng.
GLM-4.6, GLM-4.7, GLM-5 và GLM-5.1 đều hỗ trợ cửa sổ ngữ cảnh lên đến 202.750 token trên Atlas Cloud. GLM-5 Turbo là một ngoại lệ với cửa sổ ngữ cảnh lớn hơn là 262.144 token và độ dài đầu ra tối đa là 131.072 token. GLM-5.1 rất phù hợp để tạo ra các tệp mã nguồn dài và dấu vết thực thi mở rộng trong giới hạn ngữ cảnh của nó.
Có. Tất cả các mô hình GLM đều được tối ưu hóa cho tiếng Trung và tiếng Anh với sự thành thạo ngang nhau ở cả hai ngôn ngữ. Bạn có thể viết prompt bằng bất kỳ ngôn ngữ nào và nhận lại đầu ra với chất lượng nhất quán. Điều này làm cho GLM trở nên thiết thực đối với các nhóm đang xây dựng sản phẩm phục vụ cả thị trường Trung Quốc và quốc tế chỉ từ một mô hình duy nhất.
GLM-4.7 có giá bắt đầu từ 0,52 USD cho mỗi triệu token đầu vào và là bậc tiết kiệm chi phí nhất. Giá của GLM-4.6 là 0,60 USD, GLM-5 là 0,95 USD và GLM-5 Turbo là 1,20 USD cho mỗi triệu token đầu vào. GLM-5.1, mô hình hàng đầu, có giá 1,26 USD cho mỗi triệu token đầu vào và 3,96 USD cho mỗi triệu token đầu ra. Tất cả các mô hình đều trả tiền theo mức sử dụng (pay-as-you-go) mà không có cam kết hàng tháng.
Hướng dẫn, bài hướng dẫn và cập nhật sản phẩm giúp bạn khai thác tối đa Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.