Z.ai API for Top Open-Source GLM Coding

Z.ai API đưa toàn bộ dòng GLM của ZhipuAI vào stack của bạn, từ GLM-4.6 đến mẫu flagship GLM-5.1, mô hình đứng đầu trong số các mô hình open-source trên SWE-Bench Pro và có thể chạy các autonomous coding agents liên tục trong nhiều giờ. GLM kết hợp ngữ cảnh 202K token với khả năng đầu ra tiếng Trung và tiếng Anh cân bằng, theo giấy phép MIT linh hoạt. Atlas Cloud cung cấp từng mô hình thông qua một khóa tương thích OpenAI duy nhất, với quyền truy cập Day-0 và giá theo từng lượt gọi minh bạch. Hãy bắt đầu ngay hôm nay.

Large Language Models by Z.ai

Thúc đẩy trò chuyện, suy luận và tác tử ở quy mô lớn với các mô hình ngôn ngữ lớn hàng đầu, được cung cấp nhanh chóng và tiết kiệm trên Atlas Cloud.

Xem tất cả mô hình

LLM

GLM

GLM là dòng LLM chủ lực của Z.ai từ Zhipu AI, và GLM API bao phủ mọi nhu cầu, từ GLM-5 có năng lực tác nhân đến GLM-4.6 357B MoE hiệu quả. Các model này chuyên về thực thi tác vụ tự chủ, điều phối tác nhân phức tạp và lập trình ở cấp độ production. Trên Atlas Cloud, một endpoint hợp nhất duy nhất cho bạn quyền truy cập Day-0 vào toàn bộ họ GLM với mức giá theo mức sử dụng và thời gian hoạt động production đáng tin cậy. Hãy bắt đầu xây dựng ngay hôm nay.

6 mô hìnhKhám phá GLM

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

Model	Standard Price (USD)	Our Price (USD)	Discount
GLM 5.2	$1.4/$4.4per 1M tokens1048.6K context	$1.26/$3.96M in/outper 1M tokens1048.6K context	-10%	View
GLM 5.1	$1.4/$4.4per 1M tokens202.8K context	$1.26/$3.96M in/outper 1M tokens202.8K context	-10%	View
GLM 5v Turbo	$1.2/$4per 1M tokens202.8K context	$1.2/$4M in/outper 1M tokens202.8K context	—	View
GLM 5	$1/$3.2per 1M tokens202.8K context	$0.95/$3.15M in/outper 1M tokens202.8K context	—	View
GLM 4.7	$0.6/$2.2per 1M tokens202.8K context	$0.52/$1.85M in/outper 1M tokens202.8K context	—	View
GLM 4.6	$0.6/$2.2per 1M tokens202.8K context	$0.6/$2.2M in/outper 1M tokens202.8K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Các trường hợp sử dụng Z-AI API bạn có thể xây dựng trên Atlas Cloud

Các cấp độ mô hình của GLM bao gồm mọi thứ, từ các tác vụ trò chuyện song ngữ nhanh chóng cho đến các tác nhân lập trình tự trị kéo dài nhiều giờ. Các nhóm sử dụng GLM-5.1 cho công việc kỹ thuật dài hạn và GLM-4.7 hoặc GLM-5 Turbo khi ưu tiên hiệu quả chi phí và tốc độ.

Tối ưu hóa hiệu suất cơ sở dữ liệu dài hạn

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

Tái Cấu Trúc Mã Nguồn Tự Trị Quy Mô Kho Lưu Trữ

Các nhóm phát triển sử dụng GLM-5.1 để thực hiện các quá trình chuyển đổi toàn bộ cơ sở mã trong các phiên làm việc kéo dài nhiều giờ mà không cần đến các điểm kiểm tra của con người. Mô hình lập kế hoạch, viết, thử nghiệm và lặp lại các thay đổi liên tục trong tối đa 8 giờ, xử lý 655 lần lặp trong một bản trình diễn xây dựng hệ thống Linux từ đầu. Điều này thay thế hàng tuần làm việc tái cấu trúc thủ công trên các cơ sở mã lớn, kế thừa.

Tích hợp Tác nhân Lập trình IDE

Các nhóm công cụ dành cho nhà phát triển tích hợp GLM-5.1 và GLM-5 Turbo làm mô hình cơ bản cho quy trình mã hóa AI trong Claude Code, Kilo Code, Cline, Roo Code và OpenCode. Z-AI API trên Atlas Cloud tương thích với OpenAI, do đó, việc thay đổi base URL là thay đổi duy nhất cần thiết để định tuyến bất kỳ công cụ nào trong số này thông qua GLM. Cửa sổ ngữ cảnh 262K của GLM-5 Turbo khiến nó đặc biệt phù hợp với ngữ cảnh tệp lớn trong quy trình làm việc của IDE.

Tự Động Hóa Truy Vấn Hỗ Trợ Cấp 1

Các nhóm vận hành xây dựng các tác nhân hỗ trợ bằng GLM-5, kết hợp quyền truy cập cơ sở dữ liệu phiếu hỗ trợ, tìm kiếm cơ sở kiến thức và công cụ báo cáo cấp trên để xử lý các truy vấn lặp đi lặp lại mà không cần sự can thiệp của con người. Khả năng gọi nhiều công cụ và hỗ trợ luồng của mô hình khiến nó trở nên thiết thực cho các triển khai hướng tới khách hàng trong thời gian thực. Hỗ trợ song ngữ có nghĩa là cùng một tác nhân có thể xử lý các phiếu hỗ trợ bằng tiếng Trung và tiếng Anh từ một điểm cuối mô hình duy nhất trên Atlas Cloud.

Tạo tài liệu song ngữ ở quy mô lớn

Các nhóm nội dung và doanh nghiệp sử dụng GLM-4.7 để tạo tài liệu Word, bài thuyết trình PowerPoint, tệp PDF và báo cáo Excel bằng cả tiếng Trung và tiếng Anh từ các prompt được cấu trúc. Ở mức 0,52 USD cho mỗi triệu token đầu vào, đây là cấp độ GLM tiết kiệm chi phí nhất cho các quy trình làm việc với khối lượng tài liệu lớn không yêu cầu khả năng suy luận ở mức độ tiên tiến (frontier-level). Cửa sổ ngữ cảnh 202K là đủ để chứa các dàn ý tài liệu đầy đủ và tài liệu nguồn chỉ trong một lần gọi lệnh.

Tối ưu hóa Kernel cho Khối lượng công việc ML

Các nhóm cơ sở hạ tầng AI sử dụng GLM-5.1 để chạy các quy trình tối ưu hóa dựa trên điểm chuẩn trên các khối lượng công việc học máy. Trên các tác vụ kiểu KernelBench, GLM-5.1 thực hiện hàng nghìn chu kỳ tối ưu hóa dựa trên công cụ và đạt được mức tăng tốc trung bình nhân 3,6x. Khả năng thực thi liên tục trong 8 giờ có nghĩa là tác nhân chạy vòng lặp tối ưu hóa đầy đủ mà không cần khởi động lại thủ công giữa các phiên.

Biến tầm nhìn doanh nghiệp của bạn thành hiện thực với Atlas Cloud AI.

Liên hệ kinh doanh

Những điều nhà phát triển thường hỏi về Z.ai API

Z.ai API cho phép nhà phát triển truy cập theo cách lập trình vào dòng mô hình ngôn ngữ lớn GLM do Z.ai xây dựng, công ty còn được biết đến với tên Zhipu AI. GLM là viết tắt của General Language Model và bao gồm các phiên bản từ GLM-4.6 đến flagship GLM-5.1, được tinh chỉnh cho lập trình, quy trình làm việc agentic và sử dụng trong môi trường sản xuất song ngữ tiếng Trung và tiếng Anh. Trên Atlas Cloud, bạn có thể truy cập toàn bộ dòng mô hình thông qua một endpoint tương thích OpenAI.

Atlas Cloud lưu trữ dòng GLM từ GLM-4.6 đến flagship GLM-5.1, bao gồm cả GLM-4.7 và GLM-5 ở giữa. Các tier nhẹ hơn xử lý những tác vụ hằng ngày khối lượng lớn với chi phí thấp hơn, trong khi GLM-5.1 nhắm đến các công việc lập trình và agentic đòi hỏi cao nhất. Mọi mô hình đều chạy theo cơ chế pay-as-you-go bằng cùng một key.

Có. Các open weights của GLM, bao gồm GLM-5.1, được phát hành theo giấy phép MIT, cho phép sử dụng thương mại, fine-tuning và phân phối lại không hạn chế. Nếu bạn muốn tránh gánh nặng hạ tầng, Atlas Cloud cung cấp các mô hình tương tự qua API để truy cập được quản lý thay vì tự host.

Trỏ OpenAI SDK hiện có của bạn đến base URL của Atlas Cloud, thiết lập key và truyền tên mô hình GLM bạn muốn dùng. Vì Z.ai API tương thích OpenAI, hầu hết dự án có thể migrate chỉ bằng cách đổi base URL và chuỗi model; các mô hình cũng tích hợp trực tiếp với các công cụ agent như Claude Code, Cline và Roo Code. Hãy bắt đầu xây dựng ngay hôm nay.

Cả tiếng Trung và tiếng Anh đều là ngôn ngữ được hỗ trợ ở mức first-class trong GLM, với quá trình huấn luyện nhằm đạt năng lực mạnh ở từng ngôn ngữ. Bạn có thể prompt bằng một trong hai ngôn ngữ và nhận lại chất lượng nhất quán, giúp dòng mô hình này phù hợp cho các đội ngũ phục vụ người dùng Trung Quốc và quốc tế từ một mô hình duy nhất thay vì phải duy trì các stack riêng biệt.

Từ GLM-4.6 đến GLM-5.1 hỗ trợ cửa sổ ngữ cảnh 200K token, đủ để chứa các codebase lớn, tài liệu dài hoặc trace agent kéo dài trong một request duy nhất. Nếu workflow của bạn tạo đầu ra dài, cùng cửa sổ này cũng bao phủ các tệp mã lớn và log thực thi nhiều bước mà không bị cắt sớm.

GLM-5.1 đứng đầu SWE-Bench Pro với điểm số 58.4 vào tháng 4 năm 2026, đưa nó vào nhóm các mô hình open-source mạnh nhất cho lập trình trong thực tế. Mô hình này cũng hỗ trợ thực thi tự động liên tục lên đến tám giờ cho một tác vụ duy nhất, chạy lập kế hoạch, lặp và bàn giao trong cùng một vòng lặp, phù hợp với các workflow agent dài hạn trong những môi trường như Claude Code.

Mọi mô hình GLM trên Z.ai API đều chạy theo giá pay-as-you-go minh bạch, tính phí theo token, không yêu cầu subscription hay cam kết hằng tháng. Token đầu vào và đầu ra được đo riêng, và các tier nhẹ hơn như GLM-4.7 có chi phí trên mỗi token thấp hơn so với flagship GLM-5.1, nên bạn có thể chọn mô hình phù hợp với ngân sách. Hãy xem mức giá theo token hiện tại trên từng model card trong Atlas Cloud.

Khám phá Thêm Dòng

Seedance 2.0

Seedance 2.0 API cung cấp cho bạn quyền truy cập cấp sản xuất vào mô hình video đa phương thức của ByteDance — đầu vào bốn phương thức (văn bản, hình ảnh, video, âm thanh) và hệ thống "Universal Reference" hàng đầu trong ngành giúp khóa bố cục, chuyển động của camera và hành động của nhân vật trên các cảnh quay. Tích hợp quyền kiểm soát cấp độ đạo diễn bằng một lệnh gọi API, mức giá cố định $0,09/giây, cấp khóa tức thì và không có danh sách chờ — được hỗ trợ bởi thời gian hoạt động và sự tuân thủ cấp doanh nghiệp. Seedance 2.0 Native 4K hiện đã ra mắt!

Xem Dòng

GPT Image 2

GPT Image 2 API cung cấp cho các nhà phát triển quyền truy cập vào mô hình hình ảnh mới nhất của OpenAI, phiên bản kế nhiệm của GPT Image 1.5. Mô hình này tạo và chỉnh sửa hình ảnh với khả năng hiển thị văn bản chính xác trên các chữ viết Latinh và CJK, cùng với bố cục mạnh mẽ cho áp phích, mockup và đồ họa thông tin. Trên Atlas Cloud, bạn có thể truy cập nó thông qua một API thống nhất cùng với hơn 300 mô hình khác, với tín dụng miễn phí, 99,99% thời gian hoạt động và không yêu cầu xác minh tổ chức OpenAI.

Xem Dòng

Seedream 5.0 Pro

Seedream 5.0 Pro API cung cấp cho các nhà phát triển mô hình chỉnh sửa hình ảnh có thể kiểm soát của ByteDance trên Atlas Cloud. Nó đặt các chỉnh sửa một cách chính xác bằng các điểm neo và tọa độ, tách hình ảnh thành các lớp có thể chỉnh sửa, kết hợp nhiều tham chiếu và khớp màu sắc cũng như vật liệu chính xác, với văn bản đa ngôn ngữ ở độ phân giải 2K và 3K. Trên Atlas Cloud, bạn có thể truy cập nó chỉ bằng một khóa!

Xem Dòng

Gemini Omni Flash

Gemini Omni API đưa mô hình tạo và chỉnh sửa video đa phương thức của Google DeepMind, được giới thiệu tại Google I/O 2026, vào stack của bạn. Gemini Omni kết hợp công cụ suy luận của Gemini với media tạo sinh, chấp nhận mọi tổ hợp văn bản, hình ảnh, video và âm thanh để tạo ra kết quả nhất quán, dựa trên nền tảng tri thức. Tinh chỉnh kết quả qua hội thoại tự nhiên — hoán đổi vật thể, viết lại cảnh quay và thay đổi phong cách, trong khi vật lý, nhân vật và tính liên tục vẫn được giữ nguyên. Atlas Cloud cung cấp trọn bộ dòng Gemini Omni Flash — chuyển văn bản thành video, chuyển hình ảnh thành video với tối đa 7 hình ảnh tham chiếu, và chuyển tham chiếu thành video — thông qua một API hợp nhất với mức giá minh bạch tính theo giây từ $0.112 và không cần đăng ký thuê bao. Bắt đầu xây dựng ngay hôm nay.

Xem Dòng

Grok Imagine

Grok Imagine API cung cấp cho các nhà phát triển khả năng tạo hình ảnh, video và âm thanh của xAI trong một bộ công cụ duy nhất. API này tạo ra hình ảnh độ phân giải lên đến 2K với khả năng hiển thị văn bản đa ngôn ngữ, cộng với video lên đến 15 giây với âm thanh gốc, được đồng bộ hóa và chỉnh sửa dựa trên tham chiếu. Trên Atlas Cloud, một khóa duy nhất có thể chạy mọi chế độ Grok Imagine, do đó bạn có thể chuyển đổi giữa hình ảnh, video và âm thanh mà không cần thiết lập riêng biệt, với mức giá từ 0,02 USD cho mỗi hình ảnh và 0,05 USD mỗi giây.

Xem Dòng

Google

Các mô hình sáng tạo mạnh mẽ nhất của Google hiện đều có sẵn trên Atlas Cloud. Veo 3.1 cung cấp khả năng tạo video đậm chất điện ảnh, Nano Banana 2 hỗ trợ tạo hình ảnh có độ chân thực cao, và Gemini mang trí tuệ đa phương thức vào mọi quy trình làm việc. Truy cập toàn bộ bộ mô hình Google thông qua một API key duy nhất với tính khả dụng Day-0 và mức giá dùng bao nhiêu trả bấy nhiêu (pay-as-you-go).

Xem Dòng

Seedance 2.0 Mini

Seedance 2.0 Mini mang khả năng tạo video đa phương thức của ByteDance vào các quy trình làm việc nơi tốc độ và chi phí là quan trọng nhất. Nó cung cấp các khả năng cốt lõi của Seedance 2.0 với mức tiêu thụ tài nguyên nhẹ hơn — tạo nhanh hơn, chi phí mỗi video thấp hơn và tích hợp API giống như bạn đã sử dụng. Đối với các nhóm chạy các quy trình (pipeline) khối lượng lớn hoặc tạo nguyên mẫu ở quy mô lớn, Mini là lựa chọn mặc định thiết thực.

Xem Dòng

ByteDance

Từ tạo video điện ảnh đến kiến tạo hình ảnh có độ trung thực cao, các mô hình mạnh mẽ nhất của ByteDance hiện đã có mặt trên Atlas Cloud. Chạy Seedance và Seedream ở quy mô lớn với mức giá suy luận thấp nhất và không có chi phí quản lý cơ sở hạ tầng.

Xem Dòng

Alibaba

Atlas Cloud tập hợp toàn bộ dòng mô hình của Alibaba dưới một API duy nhất: Qwen cho các tác vụ ngôn ngữ và hình ảnh, Wan để tạo video với độ phân giải lên đến 1080p. Truy cập mọi mô hình theo hình thức dùng đến đâu trả tiền đến đó (pay-as-you-go) mà không cần đăng ký gói. Alibaba API có sẵn thông qua một URL cơ sở (base URL) duy nhất bằng cách sử dụng ứng dụng khách tương thích với OpenAI hiện có của bạn.

Xem Dòng

OpenAI

Atlas Cloud cấp cho bạn quyền truy cập vào toàn bộ danh mục OpenAI API, từ GPT Image 2 để tạo hình ảnh đến Sora 2 cho video. Mọi mô hình đều có sẵn theo hình thức dùng đến đâu trả tiền đến đó (pay-as-you-go) mà không cần cam kết hàng tháng. Tích hợp dễ dàng chỉ bằng cách thay đổi một base URL thông qua API tương thích với OpenAI.

Xem Dòng

xAI

Xây dựng các pipeline hình ảnh và video hoàn chỉnh bằng xAI API trên Atlas Cloud. Tạo ở độ phân giải 2K, chỉnh sửa bằng hình ảnh tham chiếu và tạo hoạt ảnh từ hình ảnh thành các clip đồng bộ với âm thanh.

Xem Dòng

Kwaivgi

Kwaivgi API với mức giá thấp hơn 15% so với giá tiêu chuẩn. Atlas Cloud cung cấp quyền truy cập Day-0 cho các bản phát hành Kling mới với mức giá dùng trả theo mức sử dụng (pay-as-you-go) và không giới hạn số lượng người dùng. Một tài khoản, một khóa, mọi mô hình Kling từ cấp tiêu chuẩn đến cấp master.

Xem Dòng