Z.ai API for Top Open-Source GLM Coding

Atlas Cloud menampung seluruh seri GLM melalui API Z-AI, dari GLM-4.6 hingga GLM-5.1. Semua model bersifat dwibahasa dan tersedia dengan sistem bayar sesuai pemakaian (pay-as-you-go) dengan jendela konteks 202K.

Large Language Models by Z.ai

Dukung chat, penalaran, dan agen dalam skala besar dengan model bahasa besar terdepan, yang disajikan cepat dan terjangkau di Atlas Cloud.

Lihat semua model

LLM

GLM

GLM adalah seri LLM unggulan Z.ai dari Zhipu AI, dan GLM API mencakup semuanya, mulai dari GLM-5 yang bersifat agentic hingga GLM-4.6 357B MoE yang efisien. Model-model ini unggul dalam eksekusi tugas otonom, orkestrasi agen yang kompleks, dan pemrograman kelas produksi. Di Atlas Cloud, satu endpoint terpadu memberi Anda akses Day-0 ke seluruh keluarga GLM dengan harga berbasis penggunaan dan uptime produksi yang andal. Mulai membangun hari ini.

6 modelJelajahi GLM

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

Model	Standard Price (USD)	Our Price (USD)	Discount
GLM 5.2	$1.4/$4.4per 1M tokens1048.6K context	$1.26/$3.96M in/outper 1M tokens1048.6K context	-10%	View
GLM 5.1	$1.4/$4.4per 1M tokens202.8K context	$1.26/$3.96M in/outper 1M tokens202.8K context	-10%	View
GLM 5v Turbo	$1.2/$4per 1M tokens202.8K context	$1.2/$4M in/outper 1M tokens202.8K context	—	View
GLM 5	$1/$3.2per 1M tokens202.8K context	$0.95/$3.15M in/outper 1M tokens202.8K context	—	View
GLM 4.7	$0.6/$2.2per 1M tokens202.8K context	$0.52/$1.85M in/outper 1M tokens202.8K context	—	View
GLM 4.6	$0.6/$2.2per 1M tokens202.8K context	$0.6/$2.2M in/outper 1M tokens202.8K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Kasus Penggunaan Z-AI API yang Dapat Anda Bangun di Atlas Cloud

Tingkat model GLM mencakup semuanya, mulai dari tugas obrolan dwibahasa yang cepat hingga agen pengkodean otonom yang memakan waktu berjam-jam. Tim menggunakan GLM-5.1 untuk pekerjaan rekayasa jangka panjang dan GLM-4.7 atau GLM-5 Turbo di mana efisiensi biaya dan kecepatan menjadi prioritas.

Optimasi Kinerja Basis Data Jangka Panjang

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

Refactoring Kode Otonom Skala Repositori

Tim pengembang menggunakan GLM-5.1 untuk mengeksekusi transformasi basis kode penuh selama sesi multi-jam tanpa titik pemeriksaan manusia. Model ini merencanakan, menulis, menguji, dan mengiterasi perubahan secara terus-menerus hingga 8 jam, menangani 655 iterasi dalam demonstrasi pembuatan sistem Linux dari awal. Hal ini menggantikan pekerjaan refaktorisasi manual selama berminggu-minggu pada basis kode warisan yang besar.

Integrasi Agen Pengodean IDE

Tim alat pengembang mengintegrasikan GLM-5.1 dan GLM-5 Turbo sebagai model dasar untuk alur kerja pengkodean AI di Claude Code, Kilo Code, Cline, Roo Code, dan OpenCode. Z-AI API di Atlas Cloud kompatibel dengan OpenAI, sehingga penggantian base URL adalah satu-satunya perubahan yang diperlukan untuk merutekan salah satu alat ini melalui GLM. Jendela konteks 262K pada GLM-5 Turbo membuatnya sangat cocok untuk konteks file besar dalam alur kerja IDE.

Otomatisasi Kueri Dukungan Tier-1

Tim operasi membangun agen dukungan menggunakan GLM-5 yang menggabungkan akses basis data tiket, pencarian basis pengetahuan, dan alat eskalasi untuk menangani kueri berulang tanpa intervensi manusia. Kemampuan pemanggilan banyak alat dan dukungan streaming pada model membuatnya praktis untuk penerapan yang berhadapan langsung dengan pelanggan secara real-time. Dukungan dua bahasa berarti agen yang sama menangani tiket berbahasa Mandarin dan Inggris dari satu titik akhir model di Atlas Cloud.

Pembuatan Dokumen Dwibahasa dalam Skala Besar

Tim konten dan bisnis menggunakan GLM-4.7 untuk menghasilkan dokumen Word, presentasi PowerPoint, PDF, dan laporan Excel baik dalam bahasa Mandarin maupun bahasa Inggris dari prompt yang terstruktur. Pada harga $0,52 per juta token input, ini adalah tingkat GLM yang paling hemat biaya untuk alur kerja dokumen bervolume tinggi yang tidak memerlukan penalaran tingkat mutakhir. Jendela konteks 202K cukup untuk menampung garis besar dokumen lengkap dan materi sumber dalam satu kali pemanggilan.

Optimasi Kernel Beban Kerja ML

Tim infrastruktur AI menggunakan GLM-5.1 untuk menjalankan alur pengoptimalan berbasis tolok ukur pada beban kerja pembelajaran mesin. Pada tugas bergaya KernelBench, GLM-5.1 melakukan ribuan siklus pengoptimalan yang digerakkan oleh alat dan mencapai percepatan rata-rata geometris 3,6x. Kemampuan eksekusi berkelanjutan selama 8 jam berarti agen menjalankan loop pengoptimalan penuh tanpa memerlukan pengaktifan ulang manual antar sesi.

Wujudkan visi perusahaan Anda menjadi kenyataan dengan Atlas Cloud AI.

Hubungi sales

Pertanyaan Developer tentang Z.ai API

Z.ai API memberi developer akses terprogram ke seri large language model GLM yang dibuat oleh Z.ai, perusahaan yang juga dikenal sebagai Zhipu AI. GLM adalah singkatan dari General Language Model dan mencakup rilis dari GLM-4.6 hingga flagship GLM-5.1, yang dioptimalkan untuk coding, workflow agentic, serta penggunaan produksi bilingual dalam bahasa Mandarin dan Inggris. Di Atlas Cloud, Anda dapat mengakses seluruh lini model melalui satu endpoint yang kompatibel dengan OpenAI.

Atlas Cloud menghosting seri GLM dari GLM-4.6 hingga flagship GLM-5.1, dengan GLM-4.7 dan GLM-5 di antaranya. Tier yang lebih ringan menangani tugas harian bervolume tinggi dengan biaya lebih rendah, sementara GLM-5.1 ditujukan untuk pekerjaan coding dan agentic yang paling menuntut. Setiap model berjalan dengan skema pay-as-you-go melalui key yang sama.

Ya. Open weights GLM, termasuk GLM-5.1, dirilis di bawah lisensi MIT, yang mengizinkan penggunaan komersial, fine-tuning, dan redistribusi tanpa batasan. Jika Anda ingin menghindari beban infrastruktur, Atlas Cloud menyajikan model yang sama melalui API untuk akses terkelola alih-alih self-hosting.

Arahkan OpenAI SDK yang sudah Anda gunakan ke base URL Atlas Cloud, atur key Anda, lalu teruskan nama model GLM yang diinginkan. Karena Z.ai API kompatibel dengan OpenAI, sebagian besar proyek dapat bermigrasi hanya dengan mengubah base URL dan string model, dan model-modelnya terintegrasi langsung dengan tool agent seperti Claude Code, Cline, dan Roo Code. Mulai bangun hari ini.

Baik bahasa Mandarin maupun Inggris merupakan bahasa kelas utama untuk GLM, yang dilatih agar sangat mahir di keduanya. Anda dapat memberi prompt dalam salah satu bahasa dan mendapatkan kualitas yang konsisten, sehingga lini model ini praktis untuk tim yang melayani pengguna Tiongkok dan internasional dari satu model, tanpa perlu memelihara stack terpisah.

GLM-4.6 hingga GLM-5.1 mendukung context window 200K token, cukup untuk memuat codebase besar, dokumen panjang, atau trace agent yang ekstensif dalam satu request. Jika workflow Anda menghasilkan output panjang, window yang sama dapat menampung file kode besar dan log eksekusi multi-langkah tanpa pemotongan dini.

GLM-5.1 menduduki peringkat teratas SWE-Bench Pro dengan skor 58.4 pada April 2026, menempatkannya di antara model open-source terkuat untuk coding dunia nyata. Model ini juga mendukung eksekusi otonom berkelanjutan hingga delapan jam untuk satu tugas, menjalankan perencanaan, iterasi, dan delivery dalam satu loop, sehingga cocok untuk workflow agent berjangka panjang di lingkungan seperti Claude Code.

Setiap model GLM di Z.ai API menggunakan harga pay-as-you-go yang transparan, ditagih per token tanpa langganan atau komitmen bulanan. Token input dan output diukur secara terpisah, dan tier yang lebih ringan seperti GLM-4.7 memiliki biaya per token lebih rendah daripada flagship GLM-5.1, sehingga Anda dapat menyesuaikan pilihan model dengan anggaran. Periksa tarif per token terbaru pada setiap model card di Atlas Cloud.

Jelajahi Lebih Banyak Seri

Seedance 2.0

API Seedance 2.0 memberi Anda akses produksi ke model video multimodal milik ByteDance — input quad-modal (teks, gambar, video, audio) dan sistem "Universal Reference" terkemuka di industri yang mengunci komposisi, pergerakan kamera, dan aksi karakter di berbagai bidikan. Integrasikan kontrol tingkat sutradara dengan satu panggilan API, tarif tetap $0,09/dtk, kunci instan, dan tanpa daftar tunggu — didukung oleh waktu aktif dan kepatuhan tingkat perusahaan. Seedance 2.0 Native 4K kini telah hadir!

Lihat Seri

GPT Image 2

API GPT Image 2 memberi pengembang akses ke model gambar terbaru OpenAI, penerus GPT Image 1.5. Model ini menghasilkan dan mengedit gambar dengan rendering teks yang akurat di seluruh skrip Latin dan CJK, ditambah komposisi yang kuat untuk poster, mockup, dan infografis. Di Atlas Cloud, Anda dapat mengaksesnya melalui satu API terpadu bersama 300+ model, dengan kredit gratis, waktu operasi 99,99%, dan tanpa memerlukan verifikasi organisasi OpenAI.

Lihat Seri

Seedream 5.0 Pro

API Seedream 5.0 Pro memberi pengembang model pengeditan gambar yang dapat dikontrol dari ByteDance di Atlas Cloud. Ini menempatkan editan secara presisi dengan jangkar dan koordinat, memisahkan gambar menjadi lapisan yang dapat diedit, menggabungkan banyak referensi, dan mencocokkan warna dan bahan secara persis, dengan teks multibahasa pada 2K dan 3K. Di Atlas Cloud, Anda dapat mengaksesnya melalui satu kunci!

Lihat Seri

Gemini Omni Flash

Gemini Omni API menghadirkan model pembuatan dan pengeditan video multimodal dari Google DeepMind, yang diperkenalkan di Google I/O 2026, ke stack Anda. Gemini Omni memadukan mesin penalaran Gemini dengan media generatif, menerima kombinasi apa pun dari teks, gambar, video, dan audio untuk menghasilkan output yang konsisten dan berlandaskan pengetahuan. Sempurnakan hasil lewat percakapan alami — ganti objek, tulis ulang adegan, dan ubah gaya, sementara fisika, karakter, dan kontinuitas tetap terjaga. Atlas Cloud menyediakan seluruh lini Gemini Omni Flash — text-to-video, image-to-video dengan hingga 7 gambar referensi, dan reference-to-video — melalui satu API terpadu dengan harga per detik yang transparan mulai dari $0.112 tanpa langganan. Mulai bangun hari ini.

Lihat Seri

Grok Imagine

Grok Imagine API memberi pengembang pembuatan gambar, video, dan audio dari xAI dalam satu suite. API ini menghasilkan gambar hingga 2K dengan rendering teks multibahasa, plus video hingga 15 detik dengan audio asli yang tersinkronisasi dan pengeditan berbasis referensi. Di Atlas Cloud, satu kunci menjalankan setiap mode Grok Imagine, sehingga Anda dapat beralih di antara gambar, video, dan audio tanpa pengaturan terpisah, mulai dari $0,02 per gambar dan $0,05 per detik.

Lihat Seri

Google

Model kreatif paling kuat dari Google semuanya tersedia di Atlas Cloud. Veo 3.1 menghadirkan pembuatan video sinematik, Nano Banana 2 memberdayakan pembuatan gambar dengan fidelitas tinggi, dan Gemini membawa kecerdasan multimodal ke setiap alur kerja. Akses rangkaian lengkap model Google melalui satu API key dengan ketersediaan Day-0 dan harga bayar sesuai pemakaian (pay-as-you-go).

Lihat Seri

Seedance 2.0 Mini

Seedance 2.0 Mini menghadirkan pembuatan video multimodal dari ByteDance ke alur kerja di mana kecepatan dan biaya adalah hal yang paling utama. Model ini memberikan kemampuan inti dari Seedance 2.0 dengan penggunaan sumber daya yang lebih ringan — pembuatan yang lebih cepat, biaya per video yang lebih rendah, dan integrasi API yang sama dengan yang sudah Anda gunakan. Untuk tim yang menjalankan pipeline bervolume tinggi atau pembuatan prototipe dalam skala besar, Mini adalah pilihan default yang praktis.

Lihat Seri

ByteDance

Dari pembuatan video sinematik hingga penciptaan gambar dengan fidelitas tinggi, model paling kuat dari ByteDance kini tersedia di Atlas Cloud. Jalankan Seedance dan Seedream dalam skala besar dengan harga inferensi terendah dan tanpa biaya overhead infrastruktur.

Lihat Seri

Alibaba

Atlas Cloud menyatukan seluruh jajaran model Alibaba di bawah satu API: Qwen untuk tugas bahasa dan gambar, Wan untuk pembuatan video hingga 1080p. Akses setiap model dengan sistem bayar sesuai pemakaian (pay-as-you-go) tanpa berlangganan. Alibaba API tersedia melalui satu URL dasar (base URL) menggunakan klien yang kompatibel dengan OpenAI Anda saat ini.

Lihat Seri

OpenAI

Atlas Cloud memberi Anda akses ke seluruh jajaran OpenAI API, mulai dari GPT Image 2 untuk pembuatan gambar hingga Sora 2 untuk video. Setiap model tersedia dengan sistem bayar sesuai penggunaan (pay-as-you-go) tanpa komitmen bulanan. Lakukan integrasi hanya dengan satu pertukaran URL dasar menggunakan API yang kompatibel dengan OpenAI.

Lihat Seri

xAI

Bangun pipeline gambar dan video yang lengkap menggunakan xAI API di Atlas Cloud. Hasilkan pada resolusi 2K, edit dengan gambar referensi, dan animasikan gambar menjadi klip yang disinkronkan dengan audio.

Lihat Seri

Kwaivgi

Kwaivgi API dengan harga 15% di bawah harga standar. Atlas Cloud memberikan akses Day-0 ke rilis Kling terbaru dengan harga pay-as-you-go (bayar sesuai pemakaian) dan tanpa batasan pengguna (seat limits). Satu akun, satu kunci, setiap model Kling dari tingkat standar hingga master.

Lihat Seri