
Atlas Cloud Z-AI API के माध्यम से GLM-4.6 से GLM-5.1 तक पूरी GLM सीरीज़ को होस्ट करता है। सभी मॉडल द्विभाषी हैं और 202K कॉन्टेक्स्ट विंडो के साथ 'पे-एज़-यू-गो' (pay-as-you-go) आधार पर उपलब्ध हैं。
Atlas Cloud पर तेज़ और किफ़ायती ढंग से उपलब्ध अग्रणी बड़े भाषा मॉडल के साथ चैट, रीज़निंग और एजेंट को बड़े पैमाने पर सशक्त बनाएं।
Compare standard vs. our pricing across every Z.ai model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| GLM 5.1 | $1.4/$4.4per 1M tokens202.8K context | $1.26/$3.96M in/outper 1M tokens202.8K context | -10% | View |
| GLM 5 Turbo | $1.2/$4per 1M tokens262.1K context | $1.2/$4M in/outper 1M tokens262.1K context | — | View |
| GLM 5 | $1/$3.2per 1M tokens202.8K context | $0.95/$3.15M in/outper 1M tokens202.8K context | — | View |
| GLM 4.7 | $0.6/$2.2per 1M tokens202.8K context | $0.52/$1.85M in/outper 1M tokens202.8K context | — | View |
| GLM 4.6 | $0.6/$2.2per 1M tokens202.8K context | $0.6/$2.2M in/outper 1M tokens202.8K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
GLM के मॉडल टियर्स तेज़ द्विभाषी चैट कार्यों से लेकर कई घंटों वाले स्वायत्त कोडिंग एजेंटों तक सब कुछ कवर करते हैं। टीमें दीर्घकालिक इंजीनियरिंग कार्य के लिए GLM-5.1 का उपयोग करती हैं और जहाँ लागत दक्षता और गति प्राथमिकता लेती है, वहाँ GLM-4.7 या GLM-5 Turbo का उपयोग करती हैं।
Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.
डेवलपमेंट टीमें मानवीय चेकपॉइंट के बिना कई घंटों के सत्रों में संपूर्ण कोडबेस ट्रांसफॉर्मेशन निष्पादित करने के लिए GLM-5.1 का उपयोग करती हैं। यह मॉडल 8 घंटे तक लगातार परिवर्तनों की योजना बनाता है, लिखता है, परीक्षण करता है और इटरेशन करता है, तथा स्क्रैच से Linux सिस्टम बनाने के एक प्रदर्शन में 655 इटरेशन को संभालता है। यह बड़े, लिगेसी कोडबेस पर हफ्तों के मैन्युअल रिफैक्टरिंग कार्य को प्रतिस्थापित करता है।
डेवलपर टूल टीमें Claude Code, Kilo Code, Cline, Roo Code और OpenCode में AI कोडिंग वर्कफ़्लो के लिए अंतर्निहित मॉडल के रूप में GLM-5.1 और GLM-5 Turbo को एकीकृत करती हैं। Atlas Cloud पर Z-AI API OpenAI-संगत है, इसलिए इन उपकरणों में से किसी को भी GLM के माध्यम से रूट करने के लिए केवल base URL को बदलना आवश्यक है। GLM-5 Turbo की 262K कॉन्टेक्स्ट विंडो इसे विशेष रूप से IDE वर्कफ़्लो में बड़े फ़ाइल कॉन्टेक्स्ट के लिए उपयुक्त बनाती है।
संचालन टीमें GLM-5 का उपयोग करके सपोर्ट एजेंट बनाती हैं, जो बिना मानवीय हस्तक्षेप के दोहराए जाने वाले प्रश्नों को संभालने के लिए टिकट डेटाबेस एक्सेस, नॉलेज बेस सर्च और एस्केलेशन टूलिंग को जोड़ते हैं। मॉडल की मल्टी-टूल कॉलिंग और स्ट्रीमिंग सपोर्ट इसे वास्तविक समय में ग्राहकों के सामने तैनाती के लिए व्यावहारिक बनाते हैं। द्विभाषी सपोर्ट का मतलब है कि एक ही एजेंट Atlas Cloud पर एकल मॉडल एंडपॉइंट से चीनी और अंग्रेजी टिकटों को संभालता है।
सामग्री और व्यावसायिक टीमें संरचित प्रॉम्प्ट्स से चीनी और अंग्रेजी दोनों में Word दस्तावेज़, PowerPoint प्रेजेंटेशन, PDF और Excel रिपोर्ट उत्पन्न करने के लिए GLM-4.7 का उपयोग करती हैं। प्रति मिलियन इनपुट टोकन $0.52 की दर पर, यह उच्च-मात्रा वाले दस्तावेज़ वर्कफ़्लो के लिए सबसे किफ़ायती GLM टियर है, जिन्हें फ्रंटियर-स्तर के तर्क की आवश्यकता नहीं होती है। 202K कॉन्टेक्स्ट विंडो एक ही कॉल में पूर्ण दस्तावेज़ रूपरेखा और स्रोत सामग्री को रखने के लिए पर्याप्त है।
AI इन्फ्रास्ट्रक्चर टीमें मशीन लर्निंग वर्कलोड पर बेंचमार्क-संचालित ऑप्टिमाइज़ेशन पाइपलाइन चलाने के लिए GLM-5.1 का उपयोग करती हैं। KernelBench-शैली के कार्यों पर, GLM-5.1 हजारों टूल-संचालित ऑप्टिमाइज़ेशन चक्र निष्पादित करता है और 3.6x ज्यामितीय माध्य गति वृद्धि प्राप्त करता है। 8-घंटे की निरंतर निष्पादन क्षमता का अर्थ है कि एजेंट सत्रों के बीच मैन्युअल रीस्टार्ट की आवश्यकता के बिना पूरा ऑप्टिमाइज़ेशन लूप चलाता है।
Z-AI (जिसे Z.ai के रूप में भी लिखा जाता है) बड़े भाषा मॉडल की GLM श्रृंखला का डेवलपर है, जिसे ZhipuAI के नाम से भी जाना जाता है। GLM का अर्थ जनरल लैंग्वेज मॉडल (General Language Model) है, जो GLM-4.6 से लेकर वर्तमान फ्लैगशिप GLM-5.1 तक फैली एक श्रृंखला है। इस श्रृंखला को कोडिंग, एजेंटिक वर्कफ़्लो और द्विभाषी चीनी-अंग्रेजी उत्पादन उपयोग के लिए बनाया गया है।
GLM-5.1 ने 7 अप्रैल, 2026 को 58.4 के स्कोर के साथ SWE-Bench Pro पर पहला स्थान हासिल किया, जिसने GPT-5.4 (57.7) और Claude Opus 4.6 (57.3) को पीछे छोड़ दिया। यह CyberGym पर 68.7 के स्कोर के साथ भी सबसे आगे है। यह इसे Q2 2026 तक प्रोडक्शन कोडिंग के लिए शीर्ष रैंक वाला ओपन-सोर्स मॉडल बनाता है।
हाँ। GLM-5.1 बिना मानवीय हस्तक्षेप के एक ही कार्य पर 8 घंटे तक निरंतर स्वायत्त निष्पादन का समर्थन करता है। यह योजना, निष्पादन, पुनरावृत्त अनुकूलन और वितरण के पूरे चक्र को संभालता है। इसे विशेष रूप से Claude Code और OpenClaw-संगत सेटअप जैसे वातावरण में लंबी अवधि के कोडिंग एजेंट वर्कफ़्लो के लिए डिज़ाइन किया गया है।
GLM-5 एक बेस फाउंडेशन मॉडल है जिसे 744-बिलियन पैरामीटर MoE आर्किटेक्चर पर बनाया गया है, 28.5 ट्रिलियन टोकन पर प्रशिक्षित किया गया है, और ओपन-सोर्स मॉडल के लिए Chatbot Arena पर #1 Elo तक पहुंच गया है। GLM-5.1 उसी बेस का एक पोस्ट-ट्रेनिंग अपग्रेड है जिसमें काफी मजबूत कोडिंग, टूल उपयोग और स्वायत्त निष्पादन क्षमताएं हैं। Atlas Cloud पर GLM-5 की कीमत $0.95 प्रति मिलियन इनपुट टोकन है; GLM-5.1 की कीमत $1.26 प्रति मिलियन इनपुट टोकन है।
हाँ। GLM-5.1 को MIT लाइसेंस के तहत जारी किया गया है, जो बिना किसी प्रतिबंध के व्यावसायिक उपयोग, फाइन-ट्यूनिंग और पुनर्वितरण की अनुमति देता है। ओपन वेट्स (open weights) सेल्फ-होस्टेड डिप्लॉयमेंट के लिए उपलब्ध हैं। बुनियादी ढांचे के ओवरहेड के बिना प्रबंधित एक्सेस को प्राथमिकता देने वाली टीमों के लिए Atlas Cloud API के माध्यम से GLM-5.1 प्रदान करता है।
GLM-4.6, GLM-4.7, GLM-5, और GLM-5.1 सभी Atlas Cloud पर 202,750-टोकन कॉन्टेक्स्ट विंडो का समर्थन करते हैं। GLM-5 Turbo इसका अपवाद है, जिसमें एक बड़ी 262,144-टोकन कॉन्टेक्स्ट विंडो और 131,072-टोकन अधिकतम आउटपुट लंबाई है। GLM-5.1 अपनी कॉन्टेक्स्ट सीमा के भीतर लंबी कोड फ़ाइलें और विस्तृत निष्पादन ट्रेस उत्पन्न करने के लिए उपयुक्त है।
हाँ। सभी GLM मॉडल चीनी और अंग्रेजी के लिए अनुकूलित हैं और दोनों भाषाओं में समान दक्षता रखते हैं। आप किसी भी भाषा में प्रॉम्प्ट लिख सकते हैं और बदले में समान गुणवत्ता वाले आउटपुट प्राप्त कर सकते हैं। यह GLM को उन टीमों के लिए व्यावहारिक बनाता है जो एक ही मॉडल का उपयोग करके चीनी और अंतरराष्ट्रीय दोनों बाजारों में सेवा देने वाले उत्पाद बना रही हैं।
GLM-4.7 की कीमत $0.52 प्रति मिलियन इनपुट टोकन से शुरू होती है और यह सबसे किफ़ायती टियर है। GLM-4.6 की कीमत $0.60, GLM-5 की कीमत $0.95, और GLM-5 Turbo की कीमत $1.20 प्रति मिलियन इनपुट टोकन है। फ्लैगशिप मॉडल, GLM-5.1 की कीमत $1.26 प्रति मिलियन इनपुट टोकन और $3.96 प्रति मिलियन आउटपुट टोकन है। सभी मॉडल पे-एज़-यू-गो (pay-as-you-go) आधार पर उपलब्ध हैं, जिनमें कोई मासिक प्रतिबद्धता नहीं है।
Atlas Cloud का भरपूर लाभ उठाने में मदद करने वाली गाइड, ट्यूटोरियल और प्रोडक्ट अपडेट।
Join the Discord community for the latest model updates, prompts, and support.