Z.ai API for Top Open-Source GLM Coding

Z.ai API आपके स्टैक में ZhipuAI की पूरी GLM श्रृंखला लाता है, GLM-4.6 से लेकर फ्लैगशिप GLM-5.1 तक, जो SWE-Bench Pro पर open-source models में पहले स्थान पर है और autonomous coding agents को एक बार में घंटों तक चला सकता है। GLM, permissive MIT license के तहत संतुलित चीनी और अंग्रेज़ी आउटपुट के साथ 202K token context देता है। Atlas Cloud हर model को Day-0 access और पारदर्शी per-call pricing के साथ एक OpenAI-compatible key के ज़रिए उपलब्ध कराता है। आज ही शुरू करें।

Large Language Models by Z.ai

Atlas Cloud पर तेज़ और किफ़ायती ढंग से उपलब्ध अग्रणी बड़े भाषा मॉडल के साथ चैट, रीज़निंग और एजेंट को बड़े पैमाने पर सशक्त बनाएं।

सभी मॉडल देखें

LLM

GLM

GLM, Zhipu AI की Z.ai की प्रमुख LLM सीरीज़ है, और GLM API agentic GLM-5 से लेकर कुशल 357B MoE GLM-4.6 तक सब कुछ कवर करता है। ये मॉडल स्वायत्त टास्क निष्पादन, जटिल एजेंट ऑर्केस्ट्रेशन और production-grade programming में विशेषज्ञ हैं। Atlas Cloud पर, एक single unified endpoint आपको usage-based pricing और भरोसेमंद production uptime के साथ पूरी GLM फैमिली का Day-0 access देता है। आज ही बनाना शुरू करें।

6 मॉडलGLM एक्सप्लोर करें

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

Model	Standard Price (USD)	Our Price (USD)	Discount
GLM 5.2	$1.4/$4.4per 1M tokens1048.6K context	$1.26/$3.96M in/outper 1M tokens1048.6K context	-10%	View
GLM 5.1	$1.4/$4.4per 1M tokens202.8K context	$1.26/$3.96M in/outper 1M tokens202.8K context	-10%	View
GLM 5v Turbo	$1.2/$4per 1M tokens202.8K context	$1.2/$4M in/outper 1M tokens202.8K context	—	View
GLM 5	$1/$3.2per 1M tokens202.8K context	$0.95/$3.15M in/outper 1M tokens202.8K context	—	View
GLM 4.7	$0.6/$2.2per 1M tokens202.8K context	$0.52/$1.85M in/outper 1M tokens202.8K context	—	View
GLM 4.6	$0.6/$2.2per 1M tokens202.8K context	$0.6/$2.2M in/outper 1M tokens202.8K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Z-AI API उपयोग के मामले जिन्हें आप Atlas Cloud पर बना सकते हैं

GLM के मॉडल टियर्स तेज़ द्विभाषी चैट कार्यों से लेकर कई घंटों वाले स्वायत्त कोडिंग एजेंटों तक सब कुछ कवर करते हैं। टीमें दीर्घकालिक इंजीनियरिंग कार्य के लिए GLM-5.1 का उपयोग करती हैं और जहाँ लागत दक्षता और गति प्राथमिकता लेती है, वहाँ GLM-4.7 या GLM-5 Turbo का उपयोग करती हैं।

दीर्घकालिक डेटाबेस प्रदर्शन अनुकूलन

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

स्वायत्त रिपॉजिटरी-स्तरीय कोड रीफ़ैक्टरिंग

डेवलपमेंट टीमें मानवीय चेकपॉइंट के बिना कई घंटों के सत्रों में संपूर्ण कोडबेस ट्रांसफॉर्मेशन निष्पादित करने के लिए GLM-5.1 का उपयोग करती हैं। यह मॉडल 8 घंटे तक लगातार परिवर्तनों की योजना बनाता है, लिखता है, परीक्षण करता है और इटरेशन करता है, तथा स्क्रैच से Linux सिस्टम बनाने के एक प्रदर्शन में 655 इटरेशन को संभालता है। यह बड़े, लिगेसी कोडबेस पर हफ्तों के मैन्युअल रिफैक्टरिंग कार्य को प्रतिस्थापित करता है।

IDE कोडिंग एजेंट एकीकरण

डेवलपर टूल टीमें Claude Code, Kilo Code, Cline, Roo Code और OpenCode में AI कोडिंग वर्कफ़्लो के लिए अंतर्निहित मॉडल के रूप में GLM-5.1 और GLM-5 Turbo को एकीकृत करती हैं। Atlas Cloud पर Z-AI API OpenAI-संगत है, इसलिए इन उपकरणों में से किसी को भी GLM के माध्यम से रूट करने के लिए केवल base URL को बदलना आवश्यक है। GLM-5 Turbo की 262K कॉन्टेक्स्ट विंडो इसे विशेष रूप से IDE वर्कफ़्लो में बड़े फ़ाइल कॉन्टेक्स्ट के लिए उपयुक्त बनाती है।

टियर-1 सपोर्ट क्वेरी ऑटोमेशन

संचालन टीमें GLM-5 का उपयोग करके सपोर्ट एजेंट बनाती हैं, जो बिना मानवीय हस्तक्षेप के दोहराए जाने वाले प्रश्नों को संभालने के लिए टिकट डेटाबेस एक्सेस, नॉलेज बेस सर्च और एस्केलेशन टूलिंग को जोड़ते हैं। मॉडल की मल्टी-टूल कॉलिंग और स्ट्रीमिंग सपोर्ट इसे वास्तविक समय में ग्राहकों के सामने तैनाती के लिए व्यावहारिक बनाते हैं। द्विभाषी सपोर्ट का मतलब है कि एक ही एजेंट Atlas Cloud पर एकल मॉडल एंडपॉइंट से चीनी और अंग्रेजी टिकटों को संभालता है।

बड़े पैमाने पर द्विभाषी दस्तावेज़ निर्माण

सामग्री और व्यावसायिक टीमें संरचित प्रॉम्प्ट्स से चीनी और अंग्रेजी दोनों में Word दस्तावेज़, PowerPoint प्रेजेंटेशन, PDF और Excel रिपोर्ट उत्पन्न करने के लिए GLM-4.7 का उपयोग करती हैं। प्रति मिलियन इनपुट टोकन $0.52 की दर पर, यह उच्च-मात्रा वाले दस्तावेज़ वर्कफ़्लो के लिए सबसे किफ़ायती GLM टियर है, जिन्हें फ्रंटियर-स्तर के तर्क की आवश्यकता नहीं होती है। 202K कॉन्टेक्स्ट विंडो एक ही कॉल में पूर्ण दस्तावेज़ रूपरेखा और स्रोत सामग्री को रखने के लिए पर्याप्त है।

ML वर्कलोड कर्नेल ऑप्टिमाइज़ेशन

AI इन्फ्रास्ट्रक्चर टीमें मशीन लर्निंग वर्कलोड पर बेंचमार्क-संचालित ऑप्टिमाइज़ेशन पाइपलाइन चलाने के लिए GLM-5.1 का उपयोग करती हैं। KernelBench-शैली के कार्यों पर, GLM-5.1 हजारों टूल-संचालित ऑप्टिमाइज़ेशन चक्र निष्पादित करता है और 3.6x ज्यामितीय माध्य गति वृद्धि प्राप्त करता है। 8-घंटे की निरंतर निष्पादन क्षमता का अर्थ है कि एजेंट सत्रों के बीच मैन्युअल रीस्टार्ट की आवश्यकता के बिना पूरा ऑप्टिमाइज़ेशन लूप चलाता है।

Atlas Cloud AI के साथ अपनी एंटरप्राइज़ विज़न को हकीकत में बदलें।

सेल्स से संपर्क करें

Z.ai API के बारे में डेवलपर्स क्या पूछते हैं

Z.ai API डेवलपर्स को Z.ai द्वारा बनाए गए GLM series के large language models तक programmatic access देता है। Z.ai को Zhipu AI के नाम से भी जाना जाता है। GLM का अर्थ General Language Model है और इसमें GLM-4.6 से लेकर flagship GLM-5.1 तक की रिलीज़ शामिल हैं, जिन्हें coding, agentic workflows, और bilingual Chinese तथा English production use के लिए tune किया गया है। Atlas Cloud पर आप एक OpenAI-compatible endpoint के ज़रिए पूरी lineup तक पहुँचते हैं।

Atlas Cloud, GLM-4.6 से लेकर flagship GLM-5.1 तक की GLM series को host करता है, जिनके बीच GLM-4.7 और GLM-5 भी शामिल हैं। हल्के tiers कम लागत पर high-volume रोज़मर्रा के tasks संभालते हैं, जबकि GLM-5.1 सबसे demanding coding और agentic काम के लिए बनाया गया है। हर model उसी key के ज़रिए pay-as-you-go पर चलता है।

हाँ। GLM open weights, जिनमें GLM-5.1 भी शामिल है, MIT license के तहत release किए जाते हैं, जो commercial use, fine-tuning और redistribution की बिना किसी restriction के अनुमति देता है। अगर आप infrastructure overhead से बचना चाहते हैं, तो self-hosting के बजाय Atlas Cloud managed access के लिए API के ज़रिए वही models serve करता है।

अपने मौजूदा OpenAI SDK को Atlas Cloud base URL पर point करें, अपनी key set करें, और जिस GLM model name का उपयोग करना चाहते हैं उसे pass करें। क्योंकि Z.ai API OpenAI-compatible है, ज़्यादातर projects केवल base URL और model string बदलकर migrate हो जाते हैं, और models Claude Code, Cline और Roo Code जैसे agent tools में सीधे plug हो जाते हैं। आज ही build करना शुरू करें।

GLM के लिए Chinese और English दोनों first-class हैं, और इसे दोनों में मज़बूत proficiency के लिए train किया गया है। आप किसी भी language में prompt करें और आपको consistent quality मिलती है, जिससे यह lineup उन teams के लिए practical बनती है जो अलग-अलग stacks maintain करने के बजाय एक ही model से Chinese और international users को serve करती हैं।

GLM-4.6 से GLM-5.1 तक 200K token context window support करते हैं, जो बड़े codebases, लंबे documents या extended agent traces को एक ही request में रखने के लिए पर्याप्त है। अगर आपका workflow लंबे outputs पैदा करता है, तो वही window बड़े code files और multi-step execution logs को early truncation के बिना cover करती है।

GLM-5.1 ने अप्रैल 2026 में 58.4 के score के साथ SWE-Bench Pro में top किया, जिससे यह real-world coding के लिए सबसे मज़बूत open-source models में शामिल हो गया। यह एक single task पर आठ घंटे तक continuous autonomous execution भी support करता है, जिसमें planning, iteration और delivery एक ही loop में चलती हैं—यह Claude Code जैसे environments में long-horizon agent workflows के लिए उपयुक्त है।

Z.ai API पर हर GLM model transparent pay-as-you-go pricing पर चलता है, जिसमें per token billing होती है और कोई subscription या monthly commitment नहीं होता। Input और output tokens अलग-अलग meter किए जाते हैं, और GLM-4.7 जैसे हल्के tiers का per token cost flagship GLM-5.1 से कम होता है, इसलिए आप model choice को budget के अनुसार match कर सकते हैं। Atlas Cloud में हर model card पर current per-token rate देखें।

अधिक सीरीज़ एक्सप्लोर करें

Seedance 2.0

Seedance 2.0 API आपको ByteDance के मल्टीमॉडल वीडियो मॉडल तक प्रोडक्शन एक्सेस देता है — क्वाड-मॉडल इनपुट्स (टेक्स्ट, इमेज, वीडियो, ऑडियो) और एक उद्योग-अग्रणी "Universal Reference" सिस्टम जो शॉट्स के बीच कंपोजिशन, कैमरा मूवमेंट और कैरेक्टर एक्शन्स को लॉक करता है। एक API कॉल के साथ डायरेक्टर-लेवल कंट्रोल को इंटीग्रेट करें, $0.09/s की फ्लैट दर, इंस्टेंट की और बिना किसी वेटलिस्ट के — जिसे एंटरप्राइज़-ग्रेड अपटाइम और कंप्लायंस का समर्थन प्राप्त है। Seedance 2.0 Native 4K अब लाइव है!

सीरीज़ देखें

GPT Image 2

GPT Image 2 API डेवलपर्स को OpenAI के नवीनतम इमेज मॉडल तक पहुंच प्रदान करता है, जो GPT Image 1.5 का उत्तराधिकारी है। यह लैटिन और CJK लिपियों में सटीक टेक्स्ट रेंडरिंग के साथ चित्र बनाता और संपादित करता है, साथ ही पोस्टर, मॉकअप और इन्फोग्राफिक्स के लिए मजबूत संयोजन (कंपोजिशन) प्रदान करता है। Atlas Cloud पर आप इसे 300+ मॉडलों के साथ एक एकीकृत API के माध्यम से एक्सेस कर सकते हैं, जिसमें मुफ्त क्रेडिट, 99.99% अपटाइम और OpenAI संगठन सत्यापन की कोई आवश्यकता नहीं है।

सीरीज़ देखें

Seedream 5.0 Pro

Seedream 5.0 Pro API डेवलपर्स को Atlas Cloud पर ByteDance का नियंत्रणीय छवि संपादन मॉडल प्रदान करता है। यह एंकर और निर्देशांकों के साथ संपादनों को सटीक रूप से रखता है, छवियों को संपादन योग्य परतों में अलग करता है, कई संदर्भों को मिलाता है, और 2K और 3K पर बहुभाषी पाठ के साथ सटीक रंगों और सामग्रियों का मिलान करता है। Atlas Cloud पर आप एक कुंजी के माध्यम से इस तक पहुँच सकते हैं!

सीरीज़ देखें

Gemini Omni Flash

Gemini Omni API, Google I/O 2026 में पेश किए गए Google DeepMind के मल्टीमोडल वीडियो जेनरेशन और एडिटिंग मॉडल को आपके स्टैक तक लाता है। Gemini Omni, Gemini के रीज़निंग इंजन को जेनरेटिव मीडिया के साथ जोड़ता है और टेक्स्ट, इमेज, वीडियो तथा ऑडियो के किसी भी संयोजन को स्वीकार कर सुसंगत, ज्ञान-आधारित आउटपुट तैयार करता है। स्वाभाविक बातचीत के ज़रिए परिणामों को निखारें — ऑब्जेक्ट बदलें, सीन दोबारा लिखें और स्टाइल बदलें, जबकि फ़िज़िक्स, किरदार और निरंतरता ज्यों की त्यों बनी रहती है। Atlas Cloud पूरी Gemini Omni Flash सीरीज़ — टेक्स्ट-टू-वीडियो, 7 रेफ़रेंस इमेज तक के साथ इमेज-टू-वीडियो, और रेफ़रेंस-टू-वीडियो — एक एकीकृत API के माध्यम से उपलब्ध कराता है, जिसमें $0.112 से शुरू होने वाली पारदर्शी प्रति-सेकंड कीमत है और कोई सब्सक्रिप्शन नहीं। आज ही बनाना शुरू करें।

सीरीज़ देखें

Grok Imagine

Grok Imagine API डेवलपर्स को एक ही सूट में xAI की इमेज, वीडियो और ऑडियो जेनरेशन प्रदान करता है। यह बहुभाषी टेक्स्ट रेंडरिंग के साथ 2K तक की इमेज, और नेटिव, सिंक्रनाइज़ ऑडियो और संदर्भ-आधारित संपादन के साथ 15 सेकंड तक के वीडियो बनाता है। Atlas Cloud पर, एक ही कुंजी (key) हर Grok Imagine मोड को चलाती है, जिससे आप अलग-अलग सेटअप के बिना इमेज, वीडियो और ऑडियो के बीच स्विच कर सकते हैं, जिसकी कीमत $0.02 प्रति इमेज और $0.05 प्रति सेकंड से शुरू होती है।

सीरीज़ देखें

Google

Google के सबसे शक्तिशाली क्रिएटिव मॉडल अब Atlas Cloud पर उपलब्ध हैं। Veo 3.1 सिनेमैटिक वीडियो जनरेशन प्रदान करता है, Nano Banana 2 हाई-फिडेलिटी इमेज क्रिएशन को शक्ति देता है, और Gemini हर वर्कफ़्लो में मल्टीमॉडल इंटेलिजेंस लाता है। Day-0 उपलब्धता और पे-एज़-यू-गो (pay-as-you-go) प्राइसिंग के साथ एक ही API key के माध्यम से संपूर्ण Google मॉडल सूट तक पहुंचें।

सीरीज़ देखें

Seedance 2.0 Mini

Seedance 2.0 Mini, ByteDance के मल्टीमोडल वीडियो जनरेशन को उन वर्कफ़्लो में लाता है जहाँ गति और लागत सबसे अधिक मायने रखते हैं। यह एक हल्के फुटप्रिंट पर Seedance 2.0 की मुख्य क्षमताएँ प्रदान करता है — तेज़ जनरेशन, प्रति वीडियो कम लागत, और वही API एकीकरण जिसका आप पहले से उपयोग करते हैं। उच्च-मात्रा वाले पाइपलाइन चलाने या बड़े पैमाने पर प्रोटोटाइपिंग करने वाली टीमों के लिए, Mini व्यावहारिक डिफ़ॉल्ट विकल्प है।

सीरीज़ देखें

ByteDance

सिनेमैटिक वीडियो जनरेशन से लेकर हाई-फिडेलिटी इमेज क्रिएशन तक, ByteDance के सबसे शक्तिशाली मॉडल Atlas Cloud पर लाइव हैं। सबसे कम इन्फ्रेंस प्राइसिंग और शून्य इन्फ्रास्ट्रक्चर ओवरहेड के साथ बड़े पैमाने पर Seedance और Seedream को रन करें।

सीरीज़ देखें

Alibaba

Atlas Cloud एक ही API के तहत Alibaba के पूरे मॉडल लाइनअप को एक साथ लाता है: भाषा और छवि कार्यों के लिए Qwen, और 1080p तक के वीडियो निर्माण के लिए Wan। बिना किसी सब्सक्रिप्शन के पे-एज़-यू-गो (pay-as-you-go) के आधार पर प्रत्येक मॉडल तक पहुँच प्राप्त करें। Alibaba API आपके मौजूदा OpenAI-संगत क्लाइंट का उपयोग करके एकल बेस URL के माध्यम से उपलब्ध है।

सीरीज़ देखें

OpenAI

Atlas Cloud आपको पूर्ण OpenAI API लाइनअप तक पहुंच प्रदान करता है, छवि निर्माण के लिए GPT Image 2 से लेकर वीडियो के लिए Sora 2 तक। हर मॉडल बिना किसी मासिक प्रतिबद्धता के 'पे-ऐज़-यू-गो' (pay-as-you-go) आधार पर उपलब्ध है। OpenAI-संगत API का उपयोग करके एकल बेस URL स्वैप के साथ प्लग इन करें।

सीरीज़ देखें

xAI

Atlas Cloud पर xAI API का उपयोग करके संपूर्ण इमेज और वीडियो पाइपलाइन बनाएं। 2K रिज़ॉल्यूशन पर जनरेट करें, संदर्भ छवियों के साथ संपादित करें, और छवियों को ऑडियो-सिंक किए गए क्लिप में एनिमेट करें।

सीरीज़ देखें

Kwaivgi

Kwaivgi API मानक मूल्य निर्धारण से 15% कम पर। Atlas Cloud नए Kling रिलीज़ के लिए पे-एज़-यू-गो (उपयोग के अनुसार भुगतान) मूल्य निर्धारण और बिना किसी सीट सीमा के डे-0 (Day-0) एक्सेस प्रदान करता है। एक खाता, एक कुंजी, मानक से लेकर मास्टर टियर तक हर Kling मॉडल।

सीरीज़ देखें