Z.ai API for Top Open-Source GLM Coding

L'API Z.ai porta l'intera serie GLM di ZhipuAI nel tuo stack, da GLM-4.6 al modello di punta GLM-5.1, che si classifica al primo posto tra i modelli open-source su SWE-Bench Pro ed esegue agenti di coding autonomi per ore consecutive. GLM combina un contesto da 202K token con output bilanciato in cinese e inglese, sotto una licenza permissiva MIT. Atlas Cloud distribuisce ogni modello tramite un'unica chiave compatibile con OpenAI, con accesso Day-0 e prezzi trasparenti per chiamata. Inizia oggi.

Large Language Models by Z.ai

Alimenta chat, ragionamento e agenti su larga scala con i migliori modelli linguistici di grandi dimensioni, erogati in modo rapido ed economico su Atlas Cloud.

Vedi tutti i modelli

LLM

GLM

GLM è la serie LLM di punta di Z.ai, sviluppata da Zhipu AI, e la GLM API copre tutto: dall'agentic GLM-5 all'efficiente GLM-4.6 MoE da 357B. Questi modelli sono specializzati nell'esecuzione autonoma di attività, nell'orchestrazione di agenti complessi e nella programmazione pronta per la produzione. Su Atlas Cloud, un unico endpoint unificato ti offre accesso Day-0 all'intera famiglia GLM, con prezzi basati sull'utilizzo e uptime affidabile in produzione. Inizia a creare oggi stesso.

6 modelliEsplora GLM

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

Model	Standard Price (USD)	Our Price (USD)	Discount
GLM 5.2	$1.4/$4.4per 1M tokens1048.6K context	$1.26/$3.96M in/outper 1M tokens1048.6K context	-10%	View
GLM 5.1	$1.4/$4.4per 1M tokens202.8K context	$1.26/$3.96M in/outper 1M tokens202.8K context	-10%	View
GLM 5v Turbo	$1.2/$4per 1M tokens202.8K context	$1.2/$4M in/outper 1M tokens202.8K context	—	View
GLM 5	$1/$3.2per 1M tokens202.8K context	$0.95/$3.15M in/outper 1M tokens202.8K context	—	View
GLM 4.7	$0.6/$2.2per 1M tokens202.8K context	$0.52/$1.85M in/outper 1M tokens202.8K context	—	View
GLM 4.6	$0.6/$2.2per 1M tokens202.8K context	$0.6/$2.2M in/outper 1M tokens202.8K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Casi d'uso della Z-AI API che puoi sviluppare su Atlas Cloud

I livelli dei modelli di GLM coprono tutto, dalle rapide attività di chat bilingue agli agenti di codifica autonomi di diverse ore. I team utilizzano GLM-5.1 per lavori di ingegneria a lungo termine e GLM-4.7 o GLM-5 Turbo quando l'efficienza dei costi e la velocità sono prioritarie.

Ottimizzazione delle prestazioni del database a lungo termine

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

Refactoring Autonomo del Codice su Scala Repository

I team di sviluppo utilizzano GLM-5.1 per eseguire trasformazioni complete delle codebase in sessioni di diverse ore senza checkpoint umani. Il modello pianifica, scrive, testa e itera le modifiche continuamente fino a 8 ore, gestendo 655 iterazioni in una dimostrazione di costruzione di un sistema Linux da zero. Questo sostituisce settimane di lavoro di refactoring manuale su codebase grandi e legacy.

Integrazione dell'Agente di Codifica IDE

I team di strumenti per sviluppatori integrano GLM-5.1 e GLM-5 Turbo come modello sottostante per i flussi di lavoro di codifica basati sull'IA in Claude Code, Kilo Code, Cline, Roo Code e OpenCode. La Z-AI API su Atlas Cloud è compatibile con OpenAI, quindi la sostituzione della base URL è l'unica modifica necessaria per indirizzare uno qualsiasi di questi strumenti tramite GLM. La finestra di contesto da 262K di GLM-5 Turbo lo rende particolarmente adatto per il contesto di file di grandi dimensioni nei flussi di lavoro degli IDE.

Automazione delle Richieste di Supporto di Livello 1

I team operativi creano agenti di supporto utilizzando GLM-5 che combinano l'accesso al database dei ticket, la ricerca nella knowledge base e gli strumenti di escalation per gestire query ripetitive senza intervento umano. Le funzionalità di chiamata multi-strumento e il supporto streaming del modello lo rendono pratico per le implementazioni in tempo reale rivolte ai clienti. Il supporto bilingue significa che lo stesso agente gestisce i ticket in cinese e inglese da un singolo endpoint del modello su Atlas Cloud.

Generazione di documenti bilingui su larga scala

I team di contenuti e aziendali utilizzano GLM-4.7 per generare documenti Word, presentazioni PowerPoint, PDF e report Excel sia in cinese che in inglese a partire da prompt strutturati. A 0,52 $ per milione di token di input, è il livello GLM più conveniente per flussi di lavoro di documenti ad alto volume che non richiedono ragionamenti di livello frontier. La finestra di contesto di 202K è sufficiente per contenere schemi di documenti completi e materiale sorgente in una singola chiamata.

Ottimizzazione del kernel per i carichi di lavoro ML

I team di infrastruttura IA utilizzano GLM-5.1 per eseguire pipeline di ottimizzazione guidate da benchmark su carichi di lavoro di machine learning. Su attività in stile KernelBench, GLM-5.1 esegue migliaia di cicli di ottimizzazione guidati da strumenti e ottiene un'accelerazione media geometrica di 3,6x. La capacità di esecuzione continua di 8 ore significa che l'agente esegue l'intero ciclo di ottimizzazione senza richiedere riavvii manuali tra una sessione e l'altra.

Trasforma la visione della tua azienda in realtà con Atlas Cloud AI.

Contatta il commerciale

Cosa chiedono gli sviluppatori sull'API Z.ai

L'API Z.ai offre agli sviluppatori accesso programmatico alla serie GLM di large language model realizzati da Z.ai, l'azienda nota anche come Zhipu AI. GLM sta per General Language Model e comprende release da GLM-4.6 al flagship GLM-5.1, ottimizzate per coding, workflow agentici e uso in produzione bilingue in cinese e inglese. Su Atlas Cloud puoi accedere all'intera gamma tramite un unico endpoint compatibile con OpenAI.

Atlas Cloud ospita la serie GLM da GLM-4.6 fino al flagship GLM-5.1, con GLM-4.7 e GLM-5 intermedi. I tier più leggeri gestiscono attività quotidiane ad alto volume a un costo inferiore, mentre GLM-5.1 è pensato per i lavori di coding e agentici più impegnativi. Ogni modello funziona in modalità pay-as-you-go tramite la stessa chiave.

Sì. Gli open weights di GLM, incluso GLM-5.1, sono rilasciati con licenza MIT, che consente uso commerciale, fine-tuning e redistribuzione senza restrizioni. Se preferisci evitare l'onere dell'infrastruttura, Atlas Cloud serve gli stessi modelli via API per un accesso gestito invece del self-hosting.

Punta il tuo SDK OpenAI esistente alla base URL di Atlas Cloud, imposta la tua chiave e passa il nome del modello GLM che vuoi usare. Poiché l'API Z.ai è compatibile con OpenAI, la maggior parte dei progetti migra cambiando solo la base URL e la stringa del modello; i modelli si integrano direttamente con strumenti agentici come Claude Code, Cline e Roo Code. Inizia a sviluppare oggi stesso.

Sia il cinese sia l'inglese sono lingue di prima classe per GLM, addestrato per offrire un'elevata competenza in entrambe. Puoi scrivere prompt in una delle due lingue e ottenere una qualità costante, rendendo la gamma pratica per team che servono utenti cinesi e internazionali con un unico modello invece di mantenere stack separati.

Da GLM-4.6 a GLM-5.1 supportano una finestra di contesto da 200K token, sufficiente per contenere grandi codebase, documenti lunghi o tracce agentiche estese in una singola richiesta. Se il tuo workflow produce output lunghi, la stessa finestra copre file di codice di grandi dimensioni e log di esecuzione multi-step senza troncamenti prematuri.

GLM-5.1 ha raggiunto il primo posto in SWE-Bench Pro con un punteggio di 58.4 ad aprile 2026, collocandosi tra i modelli open-source più forti per il coding nel mondo reale. Supporta inoltre l'esecuzione autonoma continua fino a otto ore su un singolo task, gestendo pianificazione, iterazione e consegna in un unico ciclo: una caratteristica adatta a workflow agentici di lungo orizzonte in ambienti come Claude Code.

Ogni modello GLM sull'API Z.ai usa una tariffazione pay-as-you-go trasparente, fatturata per token senza abbonamento né impegno mensile. I token di input e output sono misurati separatamente, e i tier più leggeri come GLM-4.7 costano meno per token rispetto al flagship GLM-5.1, così puoi adattare la scelta del modello al budget. Controlla la tariffa per token aggiornata nella scheda di ciascun modello su Atlas Cloud.

Esplora Altre Famiglie

Seedance 2.0

L'API Seedance 2.0 ti offre l'accesso in produzione al modello video multimodale di ByteDance: input quadrimodali (testo, immagine, video, audio) e un sistema "Universal Reference" leader del settore che blocca la composizione, i movimenti di macchina e le azioni dei personaggi tra le diverse inquadrature. Integra un controllo di livello registico con una sola chiamata API, una tariffa fissa di $0,09/s, chiave istantanea e nessuna lista d'attesa, il tutto supportato da uptime e conformità di livello enterprise. Seedance 2.0 Native 4K è ora disponibile!

Visualizza Famiglia

GPT Image 2

L'API GPT Image 2 offre agli sviluppatori l'accesso all'ultimo modello di immagini di OpenAI, il successore di GPT Image 1.5. Genera e modifica immagini con un rendering accurato del testo nei caratteri latini e CJK, oltre a una solida composizione per poster, mockup e infografiche. Su Atlas Cloud puoi accedervi tramite un'unica API unificata insieme a oltre 300 modelli, con crediti gratuiti, un tempo di attività del 99,99% e nessuna verifica dell'organizzazione OpenAI richiesta.

Visualizza Famiglia

Seedream 5.0 Pro

L'API Seedream 5.0 Pro offre agli sviluppatori il modello di editing delle immagini controllabile di ByteDance su Atlas Cloud. Posiziona le modifiche con precisione tramite ancore e coordinate, separa le immagini in livelli modificabili, fonde più riferimenti e abbina colori e materiali esatti, con testo multilingue a 2K e 3K. Su Atlas Cloud puoi accedervi tramite una sola chiave!

Visualizza Famiglia

Gemini Omni Flash

La Gemini Omni API porta nel tuo stack il modello multimodale di generazione ed editing video di Google DeepMind, presentato a Google I/O 2026. Gemini Omni fonde il motore di ragionamento di Gemini con i media generativi, accettando qualsiasi combinazione di testo, immagini, video e audio per produrre output coerenti e fondati sulla conoscenza. Perfeziona i risultati con una conversazione naturale: sostituisci oggetti, riscrivi scene e cambia stile, mentre fisica, personaggi e continuità restano intatti. Atlas Cloud offre l'intera gamma Gemini Omni Flash — text-to-video, image-to-video con fino a 7 immagini di riferimento e reference-to-video — tramite un'unica API unificata, con prezzi trasparenti al secondo a partire da $0.112 e senza abbonamento. Inizia a sviluppare oggi stesso.

Visualizza Famiglia

Grok Imagine

La Grok Imagine API offre agli sviluppatori la generazione di immagini, video e audio di xAI in un'unica suite. Produce immagini fino a 2K con rendering di testi multilingue, oltre a video fino a 15 secondi con audio nativo e sincronizzato ed editing basato su riferimenti. Su Atlas Cloud una singola chiave esegue ogni modalità di Grok Imagine, in modo da poter passare tra immagine, video e audio senza configurazioni separate, a partire da 0,02 $ per immagine e 0,05 $ al secondo.

Visualizza Famiglia

Google

I modelli creativi più potenti di Google sono tutti disponibili su Atlas Cloud. Veo 3.1 offre la generazione di video cinematografici, Nano Banana 2 alimenta la creazione di immagini ad alta fedeltà e Gemini porta l'intelligenza multimodale in ogni flusso di lavoro. Accedi alla suite completa di modelli Google tramite una singola API key con disponibilità Day-0 e prezzi a consumo (pay-as-you-go).

Visualizza Famiglia

Seedance 2.0 Mini

Seedance 2.0 Mini porta la generazione video multimodale di ByteDance nei flussi di lavoro in cui velocità e costi sono fondamentali. Offre le capacità principali di Seedance 2.0 con un impatto minore: generazione più rapida, costi inferiori per video e la stessa integrazione API che utilizzi già. Per i team che gestiscono pipeline ad alto volume o prototipazione su larga scala, Mini è l'opzione predefinita pratica.

Visualizza Famiglia

ByteDance

Dalla generazione di video cinematografici alla creazione di immagini ad alta fedeltà, i modelli più potenti di ByteDance sono disponibili su Atlas Cloud. Esegui Seedance e Seedream su larga scala con i prezzi di inferenza più bassi e zero costi generali di infrastruttura.

Visualizza Famiglia

Alibaba

Atlas Cloud riunisce l'intera linea di modelli di Alibaba in un'unica API: Qwen per attività linguistiche e di immagine, Wan per la generazione di video fino a 1080p. Accedi a ogni modello in modalità pay-as-you-go senza abbonamenti. L'API di Alibaba è disponibile tramite una singola base URL utilizzando il tuo attuale client compatibile con OpenAI.

Visualizza Famiglia

OpenAI

Atlas Cloud ti offre l'accesso all'intera linea di API di OpenAI, da GPT Image 2 per la generazione di immagini a Sora 2 per i video. Ogni modello è disponibile in modalità pay-as-you-go senza alcun impegno mensile. Integralo con una semplice sostituzione dell'URL di base utilizzando l'API compatibile con OpenAI.

Visualizza Famiglia

xAI

Costruisci pipeline complete di immagini e video utilizzando la xAI API su Atlas Cloud. Genera in 2K, modifica con immagini di riferimento e anima le immagini in clip sincronizzate con l'audio.

Visualizza Famiglia

Kwaivgi

L'API Kwaivgi al 15% in meno rispetto al prezzo standard. Atlas Cloud offre accesso Day-0 alle nuove versioni di Kling con prezzi a consumo e senza limiti di postazioni. Un solo account, una sola chiave, tutti i modelli Kling dal livello standard a quello master.

Visualizza Famiglia