
Atlas Cloud hostuje pełną serię GLM za pośrednictwem API Z-AI, od GLM-4.6 do GLM-5.1. Wszystkie modele są dwujęzyczne i dostępne w modelu płatności zgodnie z rzeczywistym użyciem (pay-as-you-go) z oknem kontekstowym 202K.
Napędzaj czat, rozumowanie i agentów na dużą skalę dzięki wiodącym dużym modelom językowym, dostarczanym szybko i przystępnie cenowo w Atlas Cloud.
Compare standard vs. our pricing across every Z.ai model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| GLM 5.1 | $1.4/$4.4per 1M tokens202.8K context | $1.26/$3.96M in/outper 1M tokens202.8K context | -10% | View |
| GLM 5 Turbo | $1.2/$4per 1M tokens262.1K context | $1.2/$4M in/outper 1M tokens262.1K context | — | View |
| GLM 5 | $1/$3.2per 1M tokens202.8K context | $0.95/$3.15M in/outper 1M tokens202.8K context | — | View |
| GLM 4.7 | $0.6/$2.2per 1M tokens202.8K context | $0.52/$1.85M in/outper 1M tokens202.8K context | — | View |
| GLM 4.6 | $0.6/$2.2per 1M tokens202.8K context | $0.6/$2.2M in/outper 1M tokens202.8K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Poziomy modeli GLM obejmują wszystko, od szybkich dwujęzycznych zadań czatu po wielogodzinnych autonomicznych agentów kodujących. Zespoły używają GLM-5.1 do długoterminowych prac inżynieryjnych, a GLM-4.7 lub GLM-5 Turbo tam, gdzie priorytetem jest efektywność kosztowa i szybkość.
Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.
Zespoły programistyczne używają GLM-5.1 do przeprowadzania pełnych transformacji baz kodu podczas wielogodzinnych sesji bez ludzkich punktów kontrolnych. Model planuje, pisze, testuje i iteruje zmiany w sposób ciągły przez maksymalnie 8 godzin, obsługując 655 iteracji w zaprezentowanej kompilacji systemu Linux od podstaw. Zastępuje to tygodnie ręcznej pracy przy refaktoryzacji dużych, starszych baz kodu.
Zespoły ds. narzędzi dla programistów integrują GLM-5.1 i GLM-5 Turbo jako podstawowy model dla przepływów pracy kodowania AI w Claude Code, Kilo Code, Cline, Roo Code i OpenCode. Z-AI API w Atlas Cloud jest kompatybilne z OpenAI, więc zmiana base URL jest jedyną modyfikacją wymaganą do przekierowania dowolnego z tych narzędzi przez GLM. Okno kontekstowe 262K modelu GLM-5 Turbo sprawia, że jest on szczególnie odpowiedni do kontekstu dużych plików w przepływach pracy środowisk IDE.
Zespoły operacyjne budują agentów wsparcia przy użyciu GLM-5, którzy łączą dostęp do bazy danych zgłoszeń, wyszukiwanie w bazie wiedzy i narzędzia do eskalacji, aby obsługiwać powtarzalne zapytania bez interwencji człowieka. Obsługa wywołań wielu narzędzi i strumieniowania przez model czyni go praktycznym we wdrożeniach w czasie rzeczywistym skierowanych do klientów. Obsługa dwóch języków oznacza, że ten sam agent obsługuje zgłoszenia w języku chińskim i angielskim z jednego punktu końcowego modelu w Atlas Cloud.
Zespoły ds. treści i biznesu używają GLM-4.7 do generowania dokumentów Word, prezentacji PowerPoint, plików PDF i raportów Excel zarówno w języku chińskim, jak i angielskim na podstawie ustrukturyzowanych promptów. Przy cenie 0,52 USD za milion tokenów wejściowych jest to najbardziej opłacalny poziom GLM dla wielkoseryjnych przepływów pracy z dokumentami, które nie wymagają wnioskowania na poziomie granicznych modeli (frontier-level). Okno kontekstowe o rozmiarze 202K wystarcza do pomieszczenia pełnych zarysów dokumentów i materiałów źródłowych w jednym wywołaniu.
Zespoły ds. infrastruktury AI używają GLM-5.1 do uruchamiania opartych na benchmarkach potoków optymalizacyjnych dla obciążeń uczenia maszynowego. W zadaniach w stylu KernelBench, GLM-5.1 wykonuje tysiące sterowanych narzędziami cykli optymalizacyjnych i osiąga 3,6-krotne przyspieszenie średniej geometrycznej. Możliwość 8-godzinnego ciągłego wykonywania oznacza, że agent uruchamia pełną pętlę optymalizacyjną bez konieczności ręcznego restartowania między sesjami.
Z-AI (zapisywane również jako Z.ai) jest twórcą serii dużych modeli językowych GLM, znanej również jako ZhipuAI. GLM to skrót od General Language Model, rodziny obejmującej modele od GLM-4.6 do obecnego flagowca GLM-5.1. Seria ta została stworzona z myślą o programowaniu, przepływach pracy opartych na agentach oraz dwujęzycznym, chińsko-angielskim zastosowaniu produkcyjnym.
7 kwietnia 2026 r. model GLM-5.1 zajął pierwsze miejsce w SWE-Bench Pro z wynikiem 58,4, wyprzedzając modele GPT-5.4 (57,7) i Claude Opus 4.6 (57,3). Prowadzi również w rankingu CyberGym z wynikiem 68,7. Czyni to go najwyżej ocenianym modelem open-source do programowania w środowisku produkcyjnym na drugi kwartał 2026 roku.
Tak. GLM-5.1 obsługuje ciągłe, autonomiczne wykonywanie pojedynczego zadania do 8 godzin bez ingerencji człowieka. Obsługuje pełną pętlę planowania, wykonywania, iteracyjnej optymalizacji i dostarczania. Zostało to zaprojektowane specjalnie dla długoterminowych przepływów pracy agentów kodujących w środowiskach takich jak Claude Code i konfiguracjach kompatybilnych z OpenClaw.
GLM-5 to podstawowy model bazowy zbudowany na architekturze MoE o 744 miliardach parametrów, wytrenowany na 28,5 biliona tokenów i zajmujący 1. miejsce w rankingu Elo na Chatbot Arena dla modeli open-source. GLM-5.1 to po-treningowa aktualizacja tej samej bazy ze znacznie silniejszymi możliwościami kodowania, korzystania z narzędzi i autonomicznego wykonywania. GLM-5 kosztuje 0,95 USD za milion tokenów wejściowych w Atlas Cloud; cena GLM-5.1 wynosi 1,26 USD za milion tokenów wejściowych.
Tak. GLM-5.1 jest udostępniany na licencji MIT, która zezwala na komercyjne wykorzystanie, fine-tuning i redystrybucję bez ograniczeń. Otwarte wagi są dostępne dla wdrożeń typu self-hosted. Atlas Cloud udostępnia GLM-5.1 przez API dla zespołów, które preferują dostęp zarządzany bez kosztów ogólnych infrastruktury.
GLM-4.6, GLM-4.7, GLM-5 i GLM-5.1 obsługują okno kontekstowe o rozmiarze 202 750 tokenów w Atlas Cloud. Wyjątkiem jest GLM-5 Turbo, który oferuje większe okno kontekstowe na 262 144 tokeny oraz maksymalną długość danych wyjściowych wynoszącą 131 072 tokeny. GLM-5.1 jest odpowiedni do generowania długich plików z kodem oraz rozszerzonych śladów wykonywania w ramach swojego limitu kontekstu.
Tak. Wszystkie modele GLM są zoptymalizowane pod kątem języka chińskiego i angielskiego, wykazując się równą biegłością w obu tych językach. Możesz pisać prompty w dowolnym z nich i w zamian otrzymywać wyniki o stałej jakości. Sprawia to, że GLM jest praktycznym rozwiązaniem dla zespołów tworzących produkty obsługujące zarówno rynek chiński, jak i międzynarodowy za pomocą jednego modelu.
Ceny GLM-4.7 zaczynają się od 0,52 USD za milion tokenów wejściowych i jest to najbardziej opłacalny poziom. GLM-4.6 kosztuje 0,60 USD, GLM-5 kosztuje 0,95 USD, a GLM-5 Turbo – 1,20 USD za milion tokenów wejściowych. Flagowy model GLM-5.1 kosztuje 1,26 USD za milion tokenów wejściowych i 3,96 USD za milion tokenów wyjściowych. Wszystkie modele działają w modelu płatności za użycie (pay-as-you-go) bez miesięcznych zobowiązań.
Poradniki, samouczki i nowości produktowe, dzięki którym w pełni wykorzystasz Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.