Z.ai Models on AtlasCloud | GLM

Atlas Cloud hostuje pełną serię GLM za pośrednictwem API Z-AI, od GLM-4.6 do GLM-5.1. Wszystkie modele są dwujęzyczne i dostępne w modelu płatności zgodnie z rzeczywistym użyciem (pay-as-you-go) z oknem kontekstowym 202K.

Large Language Models by Z.ai

Napędzaj czat, rozumowanie i agentów na dużą skalę dzięki wiodącym dużym modelom językowym, dostarczanym szybko i przystępnie cenowo w Atlas Cloud.

Zobacz wszystkie modele

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

ModelStandard Price (USD)Our Price (USD)Discount
GLM 5.1
$1.4/$4.4per 1M tokens202.8K context
$1.26/$3.96M in/outper 1M tokens202.8K context
-10%View
GLM 5 Turbo
$1.2/$4per 1M tokens262.1K context
$1.2/$4M in/outper 1M tokens262.1K context
View
GLM 5
$1/$3.2per 1M tokens202.8K context
$0.95/$3.15M in/outper 1M tokens202.8K context
View
GLM 4.7
$0.6/$2.2per 1M tokens202.8K context
$0.52/$1.85M in/outper 1M tokens202.8K context
View
GLM 4.6
$0.6/$2.2per 1M tokens202.8K context
$0.6/$2.2M in/outper 1M tokens202.8K context
View

Explore models from other providers

Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.

Przypadki użycia Z-AI API, które możesz zbudować na Atlas Cloud

Poziomy modeli GLM obejmują wszystko, od szybkich dwujęzycznych zadań czatu po wielogodzinnych autonomicznych agentów kodujących. Zespoły używają GLM-5.1 do długoterminowych prac inżynieryjnych, a GLM-4.7 lub GLM-5 Turbo tam, gdzie priorytetem jest efektywność kosztowa i szybkość.

Długoterminowa optymalizacja wydajności bazy danych

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

Autonomiczna Refaktoryzacja Kodu w Skali Repozytorium

Zespoły programistyczne używają GLM-5.1 do przeprowadzania pełnych transformacji baz kodu podczas wielogodzinnych sesji bez ludzkich punktów kontrolnych. Model planuje, pisze, testuje i iteruje zmiany w sposób ciągły przez maksymalnie 8 godzin, obsługując 655 iteracji w zaprezentowanej kompilacji systemu Linux od podstaw. Zastępuje to tygodnie ręcznej pracy przy refaktoryzacji dużych, starszych baz kodu.

Integracja Agenta Kodującego z IDE

Zespoły ds. narzędzi dla programistów integrują GLM-5.1 i GLM-5 Turbo jako podstawowy model dla przepływów pracy kodowania AI w Claude Code, Kilo Code, Cline, Roo Code i OpenCode. Z-AI API w Atlas Cloud jest kompatybilne z OpenAI, więc zmiana base URL jest jedyną modyfikacją wymaganą do przekierowania dowolnego z tych narzędzi przez GLM. Okno kontekstowe 262K modelu GLM-5 Turbo sprawia, że jest on szczególnie odpowiedni do kontekstu dużych plików w przepływach pracy środowisk IDE.

Automatyzacja Zapytań Wsparcia Tier-1

Zespoły operacyjne budują agentów wsparcia przy użyciu GLM-5, którzy łączą dostęp do bazy danych zgłoszeń, wyszukiwanie w bazie wiedzy i narzędzia do eskalacji, aby obsługiwać powtarzalne zapytania bez interwencji człowieka. Obsługa wywołań wielu narzędzi i strumieniowania przez model czyni go praktycznym we wdrożeniach w czasie rzeczywistym skierowanych do klientów. Obsługa dwóch języków oznacza, że ten sam agent obsługuje zgłoszenia w języku chińskim i angielskim z jednego punktu końcowego modelu w Atlas Cloud.

Generowanie dwujęzycznych dokumentów na dużą skalę

Zespoły ds. treści i biznesu używają GLM-4.7 do generowania dokumentów Word, prezentacji PowerPoint, plików PDF i raportów Excel zarówno w języku chińskim, jak i angielskim na podstawie ustrukturyzowanych promptów. Przy cenie 0,52 USD za milion tokenów wejściowych jest to najbardziej opłacalny poziom GLM dla wielkoseryjnych przepływów pracy z dokumentami, które nie wymagają wnioskowania na poziomie granicznych modeli (frontier-level). Okno kontekstowe o rozmiarze 202K wystarcza do pomieszczenia pełnych zarysów dokumentów i materiałów źródłowych w jednym wywołaniu.

Optymalizacja jądra dla obciążeń ML

Zespoły ds. infrastruktury AI używają GLM-5.1 do uruchamiania opartych na benchmarkach potoków optymalizacyjnych dla obciążeń uczenia maszynowego. W zadaniach w stylu KernelBench, GLM-5.1 wykonuje tysiące sterowanych narzędziami cykli optymalizacyjnych i osiąga 3,6-krotne przyspieszenie średniej geometrycznej. Możliwość 8-godzinnego ciągłego wykonywania oznacza, że agent uruchamia pełną pętlę optymalizacyjną bez konieczności ręcznego restartowania między sesjami.

Zamień wizję swojej firmy w rzeczywistość dzięki Atlas Cloud AI.

Skontaktuj się ze sprzedażą

Często zadawane pytania dotyczące modeli Z.ai

Z-AI (zapisywane również jako Z.ai) jest twórcą serii dużych modeli językowych GLM, znanej również jako ZhipuAI. GLM to skrót od General Language Model, rodziny obejmującej modele od GLM-4.6 do obecnego flagowca GLM-5.1. Seria ta została stworzona z myślą o programowaniu, przepływach pracy opartych na agentach oraz dwujęzycznym, chińsko-angielskim zastosowaniu produkcyjnym.

7 kwietnia 2026 r. model GLM-5.1 zajął pierwsze miejsce w SWE-Bench Pro z wynikiem 58,4, wyprzedzając modele GPT-5.4 (57,7) i Claude Opus 4.6 (57,3). Prowadzi również w rankingu CyberGym z wynikiem 68,7. Czyni to go najwyżej ocenianym modelem open-source do programowania w środowisku produkcyjnym na drugi kwartał 2026 roku.

Tak. GLM-5.1 obsługuje ciągłe, autonomiczne wykonywanie pojedynczego zadania do 8 godzin bez ingerencji człowieka. Obsługuje pełną pętlę planowania, wykonywania, iteracyjnej optymalizacji i dostarczania. Zostało to zaprojektowane specjalnie dla długoterminowych przepływów pracy agentów kodujących w środowiskach takich jak Claude Code i konfiguracjach kompatybilnych z OpenClaw.

GLM-5 to podstawowy model bazowy zbudowany na architekturze MoE o 744 miliardach parametrów, wytrenowany na 28,5 biliona tokenów i zajmujący 1. miejsce w rankingu Elo na Chatbot Arena dla modeli open-source. GLM-5.1 to po-treningowa aktualizacja tej samej bazy ze znacznie silniejszymi możliwościami kodowania, korzystania z narzędzi i autonomicznego wykonywania. GLM-5 kosztuje 0,95 USD za milion tokenów wejściowych w Atlas Cloud; cena GLM-5.1 wynosi 1,26 USD za milion tokenów wejściowych.

Tak. GLM-5.1 jest udostępniany na licencji MIT, która zezwala na komercyjne wykorzystanie, fine-tuning i redystrybucję bez ograniczeń. Otwarte wagi są dostępne dla wdrożeń typu self-hosted. Atlas Cloud udostępnia GLM-5.1 przez API dla zespołów, które preferują dostęp zarządzany bez kosztów ogólnych infrastruktury.

GLM-4.6, GLM-4.7, GLM-5 i GLM-5.1 obsługują okno kontekstowe o rozmiarze 202 750 tokenów w Atlas Cloud. Wyjątkiem jest GLM-5 Turbo, który oferuje większe okno kontekstowe na 262 144 tokeny oraz maksymalną długość danych wyjściowych wynoszącą 131 072 tokeny. GLM-5.1 jest odpowiedni do generowania długich plików z kodem oraz rozszerzonych śladów wykonywania w ramach swojego limitu kontekstu.

Tak. Wszystkie modele GLM są zoptymalizowane pod kątem języka chińskiego i angielskiego, wykazując się równą biegłością w obu tych językach. Możesz pisać prompty w dowolnym z nich i w zamian otrzymywać wyniki o stałej jakości. Sprawia to, że GLM jest praktycznym rozwiązaniem dla zespołów tworzących produkty obsługujące zarówno rynek chiński, jak i międzynarodowy za pomocą jednego modelu.

Ceny GLM-4.7 zaczynają się od 0,52 USD za milion tokenów wejściowych i jest to najbardziej opłacalny poziom. GLM-4.6 kosztuje 0,60 USD, GLM-5 kosztuje 0,95 USD, a GLM-5 Turbo – 1,20 USD za milion tokenów wejściowych. Flagowy model GLM-5.1 kosztuje 1,26 USD za milion tokenów wejściowych i 3,96 USD za milion tokenów wyjściowych. Wszystkie modele działają w modelu płatności za użycie (pay-as-you-go) bez miesięcznych zobowiązań.

Poznaj Więcej Rodzin

Seedance 2.0 Models

Seedance 2.0(by Bytedance) is a multimodal video generation model that redefines "controllable creation," moving beyond the limitations of text or start/end frames. It supports quad-modal inputs—text, image, video, and audio—and introduces an industry-leading "Universal Reference" system. By precisely replicating the composition, camera movement, and character actions from reference assets, Seedance 2.0 solves critical issues with character consistency and physical coherence, empowering creators to act as true "directors" with deep control over their output.

Zobacz Rodzinę

Grok-Imagine Models

Grok Imagine Image Quality is xAI's latest AI image generation model, delivering studio-grade visuals with up to 2K resolution and razor-sharp detail. It offers best-in-class text rendering across multiple languages, photorealistic outputs with natural lighting, rich textures, and believable physics, plus tighter prompt following and image editing with reference inputs for precise creative control. Ideal for hero images, ad creatives, product renders, and brand-grade visuals.

Zobacz Rodzinę

Gemini Omni

Gemini Omni (by Google DeepMind) is a video generation and editing model launched on May 20, 2026 at Google I/O that redefines the standard for "reasoning-driven creation," built specifically to solve the core challenge of AI video: making output that actually understands what you mean, not just what you type. It fuses Gemini's reasoning engine with generative capability, accepting any mix of images, text, video, and audio to produce consistent, knowledge-grounded output. Unlike models that start from scratch each time, Omni lets you edit through natural conversation — swapping objects, rewriting scenes, shifting styles — while keeping physics, characters, and continuity intact across every turn.

Zobacz Rodzinę

GPT Image 2 Models

GPT Image 2 is a state-of-the-art multimodal foundation model engineered for exceptional text-to-image generation with unprecedented photorealism and creative versatility. Developed by OpenAI as the evolution of the DALL-E lineage, it transforms detailed natural language descriptions into hyper-realistic imagery at up to 4K resolution. With proprietary "Neural Rendering Engine" technology for precise visual control, GPT Image 2 delivers studio-quality results with accurate anatomy, lighting, and composition—making it the premier AI tool for professional creators, enterprises, and developers demanding production-ready visual assets.

Zobacz Rodzinę

Google Models on Atlas Cloud | Gemini, Nano Bananas & Veo

Najpotężniejsze modele kreatywne Google są w pełni dostępne na platformie Atlas Cloud. Veo 3.1 zapewnia kinową generację wideo, Nano Banana 2 umożliwia tworzenie obrazów o wysokiej wierności, a Gemini wprowadza wielomodalną inteligencję do każdego przepływu pracy. Uzyskaj dostęp do pełnego pakietu modeli Google za pomocą jednego klucza API key z dostępnością Day-0 i cennikiem pay-as-you-go.

Zobacz Rodzinę

ByteDance Models on Atlas Cloud | Seedance & Seedream

Od generowania kinowych filmów po tworzenie obrazów o wysokiej wierności, najpotężniejsze modele ByteDance są dostępne w Atlas Cloud. Uruchamiaj Seedance i Seedream na dużą skalę z najniższymi cenami wnioskowania i zerowymi kosztami ogólnymi infrastruktury.

Zobacz Rodzinę

Alibaba Models on Atlas Cloud | Wan & Qwen

Atlas Cloud łączy pełną gamę modeli Alibaba w ramach jednego API: Qwen do zadań związanych z językiem i obrazem oraz Wan do generowania wideo w rozdzielczości do 1080p. Uzyskaj dostęp do każdego modelu w modelu płatności zgodnie z rzeczywistym użyciem (pay-as-you-go) bez subskrypcji. Alibaba API jest dostępne poprzez pojedynczy bazowy adres URL (base URL) przy użyciu istniejącego klienta kompatybilnego z OpenAI.

Zobacz Rodzinę

MAI Image 2.5 Models

MAI-Image-2.5 to najnowsza rodzina modeli firmy Microsoft do generowania i edycji fotorealistycznych obrazów, stworzona z myślą o projektowaniu komercyjnym, fotografii produktowej i tworzeniu gotowych treści dla marek. Dostępna w wariantach standardowym i Flash zarówno do generowania obrazu z tekstu, jak i edycji obrazu, zapewnia najlepsze w swojej klasie wyniki Arena ELO w konkurencyjnych cenach — od 0,03 USD za obraz. Dzięki precyzyjnemu renderowaniu tekstu, chirurgicznym możliwościom edycji i naturalnemu generowaniu portretów, MAI-Image-2.5 został zaprojektowany dla zespołów, które potrzebują materiałów wizualnych o jakości produkcyjnej bez kosztów związanych z postprodukcją.

Zobacz Rodzinę

Wan2.7 Models

Launching this March, Wan2.7 is the latest powerhouse in the Qwen ecosystem, delivering a massive upgrade in visual fidelity, audio synchronization, and motion consistency over version 2.6. This all-in-one AI video generator supports advanced features like first-and-last frame control, 3x3 grid synthesis, and instruction-based video editing. Outperforming competitors like Jimeng, Wan2.7 offers superior flexibility with support for real-person image inputs, up to five video references, and 1080P high-definition outputs spanning 2 to 15 seconds, making it the premier choice for professional digital storytelling and high-end content marketing.

Zobacz Rodzinę

Nano Banana2 Models

Nano Banana 2 (by Google), is a generative image model that perfectly balances lightning-fast rendering with exceptional visual quality. With an improved price-performance ratio, it achieves breakthrough micro-detail depiction, accurate native text rendering, and complex physical structure reconstruction. It serves as a highly efficient, commercial-grade visual production tool for developers, marketing teams, and content creators.

Zobacz Rodzinę

Doubao Models

Doubao to rodzina dużych modeli językowych firmy ByteDance, zaprojektowana z myślą o wnioskowaniu na poziomie produkcyjnym, kodowaniu i wielkoskalowych obciążeniach roboczych opartych na agentach. Obejmując flagowy model Seed 2.0 Pro, dedykowany wariant Code Preview, oszczędne poziomy Lite i Mini, a także sprawdzone generacje Seed 1.8 i Seed 1.6, seria ta zapewnia programistom pojedynczy, kompatybilny z OpenAI interfejs do skalowania od zaawansowanego wnioskowania po wrażliwe na opóźnienia zadania o dużej przepustowości. Każdy model Doubao w Atlas Cloud jest wyposażony w okno kontekstowe o rozmiarze 256K tokenów, przesyłanie strumieniowe i bezpośrednią kompatybilność z SDK — dzięki czemu można dopasować odpowiedni model do każdego zadania bez konieczności przepisywania stosu technologicznego.

Zobacz Rodzinę

Hunyuan 3D Generation Models

Hunyuan3D is a state-of-the-art 3D generative foundation model from Tencent that turns text prompts and single images into high-quality, textured 3D meshes. Built on a two-stage pipeline—Hunyuan3D-DiT for shape generation via flow-matching diffusion and Hunyuan3D-Paint for multi-view texture synthesis—it produces clean geometry with full PBR materials ready for game engines, AR/VR, 3D printing, and DCC tools. Available in Pro (up to 1.5M faces, 4K PBR textures) and Rapid (2–3 minute lightweight generation) tiers, with both Text-to-3D and Image-to-3D entry points, Hunyuan3D is the premier AI 3D toolkit for game developers, e-commerce teams, and 3D content studios. Generations start at $0.02 each.

Zobacz Rodzinę

Polecane artykuły

Poradniki, samouczki i nowości produktowe, dzięki którym w pełni wykorzystasz Atlas Cloud.

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.