Z.ai Models on AtlasCloud | GLM

Atlas Cloud는 Z-AI API를 통해 GLM-4.6에서 GLM-5.1에 이르는 전체 GLM 시리즈를 호스팅합니다. 모든 모델은 이중 언어를 지원하며, 202K의 컨텍스트 윈도우와 함께 종량제로 이용할 수 있습니다.

Large Language Models by Z.ai

Atlas Cloud에서 업계 선도 대규모 언어 모델을 빠르고 합리적인 비용으로 제공해 채팅, 추론, 에이전트를 대규모로 구동합니다.

모든 모델 보기

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

ModelStandard Price (USD)Our Price (USD)Discount
GLM 5.1
$1.4/$4.4per 1M tokens202.8K context
$1.26/$3.96M in/outper 1M tokens202.8K context
-10%View
GLM 5 Turbo
$1.2/$4per 1M tokens262.1K context
$1.2/$4M in/outper 1M tokens262.1K context
View
GLM 5
$1/$3.2per 1M tokens202.8K context
$0.95/$3.15M in/outper 1M tokens202.8K context
View
GLM 4.7
$0.6/$2.2per 1M tokens202.8K context
$0.52/$1.85M in/outper 1M tokens202.8K context
View
GLM 4.6
$0.6/$2.2per 1M tokens202.8K context
$0.6/$2.2M in/outper 1M tokens202.8K context
View

Explore models from other providers

Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.

Atlas Cloud에서 구축할 수 있는 Z-AI API 사용 사례

GLM의 모델 계층은 빠른 이중 언어 채팅 작업부터 몇 시간에 걸친 자율 코딩 에이전트에 이르기까지 모든 것을 포괄합니다. 팀들은 장기적인 엔지니어링 작업에 GLM-5.1을 사용하며, 비용 효율성과 속도가 우선시되는 곳에서는 GLM-4.7 또는 GLM-5 Turbo를 사용합니다.

장기 데이터베이스 성능 최적화

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

자율형 저장소 규모 코드 리팩터링

개발 팀은 GLM-5.1을 사용하여 사람의 검토 지점 없이 몇 시간에 걸친 전체 코드베이스 변환을 실행합니다. 이 모델은 최대 8시간 동안 지속적으로 변경 사항을 계획, 작성, 테스트 및 반복하며, 시연된 처음부터 구축하는 Linux 시스템 빌드에서 655번의 반복을 처리했습니다. 이는 대규모 레거시 코드베이스에서 몇 주 동안 수작업으로 진행되던 리팩토링 작업을 대체합니다.

IDE 코딩 에이전트 통합

개발자 도구 팀은 Claude Code, Kilo Code, Cline, Roo Code 및 OpenCode의 AI 코딩 워크플로를 위한 기본 모델로 GLM-5.1 및 GLM-5 Turbo를 통합합니다. Atlas Cloud의 Z-AI API는 OpenAI와 호환되므로, 이러한 도구 중 하나를 GLM을 통해 라우팅하는 데 필요한 변경 사항은 base URL 교체뿐입니다. GLM-5 Turbo의 262K 컨텍스트 창은 IDE 워크플로의 대용량 파일 컨텍스트에 특히 적합합니다.

Tier-1 지원 문의 자동화

운영 팀은 GLM-5를 사용하여 티켓 데이터베이스 액세스, 지식 기반 검색 및 에스컬레이션 도구를 결합하여 사람의 개입 없이 반복적인 쿼리를 처리하는 지원 에이전트를 구축합니다. 모델의 다중 도구 호출 및 스트리밍 지원은 실시간 고객 대면 배포에 실용적입니다. 이중 언어 지원을 통해 동일한 에이전트가 Atlas Cloud의 단일 모델 엔드포인트에서 중국어 및 영어 티켓을 처리할 수 있습니다.

대규모 이중 언어 문서 생성

콘텐츠 및 비즈니스 팀은 구조화된 프롬프트를 사용하여 중국어와 영어로 된 Word 문서, PowerPoint 프레젠테이션, PDF 및 Excel 보고서를 생성하기 위해 GLM-4.7을 사용합니다. 100만 입력 토큰당 0.52달러인 이 모델은 최첨단 수준의 추론이 필요하지 않은 대용량 문서 워크플로우에 가장 비용 효율적인 GLM 티어입니다. 202K의 컨텍스트 창은 단일 호출로 전체 문서 개요와 원본 자료를 유지하기에 충분합니다.

ML 워크로드 커널 최적화

AI 인프라 팀은 GLM-5.1을 사용하여 기계 학습 워크로드에서 벤치마크 기반 최적화 파이프라인을 실행합니다. KernelBench 스타일의 작업에서 GLM-5.1은 수천 번의 도구 기반 최적화 주기를 수행하여 3.6배의 기하 평균 속도 향상을 달성합니다. 8시간 연속 실행 기능은 에이전트가 세션 간에 수동으로 재시작할 필요 없이 전체 최적화 루프를 실행함을 의미합니다.

Atlas Cloud AI .

영업팀 문의

Z.ai 모델에 대한 자주 묻는 질문

Z-AI(Z.ai로도 표기)는 ZhipuAI로도 알려진 대규모 언어 모델인 GLM 시리즈의 개발사입니다. GLM은 일반 언어 모델(General Language Model)의 약자로, GLM-4.6부터 현재의 플래그십 모델인 GLM-5.1까지 아우르는 제품군입니다. 이 시리즈는 코딩, 에이전트 워크플로우 및 중-영 이중 언어 프로덕션 환경에서의 사용을 위해 구축되었습니다.

GLM-5.1은 2026년 4월 7일 SWE-Bench Pro에서 58.4점을 기록하며 GPT-5.4(57.7점)와 Claude Opus 4.6(57.3점)을 제치고 1위를 차지했습니다. 또한 CyberGym에서도 68.7점으로 선두를 달리고 있습니다. 이로써 2026년 2분기 기준 프로덕션 코딩을 위한 최고 순위의 오픈 소스 모델이 되었습니다.

네. GLM-5.1은 사람의 개입 없이 단일 작업에 대해 최대 8시간 동안 지속적인 자율 실행을 지원합니다. 이 모델은 계획, 실행, 반복적 최적화 및 제공의 전체 루프를 처리합니다. 이는 Claude Code 및 OpenClaw 호환 설정과 같은 환경에서 장기 코딩 에이전트 워크플로우를 위해 특별히 설계되었습니다.

GLM-5는 7,440억 개의 파라미터를 가진 MoE 아키텍처를 기반으로 구축된 기반 모델로, 28.5조 개의 토큰으로 훈련되었으며, 오픈소스 모델을 대상으로 한 Chatbot Arena에서 Elo 순위 1위를 차지했습니다. GLM-5.1은 동일한 기반 모델의 훈련 후 업그레이드 버전으로, 코딩, 도구 사용 및 자율 실행 능력이 크게 강화되었습니다. Atlas Cloud에서 GLM-5의 가격은 입력 토큰 100만 개당 0.95달러이며, GLM-5.1은 입력 토큰 100만 개당 1.26달러입니다.

네. GLM-5.1은 MIT 라이선스로 배포되며, 상업적 사용, 파인튜닝 및 재배포를 제한 없이 허용합니다. 오픈 가중치는 셀프 호스팅 배포를 위해 제공됩니다. 인프라 오버헤드 없이 관리형 액세스를 선호하는 팀을 위해 Atlas Cloud는 API를 통해 GLM-5.1을 제공합니다.

GLM-4.6, GLM-4.7, GLM-5 및 GLM-5.1은 모두 Atlas Cloud에서 202,750 토큰의 컨텍스트 윈도우를 지원합니다. GLM-5 Turbo는 예외적으로 262,144 토큰의 더 큰 컨텍스트 윈도우와 131,072 토큰의 최대 출력 길이를 갖습니다. GLM-5.1은 컨텍스트 제한 내에서 긴 코드 파일 및 확장된 실행 추적을 생성하는 데 적합합니다.

네. 모든 GLM 모델은 중국어와 영어에 최적화되어 있으며 두 언어 모두에서 동일한 능숙도를 제공합니다. 두 언어 중 하나로 프롬프트를 작성하여 일관된 품질의 결과물을 얻을 수 있습니다. 이로 인해 GLM은 단일 모델로 중국 및 국제 시장에 모두 서비스하는 제품을 개발하는 팀에게 실용적입니다.

GLM-4.7은 100만 입력 토큰당 0.52달러부터 시작하며 가장 비용 효율적인 티어입니다. 100만 입력 토큰당 GLM-4.6은 0.60달러, GLM-5는 0.95달러, GLM-5 Turbo는 1.20달러입니다. 플래그십 모델인 GLM-5.1은 100만 입력 토큰당 1.26달러, 100만 출력 토큰당 3.96달러입니다. 모든 모델은 월정액 약정 없이 사용한 만큼 지불하는 종량제(pay-as-you-go) 방식입니다.

더 많은 패밀리 탐색

Seedance 2.0 Models

Seedance 2.0(by Bytedance) is a multimodal video generation model that redefines "controllable creation," moving beyond the limitations of text or start/end frames. It supports quad-modal inputs—text, image, video, and audio—and introduces an industry-leading "Universal Reference" system. By precisely replicating the composition, camera movement, and character actions from reference assets, Seedance 2.0 solves critical issues with character consistency and physical coherence, empowering creators to act as true "directors" with deep control over their output.

패밀리 보기

Grok-Imagine Models

Grok Imagine Image Quality is xAI's latest AI image generation model, delivering studio-grade visuals with up to 2K resolution and razor-sharp detail. It offers best-in-class text rendering across multiple languages, photorealistic outputs with natural lighting, rich textures, and believable physics, plus tighter prompt following and image editing with reference inputs for precise creative control. Ideal for hero images, ad creatives, product renders, and brand-grade visuals.

패밀리 보기

Gemini Omni

Gemini Omni (by Google DeepMind) is a video generation and editing model launched on May 20, 2026 at Google I/O that redefines the standard for "reasoning-driven creation," built specifically to solve the core challenge of AI video: making output that actually understands what you mean, not just what you type. It fuses Gemini's reasoning engine with generative capability, accepting any mix of images, text, video, and audio to produce consistent, knowledge-grounded output. Unlike models that start from scratch each time, Omni lets you edit through natural conversation — swapping objects, rewriting scenes, shifting styles — while keeping physics, characters, and continuity intact across every turn.

패밀리 보기

GPT Image 2 Models

GPT Image 2 is a state-of-the-art multimodal foundation model engineered for exceptional text-to-image generation with unprecedented photorealism and creative versatility. Developed by OpenAI as the evolution of the DALL-E lineage, it transforms detailed natural language descriptions into hyper-realistic imagery at up to 4K resolution. With proprietary "Neural Rendering Engine" technology for precise visual control, GPT Image 2 delivers studio-quality results with accurate anatomy, lighting, and composition—making it the premier AI tool for professional creators, enterprises, and developers demanding production-ready visual assets.

패밀리 보기

Google Models on Atlas Cloud | Gemini, Nano Bananas & Veo

Google의 가장 강력한 크리에이티브 모델은 모두 Atlas Cloud에서 사용할 수 있습니다. Veo 3.1은 영화 수준의 비디오 생성을 제공하고, Nano Banana 2는 고충실도 이미지 생성을 지원하며, Gemini는 모든 워크플로우에 멀티모달 인텔리전스를 제공합니다. Day-0 가용성과 종량제(pay-as-you-go) 요금제로 단일 API key를 통해 전체 Google 모델 제품군에 액세스하세요.

패밀리 보기

ByteDance Models on Atlas Cloud | Seedance & Seedream

시네마틱 비디오 생성부터 고해상도 이미지 제작까지, ByteDance의 가장 강력한 모델들이 현재 Atlas Cloud에 라이브로 제공됩니다. 가장 낮은 추론 가격과 인프라 오버헤드 없이 대규모로 Seedance와 Seedream을 실행해 보세요.

패밀리 보기

Alibaba Models on Atlas Cloud | Wan & Qwen

Atlas Cloud는 Alibaba의 전체 모델 라인업을 단일 API로 통합합니다. 언어 및 이미지 작업을 위한 Qwen, 최대 1080p 비디오 생성을 위한 Wan을 제공합니다. 구독 없이 사용한 만큼만 지불하는(pay-as-you-go) 방식으로 모든 모델에 액세스하세요. Alibaba API는 기존의 OpenAI 호환 클라이언트를 사용하여 단일 기본 URL(base URL)을 통해 사용할 수 있습니다.

패밀리 보기

MAI Image 2.5 Models

MAI-Image-2.5는 상업용 디자인, 제품 사진 및 브랜드용 콘텐츠 제작을 위해 구축된 Microsoft의 최신 실사 이미지 생성 및 편집 모델 제품군입니다. 텍스트-이미지 생성 및 이미지 편집 모두에 대해 표준 및 Flash 변형으로 제공되며, 이미지당 $0.03부터 시작하는 경쟁력 있는 가격으로 동급 최고의 Arena ELO 점수를 제공합니다. 정밀한 텍스트 렌더링, 정교한 편집 기능 및 자연스러운 인물 생성을 갖춘 MAI-Image-2.5는 후처리 오버헤드 없이 프로덕션 품질의 시각적 자료가 필요한 팀을 위해 설계되었습니다.

패밀리 보기

Wan2.7 Models

Launching this March, Wan2.7 is the latest powerhouse in the Qwen ecosystem, delivering a massive upgrade in visual fidelity, audio synchronization, and motion consistency over version 2.6. This all-in-one AI video generator supports advanced features like first-and-last frame control, 3x3 grid synthesis, and instruction-based video editing. Outperforming competitors like Jimeng, Wan2.7 offers superior flexibility with support for real-person image inputs, up to five video references, and 1080P high-definition outputs spanning 2 to 15 seconds, making it the premier choice for professional digital storytelling and high-end content marketing.

패밀리 보기

Nano Banana2 Models

Nano Banana 2 (by Google), is a generative image model that perfectly balances lightning-fast rendering with exceptional visual quality. With an improved price-performance ratio, it achieves breakthrough micro-detail depiction, accurate native text rendering, and complex physical structure reconstruction. It serves as a highly efficient, commercial-grade visual production tool for developers, marketing teams, and content creators.

패밀리 보기

Doubao Models

Doubao는 프로덕션 수준의 추론, 코딩 및 대용량 에이전트 워크로드를 위해 엔지니어링된 ByteDance의 대형 언어 모델 제품군입니다. 플래그십 Seed 2.0 Pro, 전용 Code Preview 변형, 비용 효율적인 Lite 및 Mini 계층, 그리고 검증된 Seed 1.8 및 Seed 1.6 세대를 아우르는 이 라인업은 개발자에게 단일 OpenAI 호환 인터페이스를 제공하여 최첨단 추론부터 지연 시간에 민감한 처리량이 많은 작업까지 확장할 수 있도록 합니다. Atlas Cloud의 모든 Doubao 모델은 256K 토큰 컨텍스트 창, 스트리밍 및 드롭인 SDK 호환성을 제공하므로 스택을 다시 작성하지 않고도 각 작업에 적합한 모델을 일치시킬 수 있습니다.

패밀리 보기

Hunyuan 3D Generation Models

Hunyuan3D is a state-of-the-art 3D generative foundation model from Tencent that turns text prompts and single images into high-quality, textured 3D meshes. Built on a two-stage pipeline—Hunyuan3D-DiT for shape generation via flow-matching diffusion and Hunyuan3D-Paint for multi-view texture synthesis—it produces clean geometry with full PBR materials ready for game engines, AR/VR, 3D printing, and DCC tools. Available in Pro (up to 1.5M faces, 4K PBR textures) and Rapid (2–3 minute lightweight generation) tiers, with both Text-to-3D and Image-to-3D entry points, Hunyuan3D is the premier AI 3D toolkit for game developers, e-commerce teams, and 3D content studios. Generations start at $0.02 each.

패밀리 보기

추천 아티클

Atlas Cloud를 최대한 활용할 수 있는 가이드, 튜토리얼, 제품 업데이트.

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.