
Atlas Cloud는 Z-AI API를 통해 GLM-4.6에서 GLM-5.1에 이르는 전체 GLM 시리즈를 호스팅합니다. 모든 모델은 이중 언어를 지원하며, 202K의 컨텍스트 윈도우와 함께 종량제로 이용할 수 있습니다.
Atlas Cloud에서 업계 선도 대규모 언어 모델을 빠르고 합리적인 비용으로 제공해 채팅, 추론, 에이전트를 대규모로 구동합니다.
Compare standard vs. our pricing across every Z.ai model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| GLM 5.1 | $1.4/$4.4per 1M tokens202.8K context | $1.26/$3.96M in/outper 1M tokens202.8K context | -10% | View |
| GLM 5 Turbo | $1.2/$4per 1M tokens262.1K context | $1.2/$4M in/outper 1M tokens262.1K context | — | View |
| GLM 5 | $1/$3.2per 1M tokens202.8K context | $0.95/$3.15M in/outper 1M tokens202.8K context | — | View |
| GLM 4.7 | $0.6/$2.2per 1M tokens202.8K context | $0.52/$1.85M in/outper 1M tokens202.8K context | — | View |
| GLM 4.6 | $0.6/$2.2per 1M tokens202.8K context | $0.6/$2.2M in/outper 1M tokens202.8K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
GLM의 모델 계층은 빠른 이중 언어 채팅 작업부터 몇 시간에 걸친 자율 코딩 에이전트에 이르기까지 모든 것을 포괄합니다. 팀들은 장기적인 엔지니어링 작업에 GLM-5.1을 사용하며, 비용 효율성과 속도가 우선시되는 곳에서는 GLM-4.7 또는 GLM-5 Turbo를 사용합니다.
Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.
개발 팀은 GLM-5.1을 사용하여 사람의 검토 지점 없이 몇 시간에 걸친 전체 코드베이스 변환을 실행합니다. 이 모델은 최대 8시간 동안 지속적으로 변경 사항을 계획, 작성, 테스트 및 반복하며, 시연된 처음부터 구축하는 Linux 시스템 빌드에서 655번의 반복을 처리했습니다. 이는 대규모 레거시 코드베이스에서 몇 주 동안 수작업으로 진행되던 리팩토링 작업을 대체합니다.
개발자 도구 팀은 Claude Code, Kilo Code, Cline, Roo Code 및 OpenCode의 AI 코딩 워크플로를 위한 기본 모델로 GLM-5.1 및 GLM-5 Turbo를 통합합니다. Atlas Cloud의 Z-AI API는 OpenAI와 호환되므로, 이러한 도구 중 하나를 GLM을 통해 라우팅하는 데 필요한 변경 사항은 base URL 교체뿐입니다. GLM-5 Turbo의 262K 컨텍스트 창은 IDE 워크플로의 대용량 파일 컨텍스트에 특히 적합합니다.
운영 팀은 GLM-5를 사용하여 티켓 데이터베이스 액세스, 지식 기반 검색 및 에스컬레이션 도구를 결합하여 사람의 개입 없이 반복적인 쿼리를 처리하는 지원 에이전트를 구축합니다. 모델의 다중 도구 호출 및 스트리밍 지원은 실시간 고객 대면 배포에 실용적입니다. 이중 언어 지원을 통해 동일한 에이전트가 Atlas Cloud의 단일 모델 엔드포인트에서 중국어 및 영어 티켓을 처리할 수 있습니다.
콘텐츠 및 비즈니스 팀은 구조화된 프롬프트를 사용하여 중국어와 영어로 된 Word 문서, PowerPoint 프레젠테이션, PDF 및 Excel 보고서를 생성하기 위해 GLM-4.7을 사용합니다. 100만 입력 토큰당 0.52달러인 이 모델은 최첨단 수준의 추론이 필요하지 않은 대용량 문서 워크플로우에 가장 비용 효율적인 GLM 티어입니다. 202K의 컨텍스트 창은 단일 호출로 전체 문서 개요와 원본 자료를 유지하기에 충분합니다.
AI 인프라 팀은 GLM-5.1을 사용하여 기계 학습 워크로드에서 벤치마크 기반 최적화 파이프라인을 실행합니다. KernelBench 스타일의 작업에서 GLM-5.1은 수천 번의 도구 기반 최적화 주기를 수행하여 3.6배의 기하 평균 속도 향상을 달성합니다. 8시간 연속 실행 기능은 에이전트가 세션 간에 수동으로 재시작할 필요 없이 전체 최적화 루프를 실행함을 의미합니다.
Z-AI(Z.ai로도 표기)는 ZhipuAI로도 알려진 대규모 언어 모델인 GLM 시리즈의 개발사입니다. GLM은 일반 언어 모델(General Language Model)의 약자로, GLM-4.6부터 현재의 플래그십 모델인 GLM-5.1까지 아우르는 제품군입니다. 이 시리즈는 코딩, 에이전트 워크플로우 및 중-영 이중 언어 프로덕션 환경에서의 사용을 위해 구축되었습니다.
GLM-5.1은 2026년 4월 7일 SWE-Bench Pro에서 58.4점을 기록하며 GPT-5.4(57.7점)와 Claude Opus 4.6(57.3점)을 제치고 1위를 차지했습니다. 또한 CyberGym에서도 68.7점으로 선두를 달리고 있습니다. 이로써 2026년 2분기 기준 프로덕션 코딩을 위한 최고 순위의 오픈 소스 모델이 되었습니다.
네. GLM-5.1은 사람의 개입 없이 단일 작업에 대해 최대 8시간 동안 지속적인 자율 실행을 지원합니다. 이 모델은 계획, 실행, 반복적 최적화 및 제공의 전체 루프를 처리합니다. 이는 Claude Code 및 OpenClaw 호환 설정과 같은 환경에서 장기 코딩 에이전트 워크플로우를 위해 특별히 설계되었습니다.
GLM-5는 7,440억 개의 파라미터를 가진 MoE 아키텍처를 기반으로 구축된 기반 모델로, 28.5조 개의 토큰으로 훈련되었으며, 오픈소스 모델을 대상으로 한 Chatbot Arena에서 Elo 순위 1위를 차지했습니다. GLM-5.1은 동일한 기반 모델의 훈련 후 업그레이드 버전으로, 코딩, 도구 사용 및 자율 실행 능력이 크게 강화되었습니다. Atlas Cloud에서 GLM-5의 가격은 입력 토큰 100만 개당 0.95달러이며, GLM-5.1은 입력 토큰 100만 개당 1.26달러입니다.
네. GLM-5.1은 MIT 라이선스로 배포되며, 상업적 사용, 파인튜닝 및 재배포를 제한 없이 허용합니다. 오픈 가중치는 셀프 호스팅 배포를 위해 제공됩니다. 인프라 오버헤드 없이 관리형 액세스를 선호하는 팀을 위해 Atlas Cloud는 API를 통해 GLM-5.1을 제공합니다.
GLM-4.6, GLM-4.7, GLM-5 및 GLM-5.1은 모두 Atlas Cloud에서 202,750 토큰의 컨텍스트 윈도우를 지원합니다. GLM-5 Turbo는 예외적으로 262,144 토큰의 더 큰 컨텍스트 윈도우와 131,072 토큰의 최대 출력 길이를 갖습니다. GLM-5.1은 컨텍스트 제한 내에서 긴 코드 파일 및 확장된 실행 추적을 생성하는 데 적합합니다.
네. 모든 GLM 모델은 중국어와 영어에 최적화되어 있으며 두 언어 모두에서 동일한 능숙도를 제공합니다. 두 언어 중 하나로 프롬프트를 작성하여 일관된 품질의 결과물을 얻을 수 있습니다. 이로 인해 GLM은 단일 모델로 중국 및 국제 시장에 모두 서비스하는 제품을 개발하는 팀에게 실용적입니다.
GLM-4.7은 100만 입력 토큰당 0.52달러부터 시작하며 가장 비용 효율적인 티어입니다. 100만 입력 토큰당 GLM-4.6은 0.60달러, GLM-5는 0.95달러, GLM-5 Turbo는 1.20달러입니다. 플래그십 모델인 GLM-5.1은 100만 입력 토큰당 1.26달러, 100만 출력 토큰당 3.96달러입니다. 모든 모델은 월정액 약정 없이 사용한 만큼 지불하는 종량제(pay-as-you-go) 방식입니다.
Atlas Cloud를 최대한 활용할 수 있는 가이드, 튜토리얼, 제품 업데이트.
Join the Discord community for the latest model updates, prompts, and support.