Z.ai API for Top Open-Source GLM Coding

Z.ai API는 GLM-4.6부터 플래그십 GLM-5.1까지 ZhipuAI의 전체 GLM 시리즈를 여러분의 스택에 제공합니다. GLM-5.1은 SWE-Bench Pro에서 오픈소스 모델 중 1위를 기록했으며, 자율 코딩 에이전트를 한 번에 몇 시간씩 실행합니다. GLM은 202K 토큰 컨텍스트와 균형 잡힌 중국어 및 영어 출력을 permissive MIT 라이선스로 제공합니다. Atlas Cloud는 하나의 OpenAI 호환 키로 각 모델을 제공하며, Day-0 액세스와 투명한 호출당 요금제를 지원합니다. 지금 시작하세요.

Large Language Models by Z.ai

Atlas Cloud에서 업계 선도 대규모 언어 모델을 빠르고 합리적인 비용으로 제공해 채팅, 추론, 에이전트를 대규모로 구동합니다.

모든 모델 보기

LLM

GLM

GLM은 Zhipu AI가 제공하는 Z.ai의 플래그십 LLM 시리즈이며, GLM API는 에이전트형 GLM-5부터 효율적인 357B MoE GLM-4.6까지 폭넓게 지원합니다. 이 모델들은 자율적인 작업 실행, 복잡한 에이전트 오케스트레이션, 프로덕션급 프로그래밍에 특화되어 있습니다. Atlas Cloud에서는 단일 통합 엔드포인트를 통해 사용량 기반 요금제와 안정적인 프로덕션 가동 시간으로 전체 GLM 제품군을 Day-0부터 이용할 수 있습니다. 지금 바로 구축을 시작하세요.

모델 6개GLM 탐색

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

Model	Standard Price (USD)	Our Price (USD)	Discount
GLM 5.2	$1.4/$4.4per 1M tokens1048.6K context	$1.26/$3.96M in/outper 1M tokens1048.6K context	-10%	View
GLM 5.1	$1.4/$4.4per 1M tokens202.8K context	$1.26/$3.96M in/outper 1M tokens202.8K context	-10%	View
GLM 5v Turbo	$1.2/$4per 1M tokens202.8K context	$1.2/$4M in/outper 1M tokens202.8K context	—	View
GLM 5	$1/$3.2per 1M tokens202.8K context	$0.95/$3.15M in/outper 1M tokens202.8K context	—	View
GLM 4.7	$0.6/$2.2per 1M tokens202.8K context	$0.52/$1.85M in/outper 1M tokens202.8K context	—	View
GLM 4.6	$0.6/$2.2per 1M tokens202.8K context	$0.6/$2.2M in/outper 1M tokens202.8K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Atlas Cloud에서 구축할 수 있는 Z-AI API 사용 사례

GLM의 모델 계층은 빠른 이중 언어 채팅 작업부터 몇 시간에 걸친 자율 코딩 에이전트에 이르기까지 모든 것을 포괄합니다. 팀들은 장기적인 엔지니어링 작업에 GLM-5.1을 사용하며, 비용 효율성과 속도가 우선시되는 곳에서는 GLM-4.7 또는 GLM-5 Turbo를 사용합니다.

장기 데이터베이스 성능 최적화

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

자율형 저장소 규모 코드 리팩터링

개발 팀은 GLM-5.1을 사용하여 사람의 검토 지점 없이 몇 시간에 걸친 전체 코드베이스 변환을 실행합니다. 이 모델은 최대 8시간 동안 지속적으로 변경 사항을 계획, 작성, 테스트 및 반복하며, 시연된 처음부터 구축하는 Linux 시스템 빌드에서 655번의 반복을 처리했습니다. 이는 대규모 레거시 코드베이스에서 몇 주 동안 수작업으로 진행되던 리팩토링 작업을 대체합니다.

IDE 코딩 에이전트 통합

개발자 도구 팀은 Claude Code, Kilo Code, Cline, Roo Code 및 OpenCode의 AI 코딩 워크플로를 위한 기본 모델로 GLM-5.1 및 GLM-5 Turbo를 통합합니다. Atlas Cloud의 Z-AI API는 OpenAI와 호환되므로, 이러한 도구 중 하나를 GLM을 통해 라우팅하는 데 필요한 변경 사항은 base URL 교체뿐입니다. GLM-5 Turbo의 262K 컨텍스트 창은 IDE 워크플로의 대용량 파일 컨텍스트에 특히 적합합니다.

Tier-1 지원 문의 자동화

운영 팀은 GLM-5를 사용하여 티켓 데이터베이스 액세스, 지식 기반 검색 및 에스컬레이션 도구를 결합하여 사람의 개입 없이 반복적인 쿼리를 처리하는 지원 에이전트를 구축합니다. 모델의 다중 도구 호출 및 스트리밍 지원은 실시간 고객 대면 배포에 실용적입니다. 이중 언어 지원을 통해 동일한 에이전트가 Atlas Cloud의 단일 모델 엔드포인트에서 중국어 및 영어 티켓을 처리할 수 있습니다.

대규모 이중 언어 문서 생성

콘텐츠 및 비즈니스 팀은 구조화된 프롬프트를 사용하여 중국어와 영어로 된 Word 문서, PowerPoint 프레젠테이션, PDF 및 Excel 보고서를 생성하기 위해 GLM-4.7을 사용합니다. 100만 입력 토큰당 0.52달러인 이 모델은 최첨단 수준의 추론이 필요하지 않은 대용량 문서 워크플로우에 가장 비용 효율적인 GLM 티어입니다. 202K의 컨텍스트 창은 단일 호출로 전체 문서 개요와 원본 자료를 유지하기에 충분합니다.

ML 워크로드 커널 최적화

AI 인프라 팀은 GLM-5.1을 사용하여 기계 학습 워크로드에서 벤치마크 기반 최적화 파이프라인을 실행합니다. KernelBench 스타일의 작업에서 GLM-5.1은 수천 번의 도구 기반 최적화 주기를 수행하여 3.6배의 기하 평균 속도 향상을 달성합니다. 8시간 연속 실행 기능은 에이전트가 세션 간에 수동으로 재시작할 필요 없이 전체 최적화 루프를 실행함을 의미합니다.

Atlas Cloud AI로 기업의 비전을 현실로 구현하세요.

영업팀 문의

개발자가 Z.ai API에 대해 자주 묻는 질문

Z.ai API는 개발자가 Z.ai(일명 Zhipu AI)가 구축한 GLM 시리즈 대규모 언어 모델에 프로그래밍 방식으로 접근할 수 있게 해줍니다. GLM은 General Language Model의 약자로, GLM-4.6부터 플래그십 GLM-5.1까지의 릴리스를 아우르며 코딩, 에이전트형 워크플로, 중국어와 영어 이중 언어 프로덕션 사용에 맞게 튜닝되어 있습니다. Atlas Cloud에서는 하나의 OpenAI-compatible endpoint를 통해 전체 라인업에 접근할 수 있습니다.

Atlas Cloud는 GLM-4.6부터 플래그십 GLM-5.1까지의 GLM 시리즈를 제공하며, 그 사이에 GLM-4.7과 GLM-5가 포함됩니다. 더 가벼운 티어는 대량의 일상 작업을 더 낮은 비용으로 처리하고, GLM-5.1은 가장 까다로운 코딩 및 에이전트형 작업을 목표로 합니다. 모든 모델은 동일한 키로 pay-as-you-go 방식으로 실행됩니다.

네. GLM-5.1을 포함한 GLM open weights는 MIT license로 공개되며, 상업적 사용, 파인튜닝, 재배포를 제한 없이 허용합니다. 인프라 운영 부담을 피하고 싶다면, 자체 호스팅 대신 Atlas Cloud에서 API를 통해 동일한 모델을 managed access로 사용할 수 있습니다.

기존 OpenAI SDK가 Atlas Cloud base URL을 바라보도록 설정하고, 키를 지정한 뒤 원하는 GLM 모델 이름을 전달하면 됩니다. Z.ai API는 OpenAI-compatible이므로 대부분의 프로젝트는 base URL과 모델 문자열만 변경해 마이그레이션할 수 있으며, 모델은 Claude Code, Cline, Roo Code 같은 에이전트 도구에 바로 연결됩니다. 지금 바로 구축을 시작하세요.

중국어와 영어 모두 GLM에서 일급으로 지원되며, 각 언어에서 뛰어난 숙련도를 갖도록 학습되었습니다. 어느 언어로 프롬프트를 작성해도 일관된 품질의 결과를 얻을 수 있어, 중국 사용자와 글로벌 사용자를 모두 지원하는 팀이 별도 스택을 유지하지 않고 단일 모델로 운영하기에 적합합니다.

GLM-4.6부터 GLM-5.1까지는 200K token context window를 지원하여, 대규모 코드베이스, 긴 문서, 확장된 에이전트 트레이스를 한 번의 요청에 담을 수 있습니다. 워크플로에서 긴 출력이 생성되더라도 동일한 윈도우가 큰 코드 파일과 다단계 실행 로그를 조기 잘림 없이 처리합니다.

GLM-5.1은 2026년 4월 SWE-Bench Pro에서 58.4점을 기록해 1위를 차지했으며, 실제 코딩 작업을 위한 최상위권 오픈 소스 모델 중 하나로 평가받았습니다. 또한 단일 작업에서 최대 8시간 동안 연속 자율 실행을 지원해, 계획 수립, 반복, 전달을 하나의 루프로 수행할 수 있으므로 Claude Code 같은 환경의 장기 에이전트 워크플로에 적합합니다.

Z.ai API의 모든 GLM 모델은 투명한 pay-as-you-go 가격제로 실행되며, 구독이나 월간 약정 없이 token 단위로 과금됩니다. 입력 token과 출력 token은 별도로 계량되며, GLM-4.7 같은 더 가벼운 티어는 플래그십 GLM-5.1보다 token당 비용이 낮아 예산에 맞춰 모델을 선택할 수 있습니다. 현재 token당 요금은 Atlas Cloud의 각 모델 카드에서 확인하세요.

더 많은 패밀리 탐색

Seedance 2.0

Seedance 2.0 API는 쿼드 모달 입력(텍스트, 이미지, 비디오, 오디오) 및 샷 간의 구도, 카메라 움직임, 캐릭터 액션을 고정하는 업계 최고의 "Universal Reference" 시스템을 갖춘 ByteDance의 멀티모달 비디오 모델에 대한 프로덕션 액세스를 제공합니다. 단 한 번의 API 호출로 디렉터급 제어를 통합하고, 초당 $0.09의 고정 요금, 즉각적인 키 발급 및 대기자 명단 없이 이용할 수 있으며, 엔터프라이즈급 가동 시간과 규정 준수를 보장합니다. Seedance 2.0 Native 4K가 이제 출시되었습니다!

패밀리 보기

GPT Image 2

GPT Image 2 API는 개발자들에게 GPT Image 1.5의 후속 모델인 OpenAI의 최신 이미지 모델에 대한 액세스를 제공합니다. 이 모델은 라틴 및 CJK 스크립트 전반에 걸쳐 정확한 텍스트 렌더링으로 이미지를 생성 및 편집하며, 포스터, 목업, 인포그래픽을 위한 강력한 구도를 지원합니다. Atlas Cloud에서는 300개 이상의 모델과 함께 하나의 통합된 API를 통해 이에 접근할 수 있으며, 무료 크레딧, 99.99%의 가동 시간을 제공하고 OpenAI 조직 인증이 필요하지 않습니다.

패밀리 보기

Seedream 5.0 Pro

Seedream 5.0 Pro API는 개발자에게 Atlas Cloud에서 ByteDance의 제어 가능한 이미지 편집 모델을 제공합니다. 앵커와 좌표로 편집을 정확하게 배치하고, 이미지를 편집 가능한 레이어로 분리하고, 여러 참조를 융합하며, 정확한 색상과 재질을 일치시키고, 2K 및 3K에서 다국어 텍스트를 지원합니다. Atlas Cloud에서는 단일 키로 액세스할 수 있습니다!

패밀리 보기

Gemini Omni Flash

Gemini Omni API는 Google I/O 2026에서 공개된 Google DeepMind의 멀티모달 비디오 생성·편집 모델을 여러분의 스택으로 가져옵니다. Gemini Omni는 Gemini의 추론 엔진과 생성형 미디어를 결합해 텍스트, 이미지, 비디오, 오디오를 자유롭게 조합한 입력을 받아 일관되고 지식에 기반한 결과물을 만들어 냅니다. 자연스러운 대화로 결과를 다듬어 보세요. 물리 법칙과 캐릭터, 연속성은 그대로 유지한 채 오브젝트를 교체하고 장면을 다시 쓰고 스타일을 바꿀 수 있습니다. Atlas Cloud는 텍스트-투-비디오, 최대 7장의 참조 이미지를 지원하는 이미지-투-비디오, 참조-투-비디오까지 Gemini Omni Flash 전체 라인업을 하나의 통합 API로 제공하며, $0.112부터 시작하는 투명한 초당 과금에 구독도 필요 없습니다. 지금 바로 개발을 시작하세요.

패밀리 보기

Grok Imagine

Grok Imagine API는 개발자에게 xAI의 이미지, 비디오 및 오디오 생성 기능을 단일 제품군으로 제공합니다. 다국어 텍스트 렌더링이 포함된 최대 2K 해상도의 이미지를 생성하며, 기본 동기화된 오디오 및 참조 기반 편집 기능이 포함된 최대 15초 길이의 비디오를 생성합니다. Atlas Cloud에서는 단일 키로 모든 Grok Imagine 모드를 실행할 수 있으므로 별도의 설정 없이 이미지, 비디오, 오디오 간에 이동할 수 있으며, 요금은 이미지당 $0.02, 초당 $0.05부터 시작합니다.

패밀리 보기

Google

Google의 가장 강력한 크리에이티브 모델은 모두 Atlas Cloud에서 사용할 수 있습니다. Veo 3.1은 영화 수준의 비디오 생성을 제공하고, Nano Banana 2는 고충실도 이미지 생성을 지원하며, Gemini는 모든 워크플로우에 멀티모달 인텔리전스를 제공합니다. Day-0 가용성과 종량제(pay-as-you-go) 요금제로 단일 API key를 통해 전체 Google 모델 제품군에 액세스하세요.

패밀리 보기

Seedance 2.0 Mini

Seedance 2.0 Mini는 속도와 비용이 가장 중요한 워크플로우에 ByteDance의 멀티모달 비디오 생성 기능을 제공합니다. 더 빠른 생성, 비디오당 더 낮은 비용, 그리고 이미 사용 중인 것과 동일한 API 통합 등 더 가벼운 풋프린트로 Seedance 2.0의 핵심 기능을 제공합니다. 대규모 파이프라인을 운영하거나 대규모 프로토타이핑을 수행하는 팀에게 Mini는 실용적인 기본 선택입니다.

패밀리 보기

ByteDance

시네마틱 비디오 생성부터 고해상도 이미지 제작까지, ByteDance의 가장 강력한 모델들이 현재 Atlas Cloud에 라이브로 제공됩니다. 가장 낮은 추론 가격과 인프라 오버헤드 없이 대규모로 Seedance와 Seedream을 실행해 보세요.

패밀리 보기

Alibaba

Atlas Cloud는 Alibaba의 전체 모델 라인업을 단일 API로 통합합니다. 언어 및 이미지 작업을 위한 Qwen, 최대 1080p 비디오 생성을 위한 Wan을 제공합니다. 구독 없이 사용한 만큼만 지불하는(pay-as-you-go) 방식으로 모든 모델에 액세스하세요. Alibaba API는 기존의 OpenAI 호환 클라이언트를 사용하여 단일 기본 URL(base URL)을 통해 사용할 수 있습니다.

패밀리 보기

OpenAI

Atlas Cloud는 이미지 생성을 위한 GPT Image 2부터 비디오를 위한 Sora 2까지 전체 OpenAI API 라인업에 대한 액세스를 제공합니다. 모든 모델은 월간 약정 없이 종량제로 이용할 수 있습니다. OpenAI 호환 API를 사용하여 기본 URL 하나만 변경하면 쉽게 연동할 수 있습니다.

패밀리 보기