
Atlas Cloud는 MoonshotAI API를 통해 심층 추론을 위한 K2-Thinking부터 에이전트 코딩을 위한 K2.6까지 전체 Kimi 라인업을 호스팅합니다. 모두 종량제 방식이며, 262K 컨텍스트를 제공합니다.
Atlas Cloud에서 업계 선도 대규모 언어 모델을 빠르고 합리적인 비용으로 제공해 채팅, 추론, 에이전트를 대규모로 구동합니다.
Compare standard vs. our pricing across every Moonshot AI model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Kimi K2.5 | $0.6/$3per 1M tokens262.1K context | $0.49/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Thinking | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct-0905 | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct | $0.6/$2.5per 1M tokens131.1K context | $0.7/$2.5M in/outper 1M tokens131.1K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Kimi의 에이전트 스웜 및 장기 실행 기능을 통해 팀은 인간의 노력으로 며칠이 걸릴 작업을 단일 자동화 세션에서 실행할 수 있습니다. 팀은 M-series를 K2-Thinking과 함께 사용하여 자율적인 코드 변경부터 대규모 다중 문서 연구에 이르기까지 모든 것을 처리합니다.
엔지니어링 팀은 Kimi K2.6을 사용하여 수 시간에 걸친 장기 세션 동안 프로덕션 코드베이스를 자율적으로 개편하는 장기 코딩 에이전트를 실행합니다. 기록된 한 사례에서 K2.6은 13시간에 걸쳐 8년 된 금융 매칭 엔진을 다시 작성했으며, 커밋 사이에 사람의 개입 없이 처리량을 185% 향상시켰습니다. Atlas Cloud의 종량제 요금제를 사용하면 용량 약정 없이 이러한 확장된 에이전트 세션을 실행하는 것이 실용적입니다.
운영 팀은 Kimi K2.6의 300개 에이전트 스웜을 사용하여 대규모 문서 배치를 병렬로 처리합니다. 단일 오케스트레이션 실행으로 이력서 1개를 100개의 직무와 일치시키고 100개의 완전히 맞춤화된 이력서를 결과물로 생성했습니다. 동일한 패턴이 계약 검토, 규정 준수 확인 및 고정된 입력을 크고 가변적인 대상 세트에 대해 평가해야 하는 모든 워크플로에 적용됩니다.
연구 및 법무 팀은 장시간의 내부 추론이 필요한 다단계 분석 문제에 Kimi K2-Thinking을 사용합니다. 이 모델은 세션당 최대 200~300회의 순차적 도구 호출을 지원하며, 단계 사이에 사람의 프롬프트 없이 '추론-호출-추론' 주기를 반복합니다. Atlas Cloud에서의 가격은 입력 토큰 백만 개당 0.6달러이며, 다른 Kimi 라인업과 262K 컨텍스트 창을 공유합니다.
학술 및 콘텐츠 팀은 Kimi K2.6을 사용하여 원본 문서를 완전한 연구 결과물로 변환합니다. 시연 실행에서 K2.6은 단일 세션 만에 천체물리학 논문을 40페이지 분량의 연구 논문, 20,000개 이상의 항목이 있는 구조화된 데이터 세트, 14개의 천문학 수준 차트로 변환했습니다. 이를 통해 문헌에서 결과물까지의 워크플로우 소요 시간을 수주에서 수 시간으로 단축할 수 있습니다.
성장 및 영업 팀은 Kimi K2.6 스웜(swarms)을 사용하여 잠재 고객을 식별하고 아웃리치 자산을 병렬로 생성합니다. 한 실행 예에서는 타겟 도시에서 웹사이트가 없는 30개의 소매점을 식별하고 각각에 대한 랜딩 페이지를 생성했습니다. 동일한 패턴이 리드 인리치먼트, 경쟁 구도 매핑, 그리고 리스트 규모에서 발견 및 콘텐츠 생성을 결합하는 모든 작업에 적용됩니다.
제품 및 데이터 팀은 Kimi K2.5 및 K2.6의 기본 비전 기능을 사용하여 동일한 API 호출에서 텍스트와 함께 이미지 및 비디오 입력을 처리합니다. MoonViT 인코더는 외부 전처리 없이 다이어그램, 스크린샷, UI 목업 및 문서 스캔을 처리합니다. 이는 시각적 사양을 코드로 직접 변환하거나 이미지가 많은 문서에서 구조화된 데이터를 추출하는 파이프라인에 유용합니다.
Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.
Kimi K2.6은 단일 실행에서 최대 4,000개의 조정된 단계를 실행하는 300개의 하위 에이전트로 확장됩니다. Atlas Cloud의 Kimi K2.5는 최대 100개의 하위 에이전트와 함께 스웜 실행을 지원합니다. 작업은 완전히 자율적인 출력을 위해 병렬의 도메인 특화 하위 작업으로 동적 분해됩니다.
Kimi K2-Thinking은 세션당 최대 200~300회의 순차적 도구 호출과 함께 심층적인 생각의 사슬(Chain-of-Thought) 추론을 사용합니다. 모델은 추론하고, 도구를 호출하고, 결과를 해석하고, 다른 도구를 호출하며, 사람의 개입 없이 이 루프를 계속합니다. 다단계 논리적 추론, 복잡한 수학, 그리고 확장된 내부 추론이 정확도를 향상시키는 문제에 적합합니다.
네. Kimi K2.5 및 K2.6에는 이미지와 비디오를 기본적으로 처리하는 4억 개 매개변수의 비전 인코더인 MoonViT가 포함되어 있습니다. 외부 전처리 없이 텍스트와 함께 API 호출에서 직접 이미지 또는 비디오 입력을 전달할 수 있습니다. 이는 시각적 분석, 문서 이해 및 이미지 대 코드 생성 워크플로를 지원합니다.
네. Kimi K2.6은 상업적 사용을 허용하는 수정된 MIT 라이선스로 배포됩니다. 자체 호스팅 배포를 위한 오픈 가중치는 HuggingFace에서 사용할 수 있습니다. 인프라 오버헤드 없이 관리형 액세스를 선호하는 팀을 위해 Atlas Cloud에서도 API를 통해 K2.6을 제공합니다.
Kimi K2.6은 SWE-Bench Verified에서 80.2%, 도구를 사용한 Humanity's Last Exam에서 54.0%의 점수를 기록하며 두 벤치마크 모두에서 GPT-5.5를 능가했습니다. 또한 BrowseComp에서도 83.2%로 GPT-5.4를 넘어 선두를 달리고 있습니다. 이러한 결과는 백만 토큰당 비용이 GPT-5.5보다 약 80% 낮은 수준에서 달성되었습니다.
Atlas Cloud에서 Kimi K2.5의 가격은 100만 입력 토큰당 0.49달러, 100만 출력 토큰당 2.5달러입니다. Kimi K2-Thinking 및 K2-Instruct-0905는 100만 입력 토큰당 0.6달러로 실행되며 출력 요금은 동일합니다. 현재의 구체적인 가격 정보는 Atlas Cloud의 Kimi K2.6 모델 페이지를 확인하십시오.
Atlas Cloud를 최대한 활용할 수 있는 가이드, 튜토리얼, 제품 업데이트.
Join the Discord community for the latest model updates, prompts, and support.