Moonshot AI Models on AtlasCloud | Kimi

Atlas Cloud는 MoonshotAI API를 통해 심층 추론을 위한 K2-Thinking부터 에이전트 코딩을 위한 K2.6까지 전체 Kimi 라인업을 호스팅합니다. 모두 종량제 방식이며, 262K 컨텍스트를 제공합니다.

Large Language Models by Moonshot AI

Atlas Cloud에서 업계 선도 대규모 언어 모델을 빠르고 합리적인 비용으로 제공해 채팅, 추론, 에이전트를 대규모로 구동합니다.

모든 모델 보기

LLM

Kimi

Kimi API는 네이티브 멀티모달 K2.5부터 코딩에 특화된 K2.7 Code까지 아우르는 Moonshot AI의 오픈 웨이트 K2 라인입니다. 비전 기능이 모델에 내장되어 있어 스크린샷, UI 목업, 짧은 동영상을 동작하는 프론트엔드 코드로 변환하고, 최대 100개의 병렬 하위 에이전트를 조율하며, 256K 토큰 컨텍스트 전반에서 추론할 수 있습니다. Atlas Cloud는 투명한 사용량 기반 요금제로 하나의 통합 endpoint를 통해 전체 제품군을 제공합니다. 지금 바로 빌드를 시작하세요.

모델 4개Kimi 탐색

Moonshot AI Models API Pricing Details

Compare standard vs. our pricing across every Moonshot AI model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Kimi K3	$3/$15per 1M tokens1048.6K context	$3/$15M in/outper 1M tokens1048.6K context	—	View
Kimi K2.7 Code	$0.95/$4per 1M tokens262.1K context	$0.95/$4M in/outper 1M tokens262.1K context	—	View
Kimi K2.6	$0.95/$4per 1M tokens262.1K context	$0.95/$4M in/outper 1M tokens262.1K context	—	View
Kimi K2.5	$0.6/$3per 1M tokens262.1K context	$0.49/$2.5M in/outper 1M tokens262.1K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Atlas Cloud에서 구축할 수 있는 Moonshot AI API 사용 사례

Kimi의 에이전트 스웜 및 장기 실행 기능을 통해 팀은 인간의 노력으로 며칠이 걸릴 작업을 단일 자동화 세션에서 실행할 수 있습니다. 팀은 M-series를 K2-Thinking과 함께 사용하여 자율적인 코드 변경부터 대규모 다중 문서 연구에 이르기까지 모든 것을 처리합니다.

레거시 코드베이스 현대화

엔지니어링 팀은 Kimi K2.6을 사용하여 수 시간에 걸친 장기 세션 동안 프로덕션 코드베이스를 자율적으로 개편하는 장기 코딩 에이전트를 실행합니다. 기록된 한 사례에서 K2.6은 13시간에 걸쳐 8년 된 금융 매칭 엔진을 다시 작성했으며, 커밋 사이에 사람의 개입 없이 처리량을 185% 향상시켰습니다. Atlas Cloud의 종량제 요금제를 사용하면 용량 약정 없이 이러한 확장된 에이전트 세션을 실행하는 것이 실용적입니다.

병렬 문서 일괄 처리

운영 팀은 Kimi K2.6의 300개 에이전트 스웜을 사용하여 대규모 문서 배치를 병렬로 처리합니다. 단일 오케스트레이션 실행으로 이력서 1개를 100개의 직무와 일치시키고 100개의 완전히 맞춤화된 이력서를 결과물로 생성했습니다. 동일한 패턴이 계약 검토, 규정 준수 확인 및 고정된 입력을 크고 가변적인 대상 세트에 대해 평가해야 하는 모든 워크플로에 적용됩니다.

복잡한 분석을 위한 심층 추론

연구 및 법무 팀은 장시간의 내부 추론이 필요한 다단계 분석 문제에 Kimi K2-Thinking을 사용합니다. 이 모델은 세션당 최대 200~300회의 순차적 도구 호출을 지원하며, 단계 사이에 사람의 프롬프트 없이 '추론-호출-추론' 주기를 반복합니다. Atlas Cloud에서의 가격은 입력 토큰 백만 개당 0.6달러이며, 다른 Kimi 라인업과 262K 컨텍스트 창을 공유합니다.

자동화된 연구 논문 생성

학술 및 콘텐츠 팀은 Kimi K2.6을 사용하여 원본 문서를 완전한 연구 결과물로 변환합니다. 시연 실행에서 K2.6은 단일 세션 만에 천체물리학 논문을 40페이지 분량의 연구 논문, 20,000개 이상의 항목이 있는 구조화된 데이터 세트, 14개의 천문학 수준 차트로 변환했습니다. 이를 통해 문헌에서 결과물까지의 워크플로우 소요 시간을 수주에서 수 시간으로 단축할 수 있습니다.

대규모 잠재 고객 발굴

성장 및 영업 팀은 Kimi K2.6 스웜(swarms)을 사용하여 잠재 고객을 식별하고 아웃리치 자산을 병렬로 생성합니다. 한 실행 예에서는 타겟 도시에서 웹사이트가 없는 30개의 소매점을 식별하고 각각에 대한 랜딩 페이지를 생성했습니다. 동일한 패턴이 리드 인리치먼트, 경쟁 구도 매핑, 그리고 리스트 규모에서 발견 및 콘텐츠 생성을 결합하는 모든 작업에 적용됩니다.

시각적 문서 및 코드 분석

제품 및 데이터 팀은 Kimi K2.5 및 K2.6의 기본 비전 기능을 사용하여 동일한 API 호출에서 텍스트와 함께 이미지 및 비디오 입력을 처리합니다. MoonViT 인코더는 외부 전처리 없이 다이어그램, 스크린샷, UI 목업 및 문서 스캔을 처리합니다. 이는 시각적 사양을 코드로 직접 변환하거나 이미지가 많은 문서에서 구조화된 데이터를 추출하는 파이프라인에 유용합니다.

Atlas Cloud AI로 기업의 비전을 현실로 구현하세요.

영업팀 문의

Moonshot AI 모델에 대한 자주 묻는 질문

Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.

Kimi K2.6은 단일 실행에서 최대 4,000개의 조정된 단계를 실행하는 300개의 하위 에이전트로 확장됩니다. Atlas Cloud의 Kimi K2.5는 최대 100개의 하위 에이전트와 함께 스웜 실행을 지원합니다. 작업은 완전히 자율적인 출력을 위해 병렬의 도메인 특화 하위 작업으로 동적 분해됩니다.

Kimi K2-Thinking은 세션당 최대 200~300회의 순차적 도구 호출과 함께 심층적인 생각의 사슬(Chain-of-Thought) 추론을 사용합니다. 모델은 추론하고, 도구를 호출하고, 결과를 해석하고, 다른 도구를 호출하며, 사람의 개입 없이 이 루프를 계속합니다. 다단계 논리적 추론, 복잡한 수학, 그리고 확장된 내부 추론이 정확도를 향상시키는 문제에 적합합니다.

네. Kimi K2.5 및 K2.6에는 이미지와 비디오를 기본적으로 처리하는 4억 개 매개변수의 비전 인코더인 MoonViT가 포함되어 있습니다. 외부 전처리 없이 텍스트와 함께 API 호출에서 직접 이미지 또는 비디오 입력을 전달할 수 있습니다. 이는 시각적 분석, 문서 이해 및 이미지 대 코드 생성 워크플로를 지원합니다.

네. Kimi K2.6은 상업적 사용을 허용하는 수정된 MIT 라이선스로 배포됩니다. 자체 호스팅 배포를 위한 오픈 가중치는 HuggingFace에서 사용할 수 있습니다. 인프라 오버헤드 없이 관리형 액세스를 선호하는 팀을 위해 Atlas Cloud에서도 API를 통해 K2.6을 제공합니다.

Kimi K2.6은 SWE-Bench Verified에서 80.2%, 도구를 사용한 Humanity's Last Exam에서 54.0%의 점수를 기록하며 두 벤치마크 모두에서 GPT-5.5를 능가했습니다. 또한 BrowseComp에서도 83.2%로 GPT-5.4를 넘어 선두를 달리고 있습니다. 이러한 결과는 백만 토큰당 비용이 GPT-5.5보다 약 80% 낮은 수준에서 달성되었습니다.

Atlas Cloud에서 Kimi K2.5의 가격은 100만 입력 토큰당 0.49달러, 100만 출력 토큰당 2.5달러입니다. Kimi K2-Thinking 및 K2-Instruct-0905는 100만 입력 토큰당 0.6달러로 실행되며 출력 요금은 동일합니다. 현재의 구체적인 가격 정보는 Atlas Cloud의 Kimi K2.6 모델 페이지를 확인하십시오.

더 많은 패밀리 탐색

Seedance 2.0

Seedance 2.0 API는 쿼드 모달 입력(텍스트, 이미지, 비디오, 오디오) 및 샷 간의 구도, 카메라 움직임, 캐릭터 액션을 고정하는 업계 최고의 "Universal Reference" 시스템을 갖춘 ByteDance의 멀티모달 비디오 모델에 대한 프로덕션 액세스를 제공합니다. 단 한 번의 API 호출로 디렉터급 제어를 통합하고, 초당 $0.09의 고정 요금, 즉각적인 키 발급 및 대기자 명단 없이 이용할 수 있으며, 엔터프라이즈급 가동 시간과 규정 준수를 보장합니다. Seedance 2.0 Native 4K가 이제 출시되었습니다!

패밀리 보기

Grok Imagine

Grok Imagine API는 개발자에게 xAI의 이미지, 비디오 및 오디오 생성 기능을 단일 제품군으로 제공합니다. 다국어 텍스트 렌더링이 포함된 최대 2K 해상도의 이미지를 생성하며, 기본 동기화된 오디오 및 참조 기반 편집 기능이 포함된 최대 15초 길이의 비디오를 생성합니다. Atlas Cloud에서는 단일 키로 모든 Grok Imagine 모드를 실행할 수 있으므로 별도의 설정 없이 이미지, 비디오, 오디오 간에 이동할 수 있으며, 요금은 이미지당 $0.02, 초당 $0.05부터 시작합니다.

패밀리 보기

Gemini Omni Flash

Gemini Omni API는 Google I/O 2026에서 공개된 Google DeepMind의 멀티모달 비디오 생성·편집 모델을 여러분의 스택으로 가져옵니다. Gemini Omni는 Gemini의 추론 엔진과 생성형 미디어를 결합해 텍스트, 이미지, 비디오, 오디오를 자유롭게 조합한 입력을 받아 일관되고 지식에 기반한 결과물을 만들어 냅니다. 자연스러운 대화로 결과를 다듬어 보세요. 물리 법칙과 캐릭터, 연속성은 그대로 유지한 채 오브젝트를 교체하고 장면을 다시 쓰고 스타일을 바꿀 수 있습니다. Atlas Cloud는 텍스트-투-비디오, 최대 7장의 참조 이미지를 지원하는 이미지-투-비디오, 참조-투-비디오까지 Gemini Omni Flash 전체 라인업을 하나의 통합 API로 제공하며, $0.112부터 시작하는 투명한 초당 과금에 구독도 필요 없습니다. 지금 바로 개발을 시작하세요.

패밀리 보기

GPT Image 2

GPT Image 2 API는 개발자들에게 GPT Image 1.5의 후속 모델인 OpenAI의 최신 이미지 모델에 대한 액세스를 제공합니다. 이 모델은 라틴 및 CJK 스크립트 전반에 걸쳐 정확한 텍스트 렌더링으로 이미지를 생성 및 편집하며, 포스터, 목업, 인포그래픽을 위한 강력한 구도를 지원합니다. Atlas Cloud에서는 300개 이상의 모델과 함께 하나의 통합된 API를 통해 이에 접근할 수 있으며, 무료 크레딧, 99.99%의 가동 시간을 제공하고 OpenAI 조직 인증이 필요하지 않습니다.

패밀리 보기

Google

Google의 가장 강력한 크리에이티브 모델은 모두 Atlas Cloud에서 사용할 수 있습니다. Veo 3.1은 영화 수준의 비디오 생성을 제공하고, Nano Banana 2는 고충실도 이미지 생성을 지원하며, Gemini는 모든 워크플로우에 멀티모달 인텔리전스를 제공합니다. Day-0 가용성과 종량제(pay-as-you-go) 요금제로 단일 API key를 통해 전체 Google 모델 제품군에 액세스하세요.

패밀리 보기

Seedance 2.0 Mini

Seedance 2.0 Mini는 속도와 비용이 가장 중요한 워크플로우에 ByteDance의 멀티모달 비디오 생성 기능을 제공합니다. 더 빠른 생성, 비디오당 더 낮은 비용, 그리고 이미 사용 중인 것과 동일한 API 통합 등 더 가벼운 풋프린트로 Seedance 2.0의 핵심 기능을 제공합니다. 대규모 파이프라인을 운영하거나 대규모 프로토타이핑을 수행하는 팀에게 Mini는 실용적인 기본 선택입니다.

패밀리 보기

ByteDance

시네마틱 비디오 생성부터 고해상도 이미지 제작까지, ByteDance의 가장 강력한 모델들이 현재 Atlas Cloud에 라이브로 제공됩니다. 가장 낮은 추론 가격과 인프라 오버헤드 없이 대규모로 Seedance와 Seedream을 실행해 보세요.

패밀리 보기

Alibaba

Atlas Cloud는 Alibaba의 전체 모델 라인업을 단일 API로 통합합니다. 언어 및 이미지 작업을 위한 Qwen, 최대 1080p 비디오 생성을 위한 Wan을 제공합니다. 구독 없이 사용한 만큼만 지불하는(pay-as-you-go) 방식으로 모든 모델에 액세스하세요. Alibaba API는 기존의 OpenAI 호환 클라이언트를 사용하여 단일 기본 URL(base URL)을 통해 사용할 수 있습니다.

패밀리 보기

OpenAI

Atlas Cloud는 이미지 생성을 위한 GPT Image 2부터 비디오를 위한 Sora 2까지 전체 OpenAI API 라인업에 대한 액세스를 제공합니다. 모든 모델은 월간 약정 없이 종량제로 이용할 수 있습니다. OpenAI 호환 API를 사용하여 기본 URL 하나만 변경하면 쉽게 연동할 수 있습니다.

패밀리 보기

xAI

Atlas Cloud에서 xAI API를 사용하여 완벽한 이미지 및 비디오 파이프라인을 구축하십시오. 2K 해상도로 생성하고, 참조 이미지로 편집하며, 이미지를 오디오와 동기화된 클립으로 애니메이션화할 수 있습니다.

패밀리 보기

Kwaivgi

표준 가격보다 15% 저렴한 Kwaivgi API. Atlas Cloud는 종량제 요금과 사용자 수 제한 없이 새로운 Kling 릴리스에 대한 Day-0 액세스를 제공합니다. 단일 계정, 단일 키로 표준에서 마스터 티어에 이르는 모든 Kling 모델을 이용하세요.

패밀리 보기

Seedream 5.0 Pro

Seedream 5.0 Pro API는 개발자에게 Atlas Cloud에서 ByteDance의 제어 가능한 이미지 편집 모델을 제공합니다. 앵커와 좌표로 편집을 정확하게 배치하고, 이미지를 편집 가능한 레이어로 분리하고, 여러 참조를 융합하며, 정확한 색상과 재질을 일치시키고, 2K 및 3K에서 다국어 텍스트를 지원합니다. Atlas Cloud에서는 단일 키로 액세스할 수 있습니다!

패밀리 보기