Moonshot AI Models on AtlasCloud | Kimi

Atlas Cloud는 MoonshotAI API를 통해 심층 추론을 위한 K2-Thinking부터 에이전트 코딩을 위한 K2.6까지 전체 Kimi 라인업을 호스팅합니다. 모두 종량제 방식이며, 262K 컨텍스트를 제공합니다.

Large Language Models by Moonshot AI

Atlas Cloud에서 업계 선도 대규모 언어 모델을 빠르고 합리적인 비용으로 제공해 채팅, 추론, 에이전트를 대규모로 구동합니다.

모든 모델 보기

Moonshot AI Models API Pricing Details

Compare standard vs. our pricing across every Moonshot AI model.

ModelStandard Price (USD)Our Price (USD)Discount
Kimi K2.5
$0.6/$3per 1M tokens262.1K context
$0.49/$2.5M in/outper 1M tokens262.1K context
View
Kimi-K2-Thinking
$0.6/$2.5per 1M tokens262.1K context
$0.6/$2.5M in/outper 1M tokens262.1K context
View
Kimi-K2-Instruct-0905
$0.6/$2.5per 1M tokens262.1K context
$0.6/$2.5M in/outper 1M tokens262.1K context
View
Kimi-K2-Instruct
$0.6/$2.5per 1M tokens131.1K context
$0.7/$2.5M in/outper 1M tokens131.1K context
View

Explore models from other providers

Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.

Atlas Cloud에서 구축할 수 있는 Moonshot AI API 사용 사례

Kimi의 에이전트 스웜 및 장기 실행 기능을 통해 팀은 인간의 노력으로 며칠이 걸릴 작업을 단일 자동화 세션에서 실행할 수 있습니다. 팀은 M-series를 K2-Thinking과 함께 사용하여 자율적인 코드 변경부터 대규모 다중 문서 연구에 이르기까지 모든 것을 처리합니다.

레거시 코드베이스 현대화

엔지니어링 팀은 Kimi K2.6을 사용하여 수 시간에 걸친 장기 세션 동안 프로덕션 코드베이스를 자율적으로 개편하는 장기 코딩 에이전트를 실행합니다. 기록된 한 사례에서 K2.6은 13시간에 걸쳐 8년 된 금융 매칭 엔진을 다시 작성했으며, 커밋 사이에 사람의 개입 없이 처리량을 185% 향상시켰습니다. Atlas Cloud의 종량제 요금제를 사용하면 용량 약정 없이 이러한 확장된 에이전트 세션을 실행하는 것이 실용적입니다.

병렬 문서 일괄 처리

운영 팀은 Kimi K2.6의 300개 에이전트 스웜을 사용하여 대규모 문서 배치를 병렬로 처리합니다. 단일 오케스트레이션 실행으로 이력서 1개를 100개의 직무와 일치시키고 100개의 완전히 맞춤화된 이력서를 결과물로 생성했습니다. 동일한 패턴이 계약 검토, 규정 준수 확인 및 고정된 입력을 크고 가변적인 대상 세트에 대해 평가해야 하는 모든 워크플로에 적용됩니다.

복잡한 분석을 위한 심층 추론

연구 및 법무 팀은 장시간의 내부 추론이 필요한 다단계 분석 문제에 Kimi K2-Thinking을 사용합니다. 이 모델은 세션당 최대 200~300회의 순차적 도구 호출을 지원하며, 단계 사이에 사람의 프롬프트 없이 '추론-호출-추론' 주기를 반복합니다. Atlas Cloud에서의 가격은 입력 토큰 백만 개당 0.6달러이며, 다른 Kimi 라인업과 262K 컨텍스트 창을 공유합니다.

자동화된 연구 논문 생성

학술 및 콘텐츠 팀은 Kimi K2.6을 사용하여 원본 문서를 완전한 연구 결과물로 변환합니다. 시연 실행에서 K2.6은 단일 세션 만에 천체물리학 논문을 40페이지 분량의 연구 논문, 20,000개 이상의 항목이 있는 구조화된 데이터 세트, 14개의 천문학 수준 차트로 변환했습니다. 이를 통해 문헌에서 결과물까지의 워크플로우 소요 시간을 수주에서 수 시간으로 단축할 수 있습니다.

대규모 잠재 고객 발굴

성장 및 영업 팀은 Kimi K2.6 스웜(swarms)을 사용하여 잠재 고객을 식별하고 아웃리치 자산을 병렬로 생성합니다. 한 실행 예에서는 타겟 도시에서 웹사이트가 없는 30개의 소매점을 식별하고 각각에 대한 랜딩 페이지를 생성했습니다. 동일한 패턴이 리드 인리치먼트, 경쟁 구도 매핑, 그리고 리스트 규모에서 발견 및 콘텐츠 생성을 결합하는 모든 작업에 적용됩니다.

시각적 문서 및 코드 분석

제품 및 데이터 팀은 Kimi K2.5 및 K2.6의 기본 비전 기능을 사용하여 동일한 API 호출에서 텍스트와 함께 이미지 및 비디오 입력을 처리합니다. MoonViT 인코더는 외부 전처리 없이 다이어그램, 스크린샷, UI 목업 및 문서 스캔을 처리합니다. 이는 시각적 사양을 코드로 직접 변환하거나 이미지가 많은 문서에서 구조화된 데이터를 추출하는 파이프라인에 유용합니다.

Atlas Cloud AI .

영업팀 문의

Moonshot AI 모델에 대한 자주 묻는 질문

Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.

Kimi K2.6은 단일 실행에서 최대 4,000개의 조정된 단계를 실행하는 300개의 하위 에이전트로 확장됩니다. Atlas Cloud의 Kimi K2.5는 최대 100개의 하위 에이전트와 함께 스웜 실행을 지원합니다. 작업은 완전히 자율적인 출력을 위해 병렬의 도메인 특화 하위 작업으로 동적 분해됩니다.

Kimi K2-Thinking은 세션당 최대 200~300회의 순차적 도구 호출과 함께 심층적인 생각의 사슬(Chain-of-Thought) 추론을 사용합니다. 모델은 추론하고, 도구를 호출하고, 결과를 해석하고, 다른 도구를 호출하며, 사람의 개입 없이 이 루프를 계속합니다. 다단계 논리적 추론, 복잡한 수학, 그리고 확장된 내부 추론이 정확도를 향상시키는 문제에 적합합니다.

네. Kimi K2.5 및 K2.6에는 이미지와 비디오를 기본적으로 처리하는 4억 개 매개변수의 비전 인코더인 MoonViT가 포함되어 있습니다. 외부 전처리 없이 텍스트와 함께 API 호출에서 직접 이미지 또는 비디오 입력을 전달할 수 있습니다. 이는 시각적 분석, 문서 이해 및 이미지 대 코드 생성 워크플로를 지원합니다.

네. Kimi K2.6은 상업적 사용을 허용하는 수정된 MIT 라이선스로 배포됩니다. 자체 호스팅 배포를 위한 오픈 가중치는 HuggingFace에서 사용할 수 있습니다. 인프라 오버헤드 없이 관리형 액세스를 선호하는 팀을 위해 Atlas Cloud에서도 API를 통해 K2.6을 제공합니다.

Kimi K2.6은 SWE-Bench Verified에서 80.2%, 도구를 사용한 Humanity's Last Exam에서 54.0%의 점수를 기록하며 두 벤치마크 모두에서 GPT-5.5를 능가했습니다. 또한 BrowseComp에서도 83.2%로 GPT-5.4를 넘어 선두를 달리고 있습니다. 이러한 결과는 백만 토큰당 비용이 GPT-5.5보다 약 80% 낮은 수준에서 달성되었습니다.

Atlas Cloud에서 Kimi K2.5의 가격은 100만 입력 토큰당 0.49달러, 100만 출력 토큰당 2.5달러입니다. Kimi K2-Thinking 및 K2-Instruct-0905는 100만 입력 토큰당 0.6달러로 실행되며 출력 요금은 동일합니다. 현재의 구체적인 가격 정보는 Atlas Cloud의 Kimi K2.6 모델 페이지를 확인하십시오.

더 많은 패밀리 탐색

Seedance 2.0 Models

Seedance 2.0(by Bytedance) is a multimodal video generation model that redefines "controllable creation," moving beyond the limitations of text or start/end frames. It supports quad-modal inputs—text, image, video, and audio—and introduces an industry-leading "Universal Reference" system. By precisely replicating the composition, camera movement, and character actions from reference assets, Seedance 2.0 solves critical issues with character consistency and physical coherence, empowering creators to act as true "directors" with deep control over their output.

패밀리 보기

Grok-Imagine Models

Grok Imagine Image Quality is xAI's latest AI image generation model, delivering studio-grade visuals with up to 2K resolution and razor-sharp detail. It offers best-in-class text rendering across multiple languages, photorealistic outputs with natural lighting, rich textures, and believable physics, plus tighter prompt following and image editing with reference inputs for precise creative control. Ideal for hero images, ad creatives, product renders, and brand-grade visuals.

패밀리 보기

Gemini Omni

Gemini Omni (by Google DeepMind) is a video generation and editing model launched on May 20, 2026 at Google I/O that redefines the standard for "reasoning-driven creation," built specifically to solve the core challenge of AI video: making output that actually understands what you mean, not just what you type. It fuses Gemini's reasoning engine with generative capability, accepting any mix of images, text, video, and audio to produce consistent, knowledge-grounded output. Unlike models that start from scratch each time, Omni lets you edit through natural conversation — swapping objects, rewriting scenes, shifting styles — while keeping physics, characters, and continuity intact across every turn.

패밀리 보기

GPT Image 2 Models

GPT Image 2 is a state-of-the-art multimodal foundation model engineered for exceptional text-to-image generation with unprecedented photorealism and creative versatility. Developed by OpenAI as the evolution of the DALL-E lineage, it transforms detailed natural language descriptions into hyper-realistic imagery at up to 4K resolution. With proprietary "Neural Rendering Engine" technology for precise visual control, GPT Image 2 delivers studio-quality results with accurate anatomy, lighting, and composition—making it the premier AI tool for professional creators, enterprises, and developers demanding production-ready visual assets.

패밀리 보기

Google Models on Atlas Cloud | Gemini, Nano Bananas & Veo

Google의 가장 강력한 크리에이티브 모델은 모두 Atlas Cloud에서 사용할 수 있습니다. Veo 3.1은 영화 수준의 비디오 생성을 제공하고, Nano Banana 2는 고충실도 이미지 생성을 지원하며, Gemini는 모든 워크플로우에 멀티모달 인텔리전스를 제공합니다. Day-0 가용성과 종량제(pay-as-you-go) 요금제로 단일 API key를 통해 전체 Google 모델 제품군에 액세스하세요.

패밀리 보기

ByteDance Models on Atlas Cloud | Seedance & Seedream

시네마틱 비디오 생성부터 고해상도 이미지 제작까지, ByteDance의 가장 강력한 모델들이 현재 Atlas Cloud에 라이브로 제공됩니다. 가장 낮은 추론 가격과 인프라 오버헤드 없이 대규모로 Seedance와 Seedream을 실행해 보세요.

패밀리 보기

Alibaba Models on Atlas Cloud | Wan & Qwen

Atlas Cloud는 Alibaba의 전체 모델 라인업을 단일 API로 통합합니다. 언어 및 이미지 작업을 위한 Qwen, 최대 1080p 비디오 생성을 위한 Wan을 제공합니다. 구독 없이 사용한 만큼만 지불하는(pay-as-you-go) 방식으로 모든 모델에 액세스하세요. Alibaba API는 기존의 OpenAI 호환 클라이언트를 사용하여 단일 기본 URL(base URL)을 통해 사용할 수 있습니다.

패밀리 보기

MAI Image 2.5 Models

MAI-Image-2.5는 상업용 디자인, 제품 사진 및 브랜드용 콘텐츠 제작을 위해 구축된 Microsoft의 최신 실사 이미지 생성 및 편집 모델 제품군입니다. 텍스트-이미지 생성 및 이미지 편집 모두에 대해 표준 및 Flash 변형으로 제공되며, 이미지당 $0.03부터 시작하는 경쟁력 있는 가격으로 동급 최고의 Arena ELO 점수를 제공합니다. 정밀한 텍스트 렌더링, 정교한 편집 기능 및 자연스러운 인물 생성을 갖춘 MAI-Image-2.5는 후처리 오버헤드 없이 프로덕션 품질의 시각적 자료가 필요한 팀을 위해 설계되었습니다.

패밀리 보기

Wan2.7 Models

Launching this March, Wan2.7 is the latest powerhouse in the Qwen ecosystem, delivering a massive upgrade in visual fidelity, audio synchronization, and motion consistency over version 2.6. This all-in-one AI video generator supports advanced features like first-and-last frame control, 3x3 grid synthesis, and instruction-based video editing. Outperforming competitors like Jimeng, Wan2.7 offers superior flexibility with support for real-person image inputs, up to five video references, and 1080P high-definition outputs spanning 2 to 15 seconds, making it the premier choice for professional digital storytelling and high-end content marketing.

패밀리 보기

Nano Banana2 Models

Nano Banana 2 (by Google), is a generative image model that perfectly balances lightning-fast rendering with exceptional visual quality. With an improved price-performance ratio, it achieves breakthrough micro-detail depiction, accurate native text rendering, and complex physical structure reconstruction. It serves as a highly efficient, commercial-grade visual production tool for developers, marketing teams, and content creators.

패밀리 보기

Midjourney Models

Midjourney is a proprietary AI image and video generation platform developed by Midjourney, Inc. (San Francisco). Founded in 2021 by David Holz, it has become the aesthetic gold standard in generative AI — transforming text prompts into cinematic, painterly visuals at native 2K resolution. The latest V8.1 architecture, rebuilt from scratch on GPU-native PyTorch, delivers 4–5× faster generation, true 2048×2048 output without upscaling artifacts, and a signature visual style that remains unmatched by competitors. With the addition of Video V1, Midjourney extends its aesthetic into motion — animating still images into atmospheric 5-second cinematic clips. From brand campaigns to film pre-visualization to game concept art, Midjourney is the premier AI creative tool for professionals who demand both speed and artistry.

패밀리 보기

PixVerse Models

PixVerse, developed by AISphere, is a video generation model series built around one idea: giving creators director-level control over every frame. V6 is the flagship generation model, covering text-to-video, image-to-video, reference-to-video, start-and-end frame control, and video extension in a single cohesive pipeline. C1 takes a different approach — it is a storyboard-native model designed for multi-shot narrative production, where scene continuity and visual consistency across clips matter as much as individual frame quality. Both series are available on Atlas Cloud, starting from $0.025 per second, with no infrastructure setup required.

패밀리 보기

추천 아티클

Atlas Cloud를 최대한 활용할 수 있는 가이드, 튜토리얼, 제품 업데이트.

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.