Moonshot AI Models on AtlasCloud | Kimi

Atlas Cloud lưu trữ toàn bộ dòng sản phẩm Kimi thông qua MoonshotAI API, từ K2-Thinking cho suy luận sâu đến K2.6 cho lập trình tác tử. Tất cả đều trả tiền theo mức sử dụng, với ngữ cảnh 262K.

Large Language Models by Moonshot AI

Thúc đẩy trò chuyện, suy luận và tác tử ở quy mô lớn với các mô hình ngôn ngữ lớn hàng đầu, được cung cấp nhanh chóng và tiết kiệm trên Atlas Cloud.

Xem tất cả mô hình

Moonshot AI Models API Pricing Details

Compare standard vs. our pricing across every Moonshot AI model.

ModelStandard Price (USD)Our Price (USD)Discount
Kimi K2.5
$0.6/$3per 1M tokens262.1K context
$0.49/$2.5M in/outper 1M tokens262.1K context
View
Kimi-K2-Thinking
$0.6/$2.5per 1M tokens262.1K context
$0.6/$2.5M in/outper 1M tokens262.1K context
View
Kimi-K2-Instruct-0905
$0.6/$2.5per 1M tokens262.1K context
$0.6/$2.5M in/outper 1M tokens262.1K context
View
Kimi-K2-Instruct
$0.6/$2.5per 1M tokens131.1K context
$0.7/$2.5M in/outper 1M tokens131.1K context
View

Explore models from other providers

Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.

Các trường hợp sử dụng Moonshot AI API mà bạn có thể xây dựng trên Atlas Cloud

Đám mây tác tử (agent swarm) và khả năng thực thi dài hạn của Kimi cho phép các nhóm chạy các tác vụ có thể mất nhiều ngày công sức của con người chỉ trong một phiên tự động duy nhất. Các nhóm sử dụng M-series cùng với K2-Thinking để xử lý mọi thứ, từ thay đổi mã tự trị đến nghiên cứu đa tài liệu ở quy mô lớn.

Hiện đại hóa Cơ sở Mã Nguồn Cũ

Các nhóm kỹ thuật sử dụng Kimi K2.6 để chạy các tác nhân lập trình dài hạn giúp tự chủ đại tu các cơ sở mã sản xuất qua những phiên kéo dài nhiều giờ. Trong một ví dụ đã được ghi nhận, K2.6 đã viết lại một công cụ khớp lệnh tài chính 8 năm tuổi trong 13 giờ và mang lại hiệu suất tăng 185% mà không cần sự can thiệp của con người giữa các lần commit. Mức giá thanh toán theo mức sử dụng (pay-as-you-go) của Atlas Cloud giúp việc chạy các phiên tác nhân mở rộng này trở nên thiết thực mà không cần cam kết dung lượng.

Xử lý hàng loạt tài liệu song song

Các nhóm vận hành sử dụng bầy đàn 300 tác nhân của Kimi K2.6 để xử lý song song các lô tài liệu lớn. Một lần chạy điều phối duy nhất đã khớp một bản CV với 100 vai trò công việc và tạo ra 100 bản sơ yếu lý lịch được tùy chỉnh hoàn toàn làm đầu ra. Mô hình tương tự cũng áp dụng cho việc đánh giá hợp đồng, kiểm tra tuân thủ và bất kỳ quy trình làm việc nào mà một đầu vào cố định cần được đánh giá dựa trên một tập hợp các mục tiêu lớn và có thể thay đổi.

Suy luận Sâu cho Phân tích Phức tạp

Các nhóm nghiên cứu và pháp lý sử dụng Kimi K2-Thinking cho các vấn đề phân tích nhiều bước yêu cầu suy luận nội bộ mở rộng. Mô hình hỗ trợ tối đa 200 đến 300 lệnh gọi công cụ (tool calls) tuần tự mỗi phiên, lặp qua các chu kỳ suy luận-gọi-suy luận mà không cần con người nhắc nhở (prompting) giữa các bước. Trên Atlas Cloud, mô hình này có giá 0,6 USD cho mỗi triệu token đầu vào và chia sẻ cửa sổ ngữ cảnh 262K với phần còn lại của dòng sản phẩm Kimi.

Sản xuất tự động bài báo nghiên cứu

Các nhóm học thuật và nội dung sử dụng Kimi K2.6 để biến các tài liệu nguồn thành các kết quả nghiên cứu hoàn chỉnh. Trong một lần chạy thử nghiệm, K2.6 đã chuyển đổi một bài báo vật lý thiên văn thành một bài nghiên cứu dài 40 trang, một tập dữ liệu có cấu trúc với hơn 20.000 mục và 14 biểu đồ cấp độ thiên văn chỉ trong một phiên duy nhất. Điều này giúp giảm thời gian quay vòng đối với quy trình làm việc từ tài liệu đến kết quả từ vài tuần xuống còn vài giờ.

Tìm kiếm Khách hàng Tiềm năng Quy mô lớn

Các nhóm phát triển và bán hàng sử dụng các nhóm (swarms) Kimi K2.6 để xác định khách hàng tiềm năng và đồng thời tạo ra các tài liệu tiếp cận. Một lần chạy thử nghiệm đã xác định được 30 cửa hàng bán lẻ ở một thành phố mục tiêu không có trang web và tạo một trang đích cho mỗi cửa hàng. Mô hình tương tự cũng hoạt động hiệu quả cho việc làm phong phú dữ liệu khách hàng tiềm năng, lập bản đồ bối cảnh cạnh tranh và bất kỳ nhiệm vụ nào kết hợp giữa khám phá và tạo nội dung ở quy mô danh sách.

Phân tích Tài liệu Trực quan và Mã

Các nhóm sản phẩm và dữ liệu sử dụng khả năng thị giác tự nhiên của Kimi K2.5 và K2.6 để xử lý đầu vào hình ảnh và video cùng với văn bản trong cùng một lệnh gọi API. Bộ mã hóa MoonViT xử lý các sơ đồ, ảnh chụp màn hình, mô hình UI và bản quét tài liệu mà không cần tiền xử lý bên ngoài. Điều này hữu ích cho các đường ống (pipelines) chuyển đổi trực tiếp thông số kỹ thuật trực quan thành mã hoặc trích xuất dữ liệu có cấu trúc từ các tài liệu chứa nhiều hình ảnh.

Biến tm nhìn doanh nghip ca bn thành hin thc vi Atlas Cloud AI.

Liên hệ kinh doanh

Các câu hỏi thường gặp về mô hình Moonshot AI

Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.

Kimi K2.6 mở rộng quy mô lên 300 sub-agent thực hiện tới 4.000 bước phối hợp trong một lần chạy duy nhất. Kimi K2.5 trên Atlas Cloud hỗ trợ thực thi theo bầy đàn với tối đa 100 sub-agent. Các nhiệm vụ được phân rã động thành các nhiệm vụ phụ song song, chuyên biệt theo lĩnh vực để mang lại kết quả hoàn toàn tự chủ.

Kimi K2-Thinking sử dụng suy luận chuỗi suy nghĩ (chain-of-thought) sâu với tối đa 200 đến 300 lần gọi công cụ tuần tự trong mỗi phiên. Mô hình này suy luận, gọi một công cụ, diễn giải kết quả, gọi một công cụ khác và tiếp tục vòng lặp này mà không cần sự can thiệp của con người. Nó phù hợp với suy luận logic nhiều bước, toán học phức tạp và các vấn đề mà suy luận nội bộ mở rộng giúp cải thiện độ chính xác.

Có. Kimi K2.5 và K2.6 bao gồm MoonViT, một bộ mã hóa tầm nhìn 400 triệu tham số có khả năng xử lý hình ảnh và video nguyên bản. Bạn có thể truyền trực tiếp đầu vào hình ảnh hoặc video trong lệnh gọi API cùng với văn bản mà không cần tiền xử lý bên ngoài. Điều này hỗ trợ các quy trình phân tích trực quan, hiểu tài liệu và tạo mã từ hình ảnh.

Có. Kimi K2.6 được phát hành theo giấy phép MIT sửa đổi, cho phép sử dụng cho mục đích thương mại. Trọng số mở có sẵn trên HuggingFace cho các đợt triển khai tự lưu trữ. Atlas Cloud cũng cung cấp K2.6 qua API cho các nhóm thích truy cập được quản lý mà không phải chịu chi phí cơ sở hạ tầng.

Kimi K2.6 đạt điểm số 80,2% trên SWE-Bench Verified và 54,0% trên Humanity's Last Exam với các công cụ, vượt qua GPT-5.5 trên cả hai benchmarks. Nó cũng dẫn đầu trên BrowseComp với 83,2%, cao hơn GPT-5.4. Những kết quả này đạt được với chi phí cho mỗi triệu token thấp hơn khoảng 80% so với GPT-5.5.

Kimi K2.5 có giá 0,49 USD cho mỗi triệu token đầu vào và 2,5 USD cho mỗi triệu token đầu ra trên Atlas Cloud. Kimi K2-Thinking và K2-Instruct-0905 hoạt động ở mức 0,6 USD cho mỗi triệu token đầu vào với cùng tỷ lệ đầu ra. Hãy kiểm tra trang mô hình Kimi K2.6 trên Atlas Cloud để biết giá cụ thể hiện tại.

Khám phá Thêm Dòng

Seedance 2.0 Models

Seedance 2.0(by Bytedance) is a multimodal video generation model that redefines "controllable creation," moving beyond the limitations of text or start/end frames. It supports quad-modal inputs—text, image, video, and audio—and introduces an industry-leading "Universal Reference" system. By precisely replicating the composition, camera movement, and character actions from reference assets, Seedance 2.0 solves critical issues with character consistency and physical coherence, empowering creators to act as true "directors" with deep control over their output.

Xem Dòng

Grok-Imagine Models

Grok Imagine Image Quality is xAI's latest AI image generation model, delivering studio-grade visuals with up to 2K resolution and razor-sharp detail. It offers best-in-class text rendering across multiple languages, photorealistic outputs with natural lighting, rich textures, and believable physics, plus tighter prompt following and image editing with reference inputs for precise creative control. Ideal for hero images, ad creatives, product renders, and brand-grade visuals.

Xem Dòng

Gemini Omni

Gemini Omni (by Google DeepMind) is a video generation and editing model launched on May 20, 2026 at Google I/O that redefines the standard for "reasoning-driven creation," built specifically to solve the core challenge of AI video: making output that actually understands what you mean, not just what you type. It fuses Gemini's reasoning engine with generative capability, accepting any mix of images, text, video, and audio to produce consistent, knowledge-grounded output. Unlike models that start from scratch each time, Omni lets you edit through natural conversation — swapping objects, rewriting scenes, shifting styles — while keeping physics, characters, and continuity intact across every turn.

Xem Dòng

GPT Image 2 Models

GPT Image 2 is a state-of-the-art multimodal foundation model engineered for exceptional text-to-image generation with unprecedented photorealism and creative versatility. Developed by OpenAI as the evolution of the DALL-E lineage, it transforms detailed natural language descriptions into hyper-realistic imagery at up to 4K resolution. With proprietary "Neural Rendering Engine" technology for precise visual control, GPT Image 2 delivers studio-quality results with accurate anatomy, lighting, and composition—making it the premier AI tool for professional creators, enterprises, and developers demanding production-ready visual assets.

Xem Dòng

Google Models on Atlas Cloud | Gemini, Nano Bananas & Veo

Các mô hình sáng tạo mạnh mẽ nhất của Google hiện đều có sẵn trên Atlas Cloud. Veo 3.1 cung cấp khả năng tạo video đậm chất điện ảnh, Nano Banana 2 hỗ trợ tạo hình ảnh có độ chân thực cao, và Gemini mang trí tuệ đa phương thức vào mọi quy trình làm việc. Truy cập toàn bộ bộ mô hình Google thông qua một API key duy nhất với tính khả dụng Day-0 và mức giá dùng bao nhiêu trả bấy nhiêu (pay-as-you-go).

Xem Dòng

ByteDance Models on Atlas Cloud | Seedance & Seedream

Từ tạo video điện ảnh đến kiến tạo hình ảnh có độ trung thực cao, các mô hình mạnh mẽ nhất của ByteDance hiện đã có mặt trên Atlas Cloud. Chạy Seedance và Seedream ở quy mô lớn với mức giá suy luận thấp nhất và không có chi phí quản lý cơ sở hạ tầng.

Xem Dòng

Alibaba Models on Atlas Cloud | Wan & Qwen

Atlas Cloud tập hợp toàn bộ dòng mô hình của Alibaba dưới một API duy nhất: Qwen cho các tác vụ ngôn ngữ và hình ảnh, Wan để tạo video với độ phân giải lên đến 1080p. Truy cập mọi mô hình theo hình thức dùng đến đâu trả tiền đến đó (pay-as-you-go) mà không cần đăng ký gói. Alibaba API có sẵn thông qua một URL cơ sở (base URL) duy nhất bằng cách sử dụng ứng dụng khách tương thích với OpenAI hiện có của bạn.

Xem Dòng

MAI Image 2.5 Models

MAI-Image-2.5 là dòng mô hình chỉnh sửa và tạo hình ảnh chân thực mới nhất của Microsoft, được xây dựng cho thiết kế thương mại, nhiếp ảnh sản phẩm và tạo nội dung sẵn sàng cho thương hiệu. Có sẵn trong các biến thể tiêu chuẩn và Flash cho cả việc tạo hình ảnh từ văn bản và chỉnh sửa hình ảnh, nó mang lại điểm số Arena ELO tốt nhất trong phân khúc với mức giá cạnh tranh — chỉ từ 0,03 đô la cho mỗi hình ảnh. Với khả năng hiển thị văn bản chính xác, khả năng chỉnh sửa sắc sảo như phẫu thuật và tạo chân dung tự nhiên, MAI-Image-2.5 được thiết kế cho các nhóm cần hình ảnh chất lượng sản xuất mà không phải chịu chi phí xử lý hậu kỳ.

Xem Dòng

Wan2.7 Models

Launching this March, Wan2.7 is the latest powerhouse in the Qwen ecosystem, delivering a massive upgrade in visual fidelity, audio synchronization, and motion consistency over version 2.6. This all-in-one AI video generator supports advanced features like first-and-last frame control, 3x3 grid synthesis, and instruction-based video editing. Outperforming competitors like Jimeng, Wan2.7 offers superior flexibility with support for real-person image inputs, up to five video references, and 1080P high-definition outputs spanning 2 to 15 seconds, making it the premier choice for professional digital storytelling and high-end content marketing.

Xem Dòng

Nano Banana2 Models

Nano Banana 2 (by Google), is a generative image model that perfectly balances lightning-fast rendering with exceptional visual quality. With an improved price-performance ratio, it achieves breakthrough micro-detail depiction, accurate native text rendering, and complex physical structure reconstruction. It serves as a highly efficient, commercial-grade visual production tool for developers, marketing teams, and content creators.

Xem Dòng

Midjourney Models

Midjourney is a proprietary AI image and video generation platform developed by Midjourney, Inc. (San Francisco). Founded in 2021 by David Holz, it has become the aesthetic gold standard in generative AI — transforming text prompts into cinematic, painterly visuals at native 2K resolution. The latest V8.1 architecture, rebuilt from scratch on GPU-native PyTorch, delivers 4–5× faster generation, true 2048×2048 output without upscaling artifacts, and a signature visual style that remains unmatched by competitors. With the addition of Video V1, Midjourney extends its aesthetic into motion — animating still images into atmospheric 5-second cinematic clips. From brand campaigns to film pre-visualization to game concept art, Midjourney is the premier AI creative tool for professionals who demand both speed and artistry.

Xem Dòng

PixVerse Models

PixVerse, developed by AISphere, is a video generation model series built around one idea: giving creators director-level control over every frame. V6 is the flagship generation model, covering text-to-video, image-to-video, reference-to-video, start-and-end frame control, and video extension in a single cohesive pipeline. C1 takes a different approach — it is a storyboard-native model designed for multi-shot narrative production, where scene continuity and visual consistency across clips matter as much as individual frame quality. Both series are available on Atlas Cloud, starting from $0.025 per second, with no infrastructure setup required.

Xem Dòng

Bài viết đề xuất

Hướng dẫn, bài hướng dẫn và cập nhật sản phẩm giúp bạn khai thác tối đa Atlas Cloud.

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.