
Atlas Cloud lưu trữ toàn bộ dòng sản phẩm Kimi thông qua MoonshotAI API, từ K2-Thinking cho suy luận sâu đến K2.6 cho lập trình tác tử. Tất cả đều trả tiền theo mức sử dụng, với ngữ cảnh 262K.
Thúc đẩy trò chuyện, suy luận và tác tử ở quy mô lớn với các mô hình ngôn ngữ lớn hàng đầu, được cung cấp nhanh chóng và tiết kiệm trên Atlas Cloud.
Compare standard vs. our pricing across every Moonshot AI model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Kimi K2.5 | $0.6/$3per 1M tokens262.1K context | $0.49/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Thinking | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct-0905 | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct | $0.6/$2.5per 1M tokens131.1K context | $0.7/$2.5M in/outper 1M tokens131.1K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Đám mây tác tử (agent swarm) và khả năng thực thi dài hạn của Kimi cho phép các nhóm chạy các tác vụ có thể mất nhiều ngày công sức của con người chỉ trong một phiên tự động duy nhất. Các nhóm sử dụng M-series cùng với K2-Thinking để xử lý mọi thứ, từ thay đổi mã tự trị đến nghiên cứu đa tài liệu ở quy mô lớn.
Các nhóm kỹ thuật sử dụng Kimi K2.6 để chạy các tác nhân lập trình dài hạn giúp tự chủ đại tu các cơ sở mã sản xuất qua những phiên kéo dài nhiều giờ. Trong một ví dụ đã được ghi nhận, K2.6 đã viết lại một công cụ khớp lệnh tài chính 8 năm tuổi trong 13 giờ và mang lại hiệu suất tăng 185% mà không cần sự can thiệp của con người giữa các lần commit. Mức giá thanh toán theo mức sử dụng (pay-as-you-go) của Atlas Cloud giúp việc chạy các phiên tác nhân mở rộng này trở nên thiết thực mà không cần cam kết dung lượng.
Các nhóm vận hành sử dụng bầy đàn 300 tác nhân của Kimi K2.6 để xử lý song song các lô tài liệu lớn. Một lần chạy điều phối duy nhất đã khớp một bản CV với 100 vai trò công việc và tạo ra 100 bản sơ yếu lý lịch được tùy chỉnh hoàn toàn làm đầu ra. Mô hình tương tự cũng áp dụng cho việc đánh giá hợp đồng, kiểm tra tuân thủ và bất kỳ quy trình làm việc nào mà một đầu vào cố định cần được đánh giá dựa trên một tập hợp các mục tiêu lớn và có thể thay đổi.
Các nhóm nghiên cứu và pháp lý sử dụng Kimi K2-Thinking cho các vấn đề phân tích nhiều bước yêu cầu suy luận nội bộ mở rộng. Mô hình hỗ trợ tối đa 200 đến 300 lệnh gọi công cụ (tool calls) tuần tự mỗi phiên, lặp qua các chu kỳ suy luận-gọi-suy luận mà không cần con người nhắc nhở (prompting) giữa các bước. Trên Atlas Cloud, mô hình này có giá 0,6 USD cho mỗi triệu token đầu vào và chia sẻ cửa sổ ngữ cảnh 262K với phần còn lại của dòng sản phẩm Kimi.
Các nhóm học thuật và nội dung sử dụng Kimi K2.6 để biến các tài liệu nguồn thành các kết quả nghiên cứu hoàn chỉnh. Trong một lần chạy thử nghiệm, K2.6 đã chuyển đổi một bài báo vật lý thiên văn thành một bài nghiên cứu dài 40 trang, một tập dữ liệu có cấu trúc với hơn 20.000 mục và 14 biểu đồ cấp độ thiên văn chỉ trong một phiên duy nhất. Điều này giúp giảm thời gian quay vòng đối với quy trình làm việc từ tài liệu đến kết quả từ vài tuần xuống còn vài giờ.
Các nhóm phát triển và bán hàng sử dụng các nhóm (swarms) Kimi K2.6 để xác định khách hàng tiềm năng và đồng thời tạo ra các tài liệu tiếp cận. Một lần chạy thử nghiệm đã xác định được 30 cửa hàng bán lẻ ở một thành phố mục tiêu không có trang web và tạo một trang đích cho mỗi cửa hàng. Mô hình tương tự cũng hoạt động hiệu quả cho việc làm phong phú dữ liệu khách hàng tiềm năng, lập bản đồ bối cảnh cạnh tranh và bất kỳ nhiệm vụ nào kết hợp giữa khám phá và tạo nội dung ở quy mô danh sách.
Các nhóm sản phẩm và dữ liệu sử dụng khả năng thị giác tự nhiên của Kimi K2.5 và K2.6 để xử lý đầu vào hình ảnh và video cùng với văn bản trong cùng một lệnh gọi API. Bộ mã hóa MoonViT xử lý các sơ đồ, ảnh chụp màn hình, mô hình UI và bản quét tài liệu mà không cần tiền xử lý bên ngoài. Điều này hữu ích cho các đường ống (pipelines) chuyển đổi trực tiếp thông số kỹ thuật trực quan thành mã hoặc trích xuất dữ liệu có cấu trúc từ các tài liệu chứa nhiều hình ảnh.
Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.
Kimi K2.6 mở rộng quy mô lên 300 sub-agent thực hiện tới 4.000 bước phối hợp trong một lần chạy duy nhất. Kimi K2.5 trên Atlas Cloud hỗ trợ thực thi theo bầy đàn với tối đa 100 sub-agent. Các nhiệm vụ được phân rã động thành các nhiệm vụ phụ song song, chuyên biệt theo lĩnh vực để mang lại kết quả hoàn toàn tự chủ.
Kimi K2-Thinking sử dụng suy luận chuỗi suy nghĩ (chain-of-thought) sâu với tối đa 200 đến 300 lần gọi công cụ tuần tự trong mỗi phiên. Mô hình này suy luận, gọi một công cụ, diễn giải kết quả, gọi một công cụ khác và tiếp tục vòng lặp này mà không cần sự can thiệp của con người. Nó phù hợp với suy luận logic nhiều bước, toán học phức tạp và các vấn đề mà suy luận nội bộ mở rộng giúp cải thiện độ chính xác.
Có. Kimi K2.5 và K2.6 bao gồm MoonViT, một bộ mã hóa tầm nhìn 400 triệu tham số có khả năng xử lý hình ảnh và video nguyên bản. Bạn có thể truyền trực tiếp đầu vào hình ảnh hoặc video trong lệnh gọi API cùng với văn bản mà không cần tiền xử lý bên ngoài. Điều này hỗ trợ các quy trình phân tích trực quan, hiểu tài liệu và tạo mã từ hình ảnh.
Có. Kimi K2.6 được phát hành theo giấy phép MIT sửa đổi, cho phép sử dụng cho mục đích thương mại. Trọng số mở có sẵn trên HuggingFace cho các đợt triển khai tự lưu trữ. Atlas Cloud cũng cung cấp K2.6 qua API cho các nhóm thích truy cập được quản lý mà không phải chịu chi phí cơ sở hạ tầng.
Kimi K2.6 đạt điểm số 80,2% trên SWE-Bench Verified và 54,0% trên Humanity's Last Exam với các công cụ, vượt qua GPT-5.5 trên cả hai benchmarks. Nó cũng dẫn đầu trên BrowseComp với 83,2%, cao hơn GPT-5.4. Những kết quả này đạt được với chi phí cho mỗi triệu token thấp hơn khoảng 80% so với GPT-5.5.
Kimi K2.5 có giá 0,49 USD cho mỗi triệu token đầu vào và 2,5 USD cho mỗi triệu token đầu ra trên Atlas Cloud. Kimi K2-Thinking và K2-Instruct-0905 hoạt động ở mức 0,6 USD cho mỗi triệu token đầu vào với cùng tỷ lệ đầu ra. Hãy kiểm tra trang mô hình Kimi K2.6 trên Atlas Cloud để biết giá cụ thể hiện tại.
Hướng dẫn, bài hướng dẫn và cập nhật sản phẩm giúp bạn khai thác tối đa Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.