Moonshot AI Models on AtlasCloud | Kimi

Atlas Cloud lưu trữ toàn bộ dòng sản phẩm Kimi thông qua MoonshotAI API, từ K2-Thinking cho suy luận sâu đến K2.6 cho lập trình tác tử. Tất cả đều trả tiền theo mức sử dụng, với ngữ cảnh 262K.

Large Language Models by Moonshot AI

Thúc đẩy trò chuyện, suy luận và tác tử ở quy mô lớn với các mô hình ngôn ngữ lớn hàng đầu, được cung cấp nhanh chóng và tiết kiệm trên Atlas Cloud.

Xem tất cả mô hình

LLM

Kimi

Kimi API là dòng K2 open-weight của Moonshot AI, từ K2.5 đa phương thức gốc đến K2.7 Code chuyên biệt cho lập trình. Vì khả năng thị giác được tích hợp sẵn trong mô hình, bạn có thể chuyển ảnh chụp màn hình, bản mô phỏng UI và video ngắn thành mã frontend hoạt động được, điều phối tối đa 100 sub-agent song song và suy luận trên ngữ cảnh 256K token. Atlas Cloud cung cấp toàn bộ dòng này qua một endpoint thống nhất với giá trả theo mức sử dụng minh bạch. Hãy bắt đầu xây dựng ngay hôm nay.

4 mô hìnhKhám phá Kimi

Moonshot AI Models API Pricing Details

Compare standard vs. our pricing across every Moonshot AI model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Kimi K3	$3/$15per 1M tokens1048.6K context	$3/$15M in/outper 1M tokens1048.6K context	—	View
Kimi K2.7 Code	$0.95/$4per 1M tokens262.1K context	$0.95/$4M in/outper 1M tokens262.1K context	—	View
Kimi K2.6	$0.95/$4per 1M tokens262.1K context	$0.95/$4M in/outper 1M tokens262.1K context	—	View
Kimi K2.5	$0.6/$3per 1M tokens262.1K context	$0.49/$2.5M in/outper 1M tokens262.1K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Các trường hợp sử dụng Moonshot AI API mà bạn có thể xây dựng trên Atlas Cloud

Đám mây tác tử (agent swarm) và khả năng thực thi dài hạn của Kimi cho phép các nhóm chạy các tác vụ có thể mất nhiều ngày công sức của con người chỉ trong một phiên tự động duy nhất. Các nhóm sử dụng M-series cùng với K2-Thinking để xử lý mọi thứ, từ thay đổi mã tự trị đến nghiên cứu đa tài liệu ở quy mô lớn.

Hiện đại hóa Cơ sở Mã Nguồn Cũ

Các nhóm kỹ thuật sử dụng Kimi K2.6 để chạy các tác nhân lập trình dài hạn giúp tự chủ đại tu các cơ sở mã sản xuất qua những phiên kéo dài nhiều giờ. Trong một ví dụ đã được ghi nhận, K2.6 đã viết lại một công cụ khớp lệnh tài chính 8 năm tuổi trong 13 giờ và mang lại hiệu suất tăng 185% mà không cần sự can thiệp của con người giữa các lần commit. Mức giá thanh toán theo mức sử dụng (pay-as-you-go) của Atlas Cloud giúp việc chạy các phiên tác nhân mở rộng này trở nên thiết thực mà không cần cam kết dung lượng.

Xử lý hàng loạt tài liệu song song

Các nhóm vận hành sử dụng bầy đàn 300 tác nhân của Kimi K2.6 để xử lý song song các lô tài liệu lớn. Một lần chạy điều phối duy nhất đã khớp một bản CV với 100 vai trò công việc và tạo ra 100 bản sơ yếu lý lịch được tùy chỉnh hoàn toàn làm đầu ra. Mô hình tương tự cũng áp dụng cho việc đánh giá hợp đồng, kiểm tra tuân thủ và bất kỳ quy trình làm việc nào mà một đầu vào cố định cần được đánh giá dựa trên một tập hợp các mục tiêu lớn và có thể thay đổi.

Suy luận Sâu cho Phân tích Phức tạp

Các nhóm nghiên cứu và pháp lý sử dụng Kimi K2-Thinking cho các vấn đề phân tích nhiều bước yêu cầu suy luận nội bộ mở rộng. Mô hình hỗ trợ tối đa 200 đến 300 lệnh gọi công cụ (tool calls) tuần tự mỗi phiên, lặp qua các chu kỳ suy luận-gọi-suy luận mà không cần con người nhắc nhở (prompting) giữa các bước. Trên Atlas Cloud, mô hình này có giá 0,6 USD cho mỗi triệu token đầu vào và chia sẻ cửa sổ ngữ cảnh 262K với phần còn lại của dòng sản phẩm Kimi.

Sản xuất tự động bài báo nghiên cứu

Các nhóm học thuật và nội dung sử dụng Kimi K2.6 để biến các tài liệu nguồn thành các kết quả nghiên cứu hoàn chỉnh. Trong một lần chạy thử nghiệm, K2.6 đã chuyển đổi một bài báo vật lý thiên văn thành một bài nghiên cứu dài 40 trang, một tập dữ liệu có cấu trúc với hơn 20.000 mục và 14 biểu đồ cấp độ thiên văn chỉ trong một phiên duy nhất. Điều này giúp giảm thời gian quay vòng đối với quy trình làm việc từ tài liệu đến kết quả từ vài tuần xuống còn vài giờ.

Tìm kiếm Khách hàng Tiềm năng Quy mô lớn

Các nhóm phát triển và bán hàng sử dụng các nhóm (swarms) Kimi K2.6 để xác định khách hàng tiềm năng và đồng thời tạo ra các tài liệu tiếp cận. Một lần chạy thử nghiệm đã xác định được 30 cửa hàng bán lẻ ở một thành phố mục tiêu không có trang web và tạo một trang đích cho mỗi cửa hàng. Mô hình tương tự cũng hoạt động hiệu quả cho việc làm phong phú dữ liệu khách hàng tiềm năng, lập bản đồ bối cảnh cạnh tranh và bất kỳ nhiệm vụ nào kết hợp giữa khám phá và tạo nội dung ở quy mô danh sách.

Phân tích Tài liệu Trực quan và Mã

Các nhóm sản phẩm và dữ liệu sử dụng khả năng thị giác tự nhiên của Kimi K2.5 và K2.6 để xử lý đầu vào hình ảnh và video cùng với văn bản trong cùng một lệnh gọi API. Bộ mã hóa MoonViT xử lý các sơ đồ, ảnh chụp màn hình, mô hình UI và bản quét tài liệu mà không cần tiền xử lý bên ngoài. Điều này hữu ích cho các đường ống (pipelines) chuyển đổi trực tiếp thông số kỹ thuật trực quan thành mã hoặc trích xuất dữ liệu có cấu trúc từ các tài liệu chứa nhiều hình ảnh.

Biến tầm nhìn doanh nghiệp của bạn thành hiện thực với Atlas Cloud AI.

Liên hệ kinh doanh

Các câu hỏi thường gặp về mô hình Moonshot AI

Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.

Kimi K2.6 mở rộng quy mô lên 300 sub-agent thực hiện tới 4.000 bước phối hợp trong một lần chạy duy nhất. Kimi K2.5 trên Atlas Cloud hỗ trợ thực thi theo bầy đàn với tối đa 100 sub-agent. Các nhiệm vụ được phân rã động thành các nhiệm vụ phụ song song, chuyên biệt theo lĩnh vực để mang lại kết quả hoàn toàn tự chủ.

Kimi K2-Thinking sử dụng suy luận chuỗi suy nghĩ (chain-of-thought) sâu với tối đa 200 đến 300 lần gọi công cụ tuần tự trong mỗi phiên. Mô hình này suy luận, gọi một công cụ, diễn giải kết quả, gọi một công cụ khác và tiếp tục vòng lặp này mà không cần sự can thiệp của con người. Nó phù hợp với suy luận logic nhiều bước, toán học phức tạp và các vấn đề mà suy luận nội bộ mở rộng giúp cải thiện độ chính xác.

Có. Kimi K2.5 và K2.6 bao gồm MoonViT, một bộ mã hóa tầm nhìn 400 triệu tham số có khả năng xử lý hình ảnh và video nguyên bản. Bạn có thể truyền trực tiếp đầu vào hình ảnh hoặc video trong lệnh gọi API cùng với văn bản mà không cần tiền xử lý bên ngoài. Điều này hỗ trợ các quy trình phân tích trực quan, hiểu tài liệu và tạo mã từ hình ảnh.

Có. Kimi K2.6 được phát hành theo giấy phép MIT sửa đổi, cho phép sử dụng cho mục đích thương mại. Trọng số mở có sẵn trên HuggingFace cho các đợt triển khai tự lưu trữ. Atlas Cloud cũng cung cấp K2.6 qua API cho các nhóm thích truy cập được quản lý mà không phải chịu chi phí cơ sở hạ tầng.

Kimi K2.6 đạt điểm số 80,2% trên SWE-Bench Verified và 54,0% trên Humanity's Last Exam với các công cụ, vượt qua GPT-5.5 trên cả hai benchmarks. Nó cũng dẫn đầu trên BrowseComp với 83,2%, cao hơn GPT-5.4. Những kết quả này đạt được với chi phí cho mỗi triệu token thấp hơn khoảng 80% so với GPT-5.5.

Kimi K2.5 có giá 0,49 USD cho mỗi triệu token đầu vào và 2,5 USD cho mỗi triệu token đầu ra trên Atlas Cloud. Kimi K2-Thinking và K2-Instruct-0905 hoạt động ở mức 0,6 USD cho mỗi triệu token đầu vào với cùng tỷ lệ đầu ra. Hãy kiểm tra trang mô hình Kimi K2.6 trên Atlas Cloud để biết giá cụ thể hiện tại.

Khám phá Thêm Dòng

Seedance 2.0

Seedance 2.0 API cung cấp cho bạn quyền truy cập cấp sản xuất vào mô hình video đa phương thức của ByteDance — đầu vào bốn phương thức (văn bản, hình ảnh, video, âm thanh) và hệ thống "Universal Reference" hàng đầu trong ngành giúp khóa bố cục, chuyển động của camera và hành động của nhân vật trên các cảnh quay. Tích hợp quyền kiểm soát cấp độ đạo diễn bằng một lệnh gọi API, mức giá cố định $0,09/giây, cấp khóa tức thì và không có danh sách chờ — được hỗ trợ bởi thời gian hoạt động và sự tuân thủ cấp doanh nghiệp. Seedance 2.0 Native 4K hiện đã ra mắt!

Xem Dòng

Grok Imagine

Grok Imagine API cung cấp cho các nhà phát triển khả năng tạo hình ảnh, video và âm thanh của xAI trong một bộ công cụ duy nhất. API này tạo ra hình ảnh độ phân giải lên đến 2K với khả năng hiển thị văn bản đa ngôn ngữ, cộng với video lên đến 15 giây với âm thanh gốc, được đồng bộ hóa và chỉnh sửa dựa trên tham chiếu. Trên Atlas Cloud, một khóa duy nhất có thể chạy mọi chế độ Grok Imagine, do đó bạn có thể chuyển đổi giữa hình ảnh, video và âm thanh mà không cần thiết lập riêng biệt, với mức giá từ 0,02 USD cho mỗi hình ảnh và 0,05 USD mỗi giây.

Xem Dòng

Gemini Omni Flash

Gemini Omni API đưa mô hình tạo và chỉnh sửa video đa phương thức của Google DeepMind, được giới thiệu tại Google I/O 2026, vào stack của bạn. Gemini Omni kết hợp công cụ suy luận của Gemini với media tạo sinh, chấp nhận mọi tổ hợp văn bản, hình ảnh, video và âm thanh để tạo ra kết quả nhất quán, dựa trên nền tảng tri thức. Tinh chỉnh kết quả qua hội thoại tự nhiên — hoán đổi vật thể, viết lại cảnh quay và thay đổi phong cách, trong khi vật lý, nhân vật và tính liên tục vẫn được giữ nguyên. Atlas Cloud cung cấp trọn bộ dòng Gemini Omni Flash — chuyển văn bản thành video, chuyển hình ảnh thành video với tối đa 7 hình ảnh tham chiếu, và chuyển tham chiếu thành video — thông qua một API hợp nhất với mức giá minh bạch tính theo giây từ $0.112 và không cần đăng ký thuê bao. Bắt đầu xây dựng ngay hôm nay.

Xem Dòng

GPT Image 2

GPT Image 2 API cung cấp cho các nhà phát triển quyền truy cập vào mô hình hình ảnh mới nhất của OpenAI, phiên bản kế nhiệm của GPT Image 1.5. Mô hình này tạo và chỉnh sửa hình ảnh với khả năng hiển thị văn bản chính xác trên các chữ viết Latinh và CJK, cùng với bố cục mạnh mẽ cho áp phích, mockup và đồ họa thông tin. Trên Atlas Cloud, bạn có thể truy cập nó thông qua một API thống nhất cùng với hơn 300 mô hình khác, với tín dụng miễn phí, 99,99% thời gian hoạt động và không yêu cầu xác minh tổ chức OpenAI.

Xem Dòng

Google

Các mô hình sáng tạo mạnh mẽ nhất của Google hiện đều có sẵn trên Atlas Cloud. Veo 3.1 cung cấp khả năng tạo video đậm chất điện ảnh, Nano Banana 2 hỗ trợ tạo hình ảnh có độ chân thực cao, và Gemini mang trí tuệ đa phương thức vào mọi quy trình làm việc. Truy cập toàn bộ bộ mô hình Google thông qua một API key duy nhất với tính khả dụng Day-0 và mức giá dùng bao nhiêu trả bấy nhiêu (pay-as-you-go).

Xem Dòng

Seedance 2.0 Mini

Seedance 2.0 Mini mang khả năng tạo video đa phương thức của ByteDance vào các quy trình làm việc nơi tốc độ và chi phí là quan trọng nhất. Nó cung cấp các khả năng cốt lõi của Seedance 2.0 với mức tiêu thụ tài nguyên nhẹ hơn — tạo nhanh hơn, chi phí mỗi video thấp hơn và tích hợp API giống như bạn đã sử dụng. Đối với các nhóm chạy các quy trình (pipeline) khối lượng lớn hoặc tạo nguyên mẫu ở quy mô lớn, Mini là lựa chọn mặc định thiết thực.

Xem Dòng

ByteDance

Từ tạo video điện ảnh đến kiến tạo hình ảnh có độ trung thực cao, các mô hình mạnh mẽ nhất của ByteDance hiện đã có mặt trên Atlas Cloud. Chạy Seedance và Seedream ở quy mô lớn với mức giá suy luận thấp nhất và không có chi phí quản lý cơ sở hạ tầng.

Xem Dòng

Alibaba

Atlas Cloud tập hợp toàn bộ dòng mô hình của Alibaba dưới một API duy nhất: Qwen cho các tác vụ ngôn ngữ và hình ảnh, Wan để tạo video với độ phân giải lên đến 1080p. Truy cập mọi mô hình theo hình thức dùng đến đâu trả tiền đến đó (pay-as-you-go) mà không cần đăng ký gói. Alibaba API có sẵn thông qua một URL cơ sở (base URL) duy nhất bằng cách sử dụng ứng dụng khách tương thích với OpenAI hiện có của bạn.

Xem Dòng

OpenAI

Atlas Cloud cấp cho bạn quyền truy cập vào toàn bộ danh mục OpenAI API, từ GPT Image 2 để tạo hình ảnh đến Sora 2 cho video. Mọi mô hình đều có sẵn theo hình thức dùng đến đâu trả tiền đến đó (pay-as-you-go) mà không cần cam kết hàng tháng. Tích hợp dễ dàng chỉ bằng cách thay đổi một base URL thông qua API tương thích với OpenAI.

Xem Dòng

xAI

Xây dựng các pipeline hình ảnh và video hoàn chỉnh bằng xAI API trên Atlas Cloud. Tạo ở độ phân giải 2K, chỉnh sửa bằng hình ảnh tham chiếu và tạo hoạt ảnh từ hình ảnh thành các clip đồng bộ với âm thanh.

Xem Dòng

Kwaivgi

Kwaivgi API với mức giá thấp hơn 15% so với giá tiêu chuẩn. Atlas Cloud cung cấp quyền truy cập Day-0 cho các bản phát hành Kling mới với mức giá dùng trả theo mức sử dụng (pay-as-you-go) và không giới hạn số lượng người dùng. Một tài khoản, một khóa, mọi mô hình Kling từ cấp tiêu chuẩn đến cấp master.

Xem Dòng

Seedream 5.0 Pro

Seedream 5.0 Pro API cung cấp cho các nhà phát triển mô hình chỉnh sửa hình ảnh có thể kiểm soát của ByteDance trên Atlas Cloud. Nó đặt các chỉnh sửa một cách chính xác bằng các điểm neo và tọa độ, tách hình ảnh thành các lớp có thể chỉnh sửa, kết hợp nhiều tham chiếu và khớp màu sắc cũng như vật liệu chính xác, với văn bản đa ngôn ngữ ở độ phân giải 2K và 3K. Trên Atlas Cloud, bạn có thể truy cập nó chỉ bằng một khóa!

Xem Dòng