
Atlas Cloud 通过 MoonshotAI API 提供完整的 Kimi 系列,从用于深度推理的 K2-Thinking 到用于智能体编程的 K2.6。全部按量付费,262K 上下文。
在 Atlas Cloud 上,依托顶尖的大语言模型,以极速且实惠的方式驱动对话、推理与智能体的规模化应用。
对比 Moonshot AI 全部模型的标准价、平台价与折扣。
| 模型 | 标准价 (USD) | 平台价 (USD) | 折扣 | |
|---|---|---|---|---|
| Kimi K2.5 | $0.6/$3每 100 万 tokens262.1K 上下文 | $0.49/$2.5M 输入/输出每 100 万 tokens262.1K 上下文 | — | 查看 |
| Kimi-K2-Thinking | $0.6/$2.5每 100 万 tokens262.1K 上下文 | $0.6/$2.5M 输入/输出每 100 万 tokens262.1K 上下文 | — | 查看 |
| Kimi-K2-Instruct-0905 | $0.6/$2.5每 100 万 tokens262.1K 上下文 | $0.6/$2.5M 输入/输出每 100 万 tokens262.1K 上下文 | — | 查看 |
| Kimi-K2-Instruct | $0.6/$2.5每 100 万 tokens131.1K 上下文 | $0.7/$2.5M 输入/输出每 100 万 tokens131.1K 上下文 | — | 查看 |
在 Atlas Playground 中即刻探索并体验 300+ 生产可用模型,一键开始定制。
Kimi 的智能体集群和长周期执行能力,使团队能够在单次自动化会话中完成原本需要数天人力才能完成的任务。团队将 M-series 与 K2-Thinking 结合使用,从而涵盖从自主代码更改到大规模多文档研究的各项工作。
工程团队使用 Kimi K2.6 运行长周期编码智能体,在长达数小时的会话中自主重构生产环境的代码库。在一个有记录的案例中,K2.6 耗时13个小时重写了一个有着8年历史的金融撮合引擎,在各次提交之间无需人工干预的情况下,将吞吐量提升了185%。Atlas Cloud 的按需付费定价模式使得运行这些长时间的智能体任务变得切实可行,且无需预先承诺容量。
运营团队使用 Kimi K2.6 的 300 智能体集群并行处理大批量文档。单次编排运行可将一份简历与 100 个岗位角色进行匹配,并输出 100 份完全定制的简历。相同的模式适用于合同审查、合规检查,以及任何需要将固定输入与大量、可变的目标集进行评估的工作流。
研究和法律团队使用 Kimi K2-Thinking 处理需要长时间内部推理的多步分析问题。该模型每次会话支持多达 200 到 300 次连续的工具调用,在“推理-调用-推理”的循环中迭代,步骤之间无需人工提示。在 Atlas Cloud 上,其定价为每百万输入 token 0.6 美元,并与 Kimi 系列的其他产品共享 262K 的上下文窗口。
学术和内容团队使用 Kimi K2.6 将源文档转化为完整的研究成果。在一次演示运行中,K2.6 在单次会话内将一篇天体物理学论文转换成了一篇40页的研究论文、一个包含超过20,000个条目的结构化数据集以及14张专业天文图表。这将从文献到成果的工作流周期从数周缩短至数小时。
增长和销售团队使用 Kimi K2.6 集群并行识别潜在客户并生成外拓素材。在一个运行示例中,它在一个目标城市识别出30家没有网站的零售店,并为每家店生成了一个落地页。这种模式同样适用于线索丰富、竞争格局梳理,以及任何在大批量列表上结合了发现与内容生成的任务。
产品和数据团队使用 Kimi K2.5 和 K2.6 的原生视觉能力,在同一次 API 调用中处理图像和视频输入以及文本。MoonViT 编码器无需外部预处理即可处理图表、屏幕截图、UI 界面原型和文档扫描件。这对于将视觉规范直接转化为代码,或从包含大量图像的文档中提取结构化数据的流水线非常有用。
Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.
Kimi K2.6 可扩展至300个子智能体,在单次运行中执行多达4000个协同步骤。Atlas Cloud 上的 Kimi K2.5 支持多达100个子智能体的集群执行。任务被动态分解为并行的、领域专用的子任务,以实现完全自主的输出。
Kimi K2-Thinking 采用深度思维链推理,每次会话最多可进行 200 到 300 次连续的工具调用。该模型进行推理、调用工具、解释结果、调用另一个工具,并在无需人工输入的情况下继续这一循环。它适用于多步逻辑推演、复杂数学问题以及通过扩展内部推理来提高准确性的问题。
是的。Kimi K2.5 和 K2.6 包含了 MoonViT,这是一个拥有 4 亿参数的视觉编码器,能够原生处理图像和视频。您可以在 API 调用中直接将图像或视频输入与文本一起传递,无需进行外部预处理。这支持视觉分析、文档理解以及图像到代码生成的工作流。
是的。Kimi K2.6 基于修改版的 MIT 许可证发布,允许商业使用。开源权重可在 HuggingFace 上获取,用于自托管部署。对于倾向于托管访问而无需承担基础设施开销的团队,Atlas Cloud 也通过 API 提供 K2.6。
Kimi K2.6在SWE-Bench Verified上得分为80.2%,在使用工具的Humanity's Last Exam中得分为54.0%,在这两项基准测试中均优于GPT-5.5。它在BrowseComp上也以83.2%的成绩领先,高于GPT-5.4。取得这些结果的每百万token成本比GPT-5.5低约80%。
Kimi K2.5 在 Atlas Cloud 上的定价为每百万输入 tokens 0.49 美元,每百万输出 tokens 2.5 美元。Kimi K2-Thinking 和 K2-Instruct-0905 的运行价格为每百万输入 tokens 0.6 美元,输出费率相同。请查看 Atlas Cloud 的 Kimi K2.6 模型页面以获取其当前具体的定价信息。
指南、教程与产品动态,助你充分发挥 Atlas Cloud 的价值。
Join the Discord community for the latest model updates, prompts, and support.