Moonshot AI Models on AtlasCloud | Kimi

Atlas Cloud 通过 MoonshotAI API 提供完整的 Kimi 系列，从用于深度推理的 K2-Thinking 到用于智能体编程的 K2.6。全部按量付费，262K 上下文。

Large Language Models by Moonshot AI

在 Atlas Cloud 上，依托顶尖的大语言模型，以极速且实惠的方式驱动对话、推理与智能体的规模化应用。

查看全部模型

LLM

Kimi

Kimi API 是 Moonshot AI 的开放权重 K2 系列，涵盖原生多模态的 K2.5 以及专为代码场景优化的 K2.7 Code。由于视觉能力内置于模型中，你可以将截图、UI mockup 和短视频转化为可运行的前端代码，协调最多 100 个并行 sub-agent，并在 256K token 上下文中进行推理。Atlas Cloud 通过一个统一 endpoint 提供整个系列，并采用透明的 pay-as-you-go 定价。立即开始构建。

4 个模型探索 Kimi

Moonshot AI 模型 API 价格明细

对比 Moonshot AI 全部模型的标准价、平台价与折扣。

模型	标准价 (USD)	平台价 (USD)	折扣
Kimi K3	$3/$15每 100 万 tokens1048.6K 上下文	$3/$15M 输入/输出每 100 万 tokens1048.6K 上下文	—	查看
Kimi K2.7 Code	$0.95/$4每 100 万 tokens262.1K 上下文	$0.95/$4M 输入/输出每 100 万 tokens262.1K 上下文	—	查看
Kimi K2.6	$0.95/$4每 100 万 tokens262.1K 上下文	$0.95/$4M 输入/输出每 100 万 tokens262.1K 上下文	—	查看
Kimi K2.5	$0.6/$3每 100 万 tokens262.1K 上下文	$0.49/$2.5M 输入/输出每 100 万 tokens262.1K 上下文	—	查看

探索其他厂商的模型

在 Atlas Playground 中即刻探索并体验 400+ 生产可用模型，一键开始定制。

xAI

您可以在 Atlas Cloud 上构建的 Moonshot AI API 应用案例

Kimi 的智能体集群和长周期执行能力，使团队能够在单次自动化会话中完成原本需要数天人力才能完成的任务。团队将 M-series 与 K2-Thinking 结合使用，从而涵盖从自主代码更改到大规模多文档研究的各项工作。

遗留代码库现代化

工程团队使用 Kimi K2.6 运行长周期编码智能体，在长达数小时的会话中自主重构生产环境的代码库。在一个有记录的案例中，K2.6 耗时13个小时重写了一个有着8年历史的金融撮合引擎，在各次提交之间无需人工干预的情况下，将吞吐量提升了185%。Atlas Cloud 的按需付费定价模式使得运行这些长时间的智能体任务变得切实可行，且无需预先承诺容量。

并行文档批量处理

运营团队使用 Kimi K2.6 的 300 智能体集群并行处理大批量文档。单次编排运行可将一份简历与 100 个岗位角色进行匹配，并输出 100 份完全定制的简历。相同的模式适用于合同审查、合规检查，以及任何需要将固定输入与大量、可变的目标集进行评估的工作流。

面向复杂分析的深度推理

研究和法律团队使用 Kimi K2-Thinking 处理需要长时间内部推理的多步分析问题。该模型每次会话支持多达 200 到 300 次连续的工具调用，在“推理-调用-推理”的循环中迭代，步骤之间无需人工提示。在 Atlas Cloud 上，其定价为每百万输入 token 0.6 美元，并与 Kimi 系列的其他产品共享 262K 的上下文窗口。

自动化研究论文生成

学术和内容团队使用 Kimi K2.6 将源文档转化为完整的研究成果。在一次演示运行中，K2.6 在单次会话内将一篇天体物理学论文转换成了一篇40页的研究论文、一个包含超过20,000个条目的结构化数据集以及14张专业天文图表。这将从文献到成果的工作流周期从数周缩短至数小时。

规模化潜在客户挖掘

增长和销售团队使用 Kimi K2.6 集群并行识别潜在客户并生成外拓素材。在一个运行示例中，它在一个目标城市识别出30家没有网站的零售店，并为每家店生成了一个落地页。这种模式同样适用于线索丰富、竞争格局梳理，以及任何在大批量列表上结合了发现与内容生成的任务。

视觉文档与代码分析

产品和数据团队使用 Kimi K2.5 和 K2.6 的原生视觉能力，在同一次 API 调用中处理图像和视频输入以及文本。MoonViT 编码器无需外部预处理即可处理图表、屏幕截图、UI 界面原型和文档扫描件。这对于将视觉规范直接转化为代码，或从包含大量图像的文档中提取结构化数据的流水线非常有用。

用 Atlas Cloud AI，让企业愿景照进现实。

联系销售

关于 Moonshot AI 模型的常见问题解答

Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.

Kimi K2.6 可扩展至300个子智能体，在单次运行中执行多达4000个协同步骤。Atlas Cloud 上的 Kimi K2.5 支持多达100个子智能体的集群执行。任务被动态分解为并行的、领域专用的子任务，以实现完全自主的输出。

Kimi K2-Thinking 采用深度思维链推理，每次会话最多可进行 200 到 300 次连续的工具调用。该模型进行推理、调用工具、解释结果、调用另一个工具，并在无需人工输入的情况下继续这一循环。它适用于多步逻辑推演、复杂数学问题以及通过扩展内部推理来提高准确性的问题。

是的。Kimi K2.5 和 K2.6 包含了 MoonViT，这是一个拥有 4 亿参数的视觉编码器，能够原生处理图像和视频。您可以在 API 调用中直接将图像或视频输入与文本一起传递，无需进行外部预处理。这支持视觉分析、文档理解以及图像到代码生成的工作流。

是的。Kimi K2.6 基于修改版的 MIT 许可证发布，允许商业使用。开源权重可在 HuggingFace 上获取，用于自托管部署。对于倾向于托管访问而无需承担基础设施开销的团队，Atlas Cloud 也通过 API 提供 K2.6。

Kimi K2.6在SWE-Bench Verified上得分为80.2%，在使用工具的Humanity's Last Exam中得分为54.0%，在这两项基准测试中均优于GPT-5.5。它在BrowseComp上也以83.2%的成绩领先，高于GPT-5.4。取得这些结果的每百万token成本比GPT-5.5低约80%。

Kimi K2.5 在 Atlas Cloud 上的定价为每百万输入 tokens 0.49 美元，每百万输出 tokens 2.5 美元。Kimi K2-Thinking 和 K2-Instruct-0905 的运行价格为每百万输入 tokens 0.6 美元，输出费率相同。请查看 Atlas Cloud 的 Kimi K2.6 模型页面以获取其当前具体的定价信息。

探索更多系列

Seedance 2.0

Seedance 2.0 API 为您提供 ByteDance 多模态视频模型的生产级访问权限——支持四模态输入（文本、图像、视频、音频），以及行业领先的“Universal Reference”（通用参考）系统，可在不同镜头间锁定构图、运镜和角色动作。只需一次 API 调用即可集成导演级控制，固定费率为 $0.09/秒，即时获取密钥，无需排队——由企业级正常运行时间和合规性提供保障。Seedance 2.0 原生 4K 现已上线！

查看系列

Grok Imagine

Grok Imagine API 为开发者提供 xAI 的图像、视频和音频生成一站式套件。它可以生成分辨率高达 2K 且支持多语言文本渲染的图像，以及长达 15 秒且带有原生同步音频和基于参考图像编辑功能的视频。在 Atlas Cloud 上，只需一个密钥即可运行每个 Grok Imagine 模式，因此您可以在图像、视频和音频之间无缝切换，无需单独设置，每张图像 0.02 美元起，每秒 0.05 美元起。

查看系列

Gemini Omni Flash

Gemini Omni API 将 Google DeepMind 在 Google I/O 2026 上发布的多模态视频生成与编辑模型带入你的技术栈。Gemini Omni 将 Gemini 的推理引擎与生成式媒体融合，可接受文本、图像、视频和音频的任意组合输入，生成一致且以知识为依据的输出。通过自然对话不断打磨结果：替换物体、重写场景、切换风格，同时保持物理规律、角色形象和画面连贯性不变。Atlas Cloud 通过统一的 API 提供完整的 Gemini Omni Flash 系列——文生视频、支持最多 7 张参考图的图生视频，以及参考图生视频——按秒计费、价格透明，低至 $0.112 起，且无需订阅。立即开始构建。

查看系列

GPT Image 2

GPT Image 2 API 为开发者提供了访问 OpenAI 最新图像模型的途径，它是 GPT Image 1.5 的继任者。该模型可生成和编辑图像，能够在拉丁和 CJK 文字上实现准确的文本渲染，并在海报、样机和信息图表方面具备强大的排版能力。在 Atlas Cloud 上，您可以通过一个统一的 API 与 300 多个模型一起访问它，并享受免费额度、99.99% 的正常运行时间，且无需 OpenAI 组织验证。

查看系列

Google

Google最强大的创意模型现已在Atlas Cloud上全面可用。Veo 3.1提供电影级别的视频生成，Nano Banana 2支持高保真图像创建，而Gemini为每个工作流带来多模态智能。通过单一API key即可访问完整的Google模型套件，提供Day-0可用性和按需付费（pay-as-you-go）定价。

查看系列

Seedance 2.0 Mini

Seedance 2.0 Mini 将 ByteDance 的多模态视频生成技术引入到对速度和成本要求极高的工作流中。它以更轻量的占用空间提供 Seedance 2.0 的核心能力——更快的生成速度、更低的单条视频成本，并且使用您现有的同款 API 集成。对于运行高吞吐量流水线或进行大规模原型设计的团队来说，Mini 是最实用的默认选择。

查看系列

ByteDance

从电影级视频生成到高保真图像创建，ByteDance 最强大的模型现已在 Atlas Cloud 上线。以最低的推理定价和零基础设施开销，大规模运行 Seedance 和 Seedream。

查看系列

Alibaba

Atlas Cloud 将 Alibaba 的全系模型阵容整合至同一个 API 中：Qwen 用于语言和图像任务，Wan 用于高达 1080p 的视频生成。所有模型均采用按需付费模式，无需订阅。您可以使用现有的 OpenAI 兼容客户端，通过单一的 base URL 访问 Alibaba API。

查看系列

OpenAI

Atlas Cloud 为您提供访问完整 OpenAI API 产品线的权限，从用于图像生成的 GPT Image 2 到用于视频的 Sora 2。每个模型均采用按需付费模式，无月度消费限制。使用兼容 OpenAI 的 API，只需简单替换基础 URL 即可轻松接入。

查看系列

xAI

在 Atlas Cloud 上使用 xAI API 构建完整的图像和视频处理工作流。以 2K 分辨率生成、使用参考图像进行编辑，并将图像动画化为音画同步的视频片段。

查看系列

Kwaivgi

Kwaivgi API 价格低于标准定价 15%。Atlas Cloud 提供对最新 Kling 版本的零日（Day-0）访问权限，采用按需付费定价且无席位限制。一个账户，一个密钥，畅享从标准版到大师版的所有 Kling 模型。

查看系列

Seedream 5.0 Pro

Seedream 5.0 Pro API 为开发者在 Atlas Cloud 上提供了字节跳动的可控图像编辑模型。它通过锚点和坐标精确定位编辑，将图像分离为可编辑图层，融合多个参考，并精准匹配颜色和材质，支持 2K 和 3K 分辨率的多语言文本。在 Atlas Cloud 上，您只需一个密钥即可访问！

查看系列