
Atlas Cloud 通过 DeepSeek API 托管完整的 DeepSeek 系列:V3.2、V4 和 R1。模型支持 128K 到 1M token 上下文,全部开源且按需付费。
在 Atlas Cloud 上,依托顶尖的大语言模型,以极速且实惠的方式驱动对话、推理与智能体的规模化应用。
对比 DeepSeek 全部模型的标准价、平台价与折扣。
| 模型 | 标准价 (USD) | 平台价 (USD) | 折扣 | |
|---|---|---|---|---|
| DeepSeek V4 Pro | $1.74/$3.45每 100 万 tokens1048.6K 上下文 | $1.68/$3.38M 输入/输出每 100 万 tokens1048.6K 上下文 | — | 查看 |
| DeepSeek V4 Flash | $0.14/$0.28每 100 万 tokens1048.6K 上下文 | $0.14/$0.28M 输入/输出每 100 万 tokens1048.6K 上下文 | — | 查看 |
| DeepSeek V3.2 | $0.287/$0.431每 100 万 tokens163.8K 上下文 | $0.26/$0.38M 输入/输出每 100 万 tokens163.8K 上下文 | — | 查看 |
| DeepSeek V3.2 Exp | $0.287/$0.43每 100 万 tokens163.8K 上下文 | $0.27/$0.41M 输入/输出每 100 万 tokens163.8K 上下文 | — | 查看 |
| DeepSeek-V3-0324 | $0.287/$1.147每 100 万 tokens131.1K 上下文 | $0.216/$0.88M 输入/输出每 100 万 tokens131.1K 上下文 | — | 查看 |
| DeepSeek-R1-0528 | $0.574/$2.294每 100 万 tokens131.1K 上下文 | $0.55/$2.15M 输入/输出每 100 万 tokens131.1K 上下文 | — | 查看 |
在 Atlas Playground 中即刻探索并体验 300+ 生产可用模型,一键开始定制。
DeepSeek的开源模型涵盖了从高性价比、高吞吐量任务到具备1M上下文的前沿级智能体编程的完整范围。团队可根据上下文需求和任务复杂度在V3.2、V4 Flash和V4 Pro之间进行选择。
工程团队使用 DeepSeek V4 Pro 构建代码智能体,这些智能体能够自主解决真实的 GitHub 问题,包括阅读问题描述、追踪跨文件依赖、编写修复代码以及运行测试。V4 Pro 在 SWE-Bench Verified 上得分 80.6%,与 Claude Opus 4.6 仅相差 0.2 分,并且原生集成了 Claude Code、OpenCode 和 OpenClaw 智能体框架。在 Atlas Cloud 上从闭源模型切换到 DeepSeek V4,只需在现有的 SDK 设置中更改基础 URL。
开发团队利用 DeepSeek V4 的 1M token 上下文窗口,在单次 API 调用中加载整个代码库,以进行跨文件分析、依赖追踪和架构审查。V4 在完整上下文长度的多查询“大海捞针”测试中实现了 97% 的准确率,这意味着能够可靠地检索到嵌入在一百万个 token 中任何位置的特定信息。在完整的 1M 上下文中,针对相同任务,V4 Pro 所需的推理算力仅为 V3.2 的 27%,KV 缓存仅为 10%。
有合规性或数据隐私要求的企业团队利用 DeepSeek 的 MIT 许可证,在其自有基础设施上自托管 V4 Flash 或 V3.2。这是 GPT-5 和 Claude Opus 等闭源模型无法提供的选项,并且它消除了受监管行业对 API 的依赖。拥有 2840 亿参数和 130 亿活跃参数的 V4 Flash 是实用的自托管目标;而 V4 Pro 则需要一个集群。
从 GPT-5 或 Claude Opus 迁移的团队使用 DeepSeek V3.2 作为无缝替换方案,通过 Atlas Cloud 上兼容 OpenAI 的 endpoint 进行调用。V3.2 的定价约为每百万输入 token 0.27 美元,同时在大多数推理 benchmark 中达到了 GPT-5 级别的性能。只需更改单个基础 URL,相同的 SDK 代码即可路由至 DeepSeek,从而降低了迁移风险。
DeepSeek V4 是当前一代的旗舰产品,于2026年4月24日发布,在单一模型中涵盖了通用和推理工作流。R1 曾经是一个独立的推理模型,但 V4 的思考模式取代了它,并将相同的思维链能力直接内置其中。旧版的 deepseek-reasoner 别名将于2026年7月24日停用,因此新的集成应使用开启了思考模式的 V4 Pro。
Engram Memory 是 DeepSeek V4 中的一个外部知识检索系统,其灵感来源于人类大脑海马体存储和检索信息的方式。它使用局部敏感哈希以 O(1) 的速度检索相关知识,而不是迫使模型将所有事实存储在其权重中。这促使 V4 的多查询“大海捞针”准确率从 V3.2 的 84.2% 大幅跃升至 97.0%。
是的。DeepSeek V3.2、V4 Flash 和 V4 Pro 均在 MIT 许可证下发布,允许商业使用、修改和分发。在具备相应能力的硬件上自行托管 V4 Flash 是切实可行的。鉴于 V4 Pro 拥有 1.6 万亿参数规模,它需要集群支持,因此大多数团队选择在 Atlas Cloud 上使用 API 访问。
V4 Pro 是一款拥有 1.6 万亿参数的 MoE 模型,具备 490 亿激活参数,专为复杂推理、编程和智能体任务而构建。V4 Flash 是一款拥有 2840 亿参数的模型,具备 130 亿激活参数,针对要求较低的任务在速度和成本效益上进行了优化。两者都共享 1M token 的上下文窗口和 Engram Memory 架构。
DeepSeek V4 的 Pro 和 Flash 版本均原生支持 100 万 token 上下文窗口,每次响应最高支持 393K token 输出。DeepSeek V3.2 具有 128K 的上下文窗口。V4 的 1M 上下文使其能够在单次调用中实用地执行完整的代码库分析、大型文档处理以及扩展的代理会话。
是的。DeepSeek V3.2 依然在 Atlas Cloud 上提供,价格约为每百万输入 token 0.27 美元。它是一个拥有 6850 亿参数的 MoE 模型,其中激活参数为 370 亿,上下文窗口为 128K,基于 MIT 许可证发布。对于不需要 V4 的 1M 上下文或 Engram Memory 的任务来说,它是一个高性价比的选择。
DeepSeek V4 Pro 在 SWE-Bench 上解决了超过 80.9% 的实际编程问题,对标 GPT-5 级别的性能。在 Needle in a Haystack 测试中,多查询长上下文准确率从 V3.2 的 84.2% 提升至 97.0%。此外,Atlas Cloud 上的 V3.2 Speciale 变体在 IMO 2025 和 IOI 2025 竞赛数学中取得了金牌级别的表现。
指南、教程与产品动态,助你充分发挥 Atlas Cloud 的价值。
Join the Discord community for the latest model updates, prompts, and support.