DeepSeek AI Models on AtlasCloud

Atlas Cloud 透過 DeepSeek API 託管完整的 DeepSeek 系列:V3.2、V4 和 R1。模型支援 128K 到 1M token 上下文,全部開源且按需付費。

Large Language Models by DeepSeek

在 Atlas Cloud 上,藉助領先的大型語言模型,以高速且實惠的方式驅動對話、推理與智慧代理的大規模應用。

查看全部模型

DeepSeek 模型 API 价格明细

对比 DeepSeek 全部模型的标准价、平台价与折扣。

模型标准价 (USD)平台价 (USD)折扣
DeepSeek V4 Pro
$1.74/$3.45每 100 万 tokens1048.6K 上下文
$1.68/$3.38M 输入/输出每 100 万 tokens1048.6K 上下文
查看
DeepSeek V4 Flash
$0.14/$0.28每 100 万 tokens1048.6K 上下文
$0.14/$0.28M 输入/输出每 100 万 tokens1048.6K 上下文
查看
DeepSeek V3.2
$0.287/$0.431每 100 万 tokens163.8K 上下文
$0.26/$0.38M 输入/输出每 100 万 tokens163.8K 上下文
查看
DeepSeek V3.2 Exp
$0.287/$0.43每 100 万 tokens163.8K 上下文
$0.27/$0.41M 输入/输出每 100 万 tokens163.8K 上下文
查看
DeepSeek-V3-0324
$0.287/$1.147每 100 万 tokens131.1K 上下文
$0.216/$0.88M 输入/输出每 100 万 tokens131.1K 上下文
查看
DeepSeek-R1-0528
$0.574/$2.294每 100 万 tokens131.1K 上下文
$0.55/$2.15M 输入/输出每 100 万 tokens131.1K 上下文
查看

探索其他厂商的模型

在 Atlas Playground 中即刻探索并体验 300+ 生产可用模型,一键开始定制。

您可以在 Atlas Cloud 上建構的 DeepSeek API 應用場景

DeepSeek的開源模型涵蓋了從高性價比、高吞吐量任務到具備1M上下文的前沿級智能體編程的完整範圍。團隊可根據上下文需求和任務複雜度在V3.2、V4 Flash和V4 Pro之間進行選擇。

自主 GitHub Issue 解決

工程團隊使用 DeepSeek V4 Pro 建立程式碼代理,這些代理能夠自主解決真實的 GitHub 問題,包括閱讀問題描述、追蹤跨檔案相依性、撰寫修復程式以及執行測試。V4 Pro 在 SWE-Bench Verified 上得分 80.6%,與 Claude Opus 4.6 僅相差 0.2 分,並且原生整合了 Claude Code、OpenCode 和 OpenClaw 代理框架。在 Atlas Cloud 上從閉源模型切換到 DeepSeek V4,只需在現有的 SDK 設定中變更基礎 URL。

基於 1M 上下文的全程式碼庫分析

開發團隊利用 DeepSeek V4 的 1M token 上下文視窗,在單次 API 呼叫中載入整個程式碼庫,以進行跨檔案分析、相依性追蹤和架構審查。V4 在完整上下文長度的多查詢「大海撈針」測試中實現了 97% 的準確率,這意味著能夠可靠地檢索到嵌入在一百萬個 token 中任何位置的特定資訊。在完整的 1M 上下文中,針對相同任務,V4 Pro 所需的推理算力僅為 V3.2 的 27%,KV 快取僅為 10%。

針對資料敏感型工作負載的自託管部署

有合規性或資料隱私要求的企業團隊利用 DeepSeek 的 MIT 授權,在其自有基礎設施上自託管 V4 Flash 或 V3.2。這是 GPT-5 和 Claude Opus 等閉源模型無法提供的選項,並且它消除了受監管行業對 API 的依賴。擁有 2840 億參數和 130 億活躍參數的 V4 Flash 是實用的自託管目標;而 V4 Pro 則需要一個叢集。

具成本效益的閉源模型替代方案

從 GPT-5 或 Claude Opus 遷移的團隊使用 DeepSeek V3.2 作為無縫替換方案,透過 Atlas Cloud 上相容 OpenAI 的 endpoint 進行呼叫。V3.2 的定價約為每百萬輸入 token 0.27 美元,同時在大多數推理 benchmark 中達到了 GPT-5 級別的效能。只需更改單一基礎 URL,相同的 SDK 程式碼即可路由至 DeepSeek,從而降低了遷移風險。

Atlas Cloud AI

聯繫銷售

Frequently Asked Questions about DeepSeek AI Models

DeepSeek V4 是當前一代的旗艦產品,於2026年4月24日發布,在單一模型中涵蓋了通用和推理工作流程。R1 曾經是一個獨立的推理模型,但 V4 的思考模式取代了它,並將相同的思維鏈能力直接內建其中。舊版的 deepseek-reasoner 別名將於2026年7月24日停用,因此新的整合應使用開啟了思考模式的 V4 Pro。

Engram Memory 是 DeepSeek V4 中的一個外部知識檢索系統,其靈感來源於人類大腦海馬迴儲存和檢索資訊的方式。它使用局部敏感雜湊以 O(1) 的速度檢索相關知識,而不是迫使模型將所有事實儲存在其權重中。這促使 V4 的多查詢「大海撈針」準確率從 V3.2 的 84.2% 大幅躍升至 97.0%。

是的。DeepSeek V3.2、V4 Flash 和 V4 Pro 均在 MIT 授權條款下發布,允許商業使用、修改與散佈。在具備相應效能的硬體上自行代管 V4 Flash 是切實可行的。鑑於 V4 Pro 擁有 1.6 兆參數規模,它需要叢集支援,因此大多數團隊選擇在 Atlas Cloud 上使用 API 存取。

V4 Pro 是一款擁有 1.6 兆參數的 MoE 模型,具備 490 億激活參數,專為複雜推理、程式設計和智能體任務而建構。V4 Flash 是一款擁有 2840 億參數的模型,具備 130 億激活參數,針對要求較低的任務在速度和成本效益上進行了最佳化。兩者皆共享 1M token 的上下文視窗和 Engram Memory 架構。

DeepSeek V4 的 Pro 與 Flash 版本均原生支援 100 萬 token 上下文視窗,每次請求最高支援 393K token 輸出。DeepSeek V3.2 具有 128K 的上下文視窗。V4 的 1M 上下文使其能夠在單次呼叫中實用地執行完整的程式碼庫分析、大型文件處理以及擴展的代理會話。

是的。DeepSeek V3.2 依然在 Atlas Cloud 上提供,價格約為每百萬輸入 token 0.27 美元。它是一個擁有 6850 億參數的 MoE 模型,其中活躍參數為 370 億,上下文窗口為 128K,基於 MIT 授權條款發布。對於不需要 V4 的 1M 上下文或 Engram Memory 的任務來說,它是一個高性價比的選擇。

DeepSeek V4 Pro 在 SWE-Bench 上解決了超過 80.9% 的實際程式設計問題,對標 GPT-5 等級的效能。在 Needle in a Haystack 測試中,多查詢長上下文準確率從 V3.2 的 84.2% 提升至 97.0%。此外,Atlas Cloud 上的 V3.2 Speciale 變體在 IMO 2025 和 IOI 2025 競賽數學中取得了金牌等級的表現。

探索更多系列

Seedance 2.0 Models

Seedance 2.0(by Bytedance) is a multimodal video generation model that redefines "controllable creation," moving beyond the limitations of text or start/end frames. It supports quad-modal inputs—text, image, video, and audio—and introduces an industry-leading "Universal Reference" system. By precisely replicating the composition, camera movement, and character actions from reference assets, Seedance 2.0 solves critical issues with character consistency and physical coherence, empowering creators to act as true "directors" with deep control over their output.

檢視系列

Grok-Imagine Models

Grok Imagine Image Quality is xAI's latest AI image generation model, delivering studio-grade visuals with up to 2K resolution and razor-sharp detail. It offers best-in-class text rendering across multiple languages, photorealistic outputs with natural lighting, rich textures, and believable physics, plus tighter prompt following and image editing with reference inputs for precise creative control. Ideal for hero images, ad creatives, product renders, and brand-grade visuals.

檢視系列

Gemini Omni

Gemini Omni (by Google DeepMind) is a video generation and editing model launched on May 20, 2026 at Google I/O that redefines the standard for "reasoning-driven creation," built specifically to solve the core challenge of AI video: making output that actually understands what you mean, not just what you type. It fuses Gemini's reasoning engine with generative capability, accepting any mix of images, text, video, and audio to produce consistent, knowledge-grounded output. Unlike models that start from scratch each time, Omni lets you edit through natural conversation — swapping objects, rewriting scenes, shifting styles — while keeping physics, characters, and continuity intact across every turn.

檢視系列

GPT Image 2 Models

GPT Image 2 is a state-of-the-art multimodal foundation model engineered for exceptional text-to-image generation with unprecedented photorealism and creative versatility. Developed by OpenAI as the evolution of the DALL-E lineage, it transforms detailed natural language descriptions into hyper-realistic imagery at up to 4K resolution. With proprietary "Neural Rendering Engine" technology for precise visual control, GPT Image 2 delivers studio-quality results with accurate anatomy, lighting, and composition—making it the premier AI tool for professional creators, enterprises, and developers demanding production-ready visual assets.

檢視系列

Google Models on Atlas Cloud | Gemini, Nano Bananas & Veo

Google最強大的創意模型現已在Atlas Cloud上全面可用。Veo 3.1提供電影等級的影片生成,Nano Banana 2支援高保真圖像建立,而Gemini為每個工作流程帶來多模態智慧。透過單一API key即可存取完整的Google模型套件,提供Day-0可用性和隨用隨付(pay-as-you-go)定價。

檢視系列

ByteDance Models on Atlas Cloud | Seedance & Seedream

從電影級影片生成到高保真影像建立,ByteDance 最強大的模型現已在 Atlas Cloud 上線。以最低的推論定價和零基礎設施開銷,大規模執行 Seedance 和 Seedream。

檢視系列

Alibaba Models on Atlas Cloud | Wan & Qwen

Atlas Cloud 將 Alibaba 的全系模型陣容整合至同一個 API 中:Qwen 適用於語言和圖像任務,Wan 適用於高達 1080p 的影片生成。所有模型均採用按需付費模式,無需訂閱。您可以使用現有的 OpenAI 兼容客戶端,透過單一的 base URL 存取 Alibaba API。

檢視系列

MAI Image 2.5 Models

MAI-Image-2.5 是 Microsoft 最新推出的逼真圖像生成與編輯模型系列,專為商業設計、產品攝影和品牌級內容創作而打造。提供用於文字生成圖像和圖像編輯的標準版與 Flash 版本,以極具競爭力的價格(每張圖像起價 0.03 美元)提供同類最佳的 Arena ELO 得分。憑藉精準的文字渲染、手術刀級的編輯能力以及自然的人像生成,MAI-Image-2.5 專為需要生產級品質視覺效果且無需承擔後製處理成本的團隊而設計。

檢視系列

Wan2.7 Models

Launching this March, Wan2.7 is the latest powerhouse in the Qwen ecosystem, delivering a massive upgrade in visual fidelity, audio synchronization, and motion consistency over version 2.6. This all-in-one AI video generator supports advanced features like first-and-last frame control, 3x3 grid synthesis, and instruction-based video editing. Outperforming competitors like Jimeng, Wan2.7 offers superior flexibility with support for real-person image inputs, up to five video references, and 1080P high-definition outputs spanning 2 to 15 seconds, making it the premier choice for professional digital storytelling and high-end content marketing.

檢視系列

Nano Banana2 Models

Nano Banana 2 (by Google), is a generative image model that perfectly balances lightning-fast rendering with exceptional visual quality. With an improved price-performance ratio, it achieves breakthrough micro-detail depiction, accurate native text rendering, and complex physical structure reconstruction. It serves as a highly efficient, commercial-grade visual production tool for developers, marketing teams, and content creators.

檢視系列

Hunyuan 3D Generation Models

Hunyuan3D is a state-of-the-art 3D generative foundation model from Tencent that turns text prompts and single images into high-quality, textured 3D meshes. Built on a two-stage pipeline—Hunyuan3D-DiT for shape generation via flow-matching diffusion and Hunyuan3D-Paint for multi-view texture synthesis—it produces clean geometry with full PBR materials ready for game engines, AR/VR, 3D printing, and DCC tools. Available in Pro (up to 1.5M faces, 4K PBR textures) and Rapid (2–3 minute lightweight generation) tiers, with both Text-to-3D and Image-to-3D entry points, Hunyuan3D is the premier AI 3D toolkit for game developers, e-commerce teams, and 3D content studios. Generations start at $0.02 each.

檢視系列

Midjourney Models

Midjourney is a proprietary AI image and video generation platform developed by Midjourney, Inc. (San Francisco). Founded in 2021 by David Holz, it has become the aesthetic gold standard in generative AI — transforming text prompts into cinematic, painterly visuals at native 2K resolution. The latest V8.1 architecture, rebuilt from scratch on GPU-native PyTorch, delivers 4–5× faster generation, true 2048×2048 output without upscaling artifacts, and a signature visual style that remains unmatched by competitors. With the addition of Video V1, Midjourney extends its aesthetic into motion — animating still images into atmospheric 5-second cinematic clips. From brand campaigns to film pre-visualization to game concept art, Midjourney is the premier AI creative tool for professionals who demand both speed and artistry.

檢視系列

推薦文章

指南、教學與產品動態,助你充分發揮 Atlas Cloud 的價值。

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.